Você está na página 1de 9

Anlise de redes de colaborao cientfica: um estudo de

mtricas e ferramentas
Ana Carolina Gama e Silva Assaife, Fernanda Bruno dos Santos

Instituto de Informtica Universidade Federal do Rio de Janeiro (UFRJ)


Rio de Janeiro RJ Brasil
{anacarolina.assaife,februno}@gmail.com
Resumo. A Internet um rico repositrio de informaes e uma grande fonte
de dados sobre indivduos. No contexto cientfico, as redes de colaborao
tem sido foco de diversas anlises em busca de novas informaes. Existe uma
gama de ferramentas de anlise de redes sociais disponveis que realizam
visualizao e clculo de mtricas que auxiliam o pesquisador no melhor
entendimento da rede em questo. Porm, a grande variedade de ferramentas
e mtricas acaba sendo um problema na escolha da mais apropriada,
interferindo no ciclo analtico do pesquisador. Com um levantamento preciso
e cuidadoso, possvel selecionar a ferramenta mais apropriada para o tipo
de anlise a ser feita. Esse trabalho apresenta ferramentas e mtricas para
anlises de rede aplicadas em uma rede de colaborao cientfica.

1.Introduo
1.1. Motivao
A idia de redes sociais e mtodos para analis-las tm atrado bastante ateno nos
ltimos anos. Pesquisadores perceberam que a perspectiva de rede permite responder
perguntas sobre seus usurios. Com isso, surgiu a rea de anlise de redes sociais, uma
rea de pesquisa recente que cresceu devido a capacidade de computao sobre redes de
milhes de ns que anteriormente era impossvel. E assim uma nova fronteira se abriu,
fortemente influenciada pelo universo de negcio e acadmico.

1.2. Problema
Com o crescente nmero de redes sociais e de suas dimenses se torna de extrema
importncia conhecer, analisar e traar padres que permitiro a definio de perfis.
Alm disso, interessante avaliar relacionamentos entre estruturas como grau de
conectividade entre usurios, indicando a formao de grupos fortemente conectados,
por exemplo, e um possvel fluxo intenso de informaes trocadas entre eles. Ou seja,
no processo de conhecimento e mapeamento das redes sociais, a avaliao cuidadosa de
suas estruturas define um instrumento valioso de apoio.
Para que as anlises sejam possveis necessrio fazer uso de uma ferramenta
capaz de processar grandes redes e, assim, obter informaes sobre a rede. Porm, h
pouco conhecimento por parte dos pesquisadores sobre ferramentas livres, gratuitas e
confiveis que realizam esse tipo de anlise.
1.3. Objetivo
Um modo de solucionar essas questes atravs do clculo de mtricas, ou seja,
estatsticas sobre a rede social em questo. Pode-se, por essa abordagem, interpretar a
rede social como um grafo em que ns so seus participantes/usurios e arestas seus
relacionamentos e atravs do grafo formado, calcular medidas.
O objetivo deste trabalho realizar um levantamento, experimentao e anlise
de um conjunto de ferramentas livre e de fcil utilizao fazendo uso de mtricas
encontradas na literatura. Usando bases de dados do Lattes (LATTES, 2010), foi
possvel construir redes de colaborao entre pesquisadores que fazem parte do grupo
de pesquisa GRECO da Universidade Federal do Rio de Janeiro. Nessas redes dois
pesquisadores so considerados conectados se eles tm co-autor de um ou mais
documentos juntos. A rede de colaborao servir de entrada para as ferramentas e as
mtricas sero calculadas sobre elas.
Este artigo est dividido em seis sees. A primeira trata da introduo do
trabalho apontando seu objetivo. A segunda mostra uma reviso de literatura sobre
Redes Sociais e Redes de Colaborao. A terceira aponta mtricas levantadas na
literatura juntamente com seus significados. A quarta seo indica as ferramentas livres
e suas caractersticas, a quinta mostra o experimento e ltima traz as concluses finais
sobre o trabalho.

2. Redes Sociais
As redes e os grafos so eficientes na representao de elementos e relacionamentos
presentes entre esses elementos. Para isso, so usados os vrtices para ilustrar os
elementos e as arestas para ilustrar os relacionamentos encontrados na rede. Esse
trabalho focou nas redes sociais que so um dos tipos de rede onde os vrtices so, na
maioria das vezes, pessoas ou grupos de pessoas e as arestas so os relacionamentos
entre eles. Nas redes sociais, os relacionamentos entre pessoas podem ser do tipo
amigo de, conhece, filho de e outros. Os relacionamentos, nesse tipo de rede,
podem ser bidirecionais como em A conhece B e B conhece A e podem no ser
bidirecionais como em A gosta de B, mas B no gosta de A. Alm de ser aplicvel no
dia-a-dia e em diversas reas, as redes sociais permitem a anlise e destaque de
informaes como quais pessoas se relacionam, quantas vezes elas se relacionam,
intensidade dos relacionamentos e tambm informao sobre a durao de cada
relacionamento (MONCLAR et al., 2007).
No domnio cientfico, um exemplo de rede social a rede de colaborao
cientfica que vista como um grafo que os ns correspondem aos autores de uma
determinada publicao cientfica e as arestas correspondem ao relacionamento de co-
autoria. Nesse tipo de rede, as arestas podem conter pesos ou no. A adio de peso
representa o nmero de trabalhos conjuntos que os autores relacionados pela aresta
analisada participaram. Dessa forma, a intensidade dos relacionamentos presentes em
uma rede de colaborao cientfica medida pelo nmero de colaboraes entre um par
de autores. A presena do peso til representar, por exemplo, a afinidade e interesses
comuns entre dois autores da rede (SONNENWALD, 2007).
3. Mtricas para redes sociais
A anlise e estudo das redes sociais a fim de extrair informaes seja para uma
organizao ou para um pesquisador est contida numa rea de estudo chamada ARS -
ou Anlise de Redes Sociais ( SNA, Social Network Analysis) (DE NOOY et al, 2005).
O objetivo principal dessa tcnica detectar e extrair padres dos relacionamentos
sociais presentes em uma rede. Tal anlise tem se tornado importante nas organizaes e
nos seus processos de gesto da informao e do conhecimento, pois possvel traar
perfis, gerenciar o fluxo do conhecimento, analisar padres de relacionamento e, assim,
gerar vantagem competitiva.
Nessa seo so apresentadas algumas medidas que podem ser calculadas para
analisar uma rede no contexto geral. Nas prximas sees, com a descrio do
experimento e anlise da rede selecionada, as mtricas sero apresentadas aplicadas com
foco na rede de colaborao cientfica de um grupo de pesquisa selecionado.
A partir da medida nmero de componentes conexos possvel saber o grau de
conectividade da rede, j que quanto menor o nmero de componentes conexos, maior
a conectividade da rede. Para o clculo da medida, sabemos se um componente
conexo quando para qualquer par de vrtices da rede h caminho entre eles. A
quantidade de componentes conexos ser correspondente ao valor procurado (FREIRE,
2010).
J o Coeficiente de Clusterizao corresponde a medida que visa avaliar a
coeso da vizinhana, ou seja, o quanto meu vizinho vizinho entre si. Em outras
palavras, se A est conectado com os vrtices B e C por algum relacionamento, o
coeficiente de clusterizao a probabilidade de B e C se relacionar [2]. Para o clculo
dessa medida, levando em considerao que o n A est sendo analisado, o valor
encontrado ser a razo do nmero de arestas entre os vizinhos de A e o nmero
mximo de arestas que os vizinhos de A podem ter entre eles.
Outra medida a densidade que varia de 0 a 1 e uma verso normalizada do
nmero mdio de vizinhos de cada vrtice, eliminando loops, ou seja ns com ligaes
para eles mesmos e arestas duplicadas. Um grafo ter o valor 1 quando for clique e 0
quando for isolado.
Uma medida bastante comum no estudo de redes sociais a matriz de
adjacncias. Ela uma matriz quadrada com o mesmo nmero de linhas e colunas dos
atores na rede em questo sendo sua forma mais comum a matriz de adjacncias binria
em que se um n A se liga a um n B recebe valor 1 e caso contrrio 0.
A Eigenvector|Centrality mede a importncia de um n em uma rede. Ele atribui
pontuao relativa a todos os ns da rede com base no princpio de que as ligaes para
os ns de alta pontuao contribui mais para a pontuao do n em questo do que as
conexes iguais a ns com baixa pontuao. O PageRank do Google, por exemplo,
uma variante da medida de Eigenvector Centrality.
Vale ressaltar tambm que medidas de entendimento mais simples tambm so
teis na anlise como o nmero de vrtices e de relacionamentos e o dimetro que
corresponde a maior distncia entre dois ns de uma rede. Dentre elas, o grau de um n
uma medida importante na caracterizao da rede analisada. De clculo simples, o
grau de um n corresponde soma de seus relacionamentos.
4. Ferramentas para Redes Sociais
As redes sociais possuem dimenses que ultrapassam as capacidades de anlise manual,
necessitando de um suporte computacional para auxiliar no mapeamento, controle e
anlise de dados. Estes softwares possibilitam a construo e carregamento de redes e
possuem diversas mtricas disponveis para clculo. Sendo assim, foram selecionadas
trs ferramentas de cdigo aberto e gratuitas disponveis na Internet para levantamento
de caractersticas, mtricas e funes a fim de orientar pesquisadores em qual
ferramenta optar durante a realizao de uma pesquisa.
Conforme mencionado, a anlise visual das redes sociais ocorre por meio de
grafos, onde os ns representam entidades sociais e as setas representam os
relacionamentos existentes, permitindo uma visualizao da rede como um todo
(FREITAS, 2008). Uma caracterstica comum aos softwares a capacidade de
modificar a cor e forma dos ns das redes conforme a caractersticas especficas de cada
grupo, fornecendo uma anlise visual bastante interessante.

4.1. Gephi
Gephi uma ferramenta de cdigo aberto e gratuita que realiza explorao de rede
sendo capaz de importar, espacializar, filtrar, manipular e exportar todos os tipos de
redes. Em termos de anlise uma ferramenta potencial uma vez que diversos
algoritmos podem ser executados ao mesmo tempo, em espaos separados, sem
bloquear a interface. Em termos de facilidade de uso, o mdulo de texto pode mostrar os
nomes na janela de visualizao de qualquer atributo de dados associados aos ns,
facilitando a navegao e localizao do usurio durante seu uso.
No que diz respeito a mtricas, o Gephi realiza trs tipos de clculo: da rede, da
aresta e da rede. As mtricas de rede disponveis englobam Average Degree, Dimetro,
Densidade, Modularity, PageRank e Componentes Conexos. Quanto s mtricas do n,
existe a possibilidade de clculo de Degree Power Law, Mdia de Coeficiente de
Clustering, Eigenvector Centrality e quanto aresta, possui clculo de Mdia de
Caminhos Mais Curtos.
Vale mencionar, que alm de calcular as mtricas acima, o software Gephi gera,
tambm, um grfico com as distribuies de cada uma delas, facilitando a anlise pelo
pesquisador uma vez que facilita a identificao de concentrao de ns em uma certa
faixa de valor.
A ferramenta possui uma caracterstica importante para o problema de redes
com grandes dimenses. De acordo com Bastian, Heymann e Jacomy (2009), o software
pode lidar com redes que possuem mais de 20.000 ns, uma vez que construdo em
um modelo multi-tarefa, que consegue tirar proveito de processadores multi-core. Outro
ponto importante a documentao bastante explicativa e completa.
Figure 1. Ferramenta Gephi

4.2. SocNetV
A ferramenta Social Network Visualizer (SocNetV) possui cdigo aberto e foi
desenvolvida em C++ . Ela bastante flexvel e amigvel realizando anlise e
visualizao de redes sociais. Ele permite construir redes de modo bastante simples ou
carregar redes de vrios formatos, entre eles GraphML, Pajek, UCINET, GraphViz, e
modific-los para atender s necessidades de seus usurios. Este software permite ao
usurio, calcular as propriedades bsicas de rede, tais como Dimetro, Nmero de
Cliques, Coeficiente de Clustering, Centralidade, Caminho mais Curto, InDegree,
OutDegree, Closeness, Stress, Eccentricity, Betweeness e Matriz de Adjacncias.
A ferramenta possui documentao online em formato HTML suficiente para
entendimento sobre sua utilizao. O site traz, ainda, erros encontrados por
desenvolvedores e usurios que podem ser consertados e incorporados em novas
verses. O software est disponvel em verses para Windows, Mac e Linux.
Figure 2. Ferramenta SocNetV

4.3. Visone
O software Visone um projeto que surgiu no doutorado de seu criador e que pretendia
ser uma ferramenta que cumprisse seu papel analtico tanto para pesquisadores quanto
para estudantes e usurios no experientes. O software prope o desenvolvimento de
modelos e algoritmos para integrar e promover a anlise e visualizao de redes sociais.
Este est disponvel em Java para Windows e Linux, alm de suportar importao e
exportao de formatos tradicionais (JPEG, PDF, SVG, Metafile) para dados de rede
social alm do tradicional formato GraphML.
Quanto as mtricas, os mtodos de anlise disponveis so focados na rede,
incluindo InDegree, OutDegree, Betweenness, Closeness, Eccentricity, Stress,
Radiality, Eigenvector e Page Rank . Segundo Baur(2008), o Visone utiliza algoritmos
eficientes de modo que no sejam impostas restries desnecessrias sobre os dados de
entrada, por exemplo.
Sua documentao um pouco confusa, pois consiste de um pequeno tutorial de
primeiros passos que insuficiente para dominar as funcionalidades bsicas da
ferramenta e publicaes referentes ferramenta. Para que seja possvel entender
mtodos e funcionalidades, o usurio deve ler a tese de Ph.D do desenvolvedor, que traz
detalhadas que esclarece algumas funes do software. Porm, uma leitura extensa e
cansativa e pode desmotivar novos usurios.
Figura 3. Ferramenta Visone

5. Experimento
Para o experimento, o domnio ser limitado rede de colaborao cientfica, j que a
anlise desse tipo de rede importante no meio cientfico e proporciona resultados que
fortalecem a rede analisada. Numa rede de colaborao cientfica, os pesquisadores se
unem e se relacionam por meio de co-autorias para resolver problemas. Ao analisar a
rede, possvel encontrar pessoas, recursos ou projetos de pesquisa que possam
fortalecer essa rede e colaborar com a soluo de um determinado problema.
O arquivo de entrada para o experimento foi construdo com base na rede de
colaborao da disponvel na plataforma Lattes. Dessa forma, os pesquisadores e
colaboradores do grupo de pesquisa GRECO so os ns dessa rede de colaborao
relacionados por meio de co-autoria. Os sete pesquisadores do grupo e seus
colaboradores externos formam os ns desse grafo, totalizando 59 colaboradores. O
formato de representao usado na construo da rede o graphML que permite a
descrio de grafos direcionados, no direcionados, seus atributos e se baseia na
linguagem XML. Para esse trabalho optou-se por um grafo simples, com ns e arestas
sem atributos e todos relacionamentos possuem pesos iguais.
No contexto da colaborao, uma rede totalmente conectada, quer dizer que
todos os pesquisadores, por meio de algum caminho, podem ser alcanados no grafo.
Ou seja, tem algum contato que pode gerar uma possvel futura colaborao. Ao
calcular essa medida a partir do arquivo de entrada construdo, foram encontrados dois
componentes conexos. Isto , a rede no totalmente conectada e existem dois grupos
de colaboradores que no colaboram entre si. O menor componente conexo possui 8
pesquisadores sendo que dois so do GRECO. J o componente maior possui os outros
51 pesquisadores.
No que se refere ao Coeficiente de Clusterizao, na rede de colaborao, essa
medida corresponde probabilidade de dois autores que possuem um colaborador em
comum se unirem para resolver um problema. Ao calcular essa medida na rede de
colaborao do grupo GRECO, possvel obter o valor mdio de 0,03, o que indica que
os colaboradores do grupo no possuem muitos colaboradores de fora do grupo em
comum.
A densidade calculada, no contexto das redes de colaborao cientfica, como
o indicador de quanto os elementos da rede colaboram entre si. Aps o calculo, foi
obtido o valor de 0,04 o que quer dizer que ou o grupo no colabora entre si ou, como
o caso da rede de colaborao analisada, h muitos colaboradores externos que agem
como folhas no grafo e causam a queda do valor da densidade.
Analisando os resultados trazidos pela mtrica Matriz de Adjacncias, podemos
perceber que o grafo no direcionado, pois a diagonal principal da matriz formada
apenas de 1, indicando que simetria de Mi,j igual a Mj,i. De posse dela, possvel
verificar de forma imediata, se um n est ligado a outro sem precisar navegar pela
rede. Este no uma rede muito densa, mas caso fosse, a Matriz de Adjacncias seria
um timo mtodo para verificar a ligao de um n qualquer.
No que diz respeito Eigenvector Centrality, analisando a rede com 100
iteraes, pode-se perceber que existem trs pesquisadores que exercem alto grau de
importncia na rede devido aos altos valores de Eigenvector Centrality, que so 1, 0,575
e 0,484. A mtrica faz sentido, uma vez que so trs professores do Programa de Ps
Graduao e possuem o maior nmero de colaboradores associado, ou seja, exercem
grande importncia na rede bem como so nitidamente centrais nela.
Ao analisar o grau de um n na rede de colaborao, pode-se concluir que
quanto maior o valor encontrado, mais fcil o autor pode alcanar os outros autores.
Sendo assim, o grau de um n reflete na quantidade de colaboraes do autor em
anlise. Considerando a rede concluda, optou-se por fazer uma mdia do grau dos sete
pesquisadores do grupo de pesquisa. Caso fossem considerados os colaboradores
externos, a mdia sofreria uma reduo considervel, j que os colaboradores de fora do
grupo desses 51 pesquisadores externos no foram includos na rede construda. A
mdia de graus dos ns que representam os pesquisadores do GRECO corresponde 9
publicaes, sendo que o valor mximo de publicaes foi 21 e o mnimo encontrado
foi 3 publicaes.

6. Concluso
Este trabalho tratou de questes referentes anlise de redes sociais atravs da
utilizao de ferramentas capazes de visualizar redes extensas bem como realizar
clculo de diversas mtricas a fim de facilitar o entendimento do pesquisador quanto
rede estudada. Para isso, foram levantadas ferramentas disponveis na Internet e suas
caractersticas e atravs de um experimento utilizando a rede de colaborao do grupo
de pesquisa GRECO.
Pode-se concluir que as ferramentas de anlise de redes sociais constituem
importantes parceiros estratgicos do pesquisador na gesto do conhecimento, pois
auxiliam de forma bastante intensa o mapeamento e estudo de dados presentes em uma
rede. Atravs delas, foi possvel visualizar pesquisadores centrais e grupos fortemente
conectados e, portanto, altamente colaborativo, por exemplo.
No que diz respeito rede do grupo de pesquisa GRECO, foi possvel concluir
que os pesquisadores de dentro do grupo no tm taxa de colaborao alta entre si, mas
possuem uma mdia de colaborao alta, considerando os colaboradores externos de
outros grupos. Isso se deve a, provavelmente, reas de atuao e interesses distintos. A
presena de dois componentes conexos na rede aponta a necessidade de colaborao
entre membros dos dois componentes para que seja possvel qualquer pesquisador de
uma parte conexa alcanar os da outra, na medida em que a interao entre
pesquisadores potencializa a probabilidade de resolver problemas.
Como trabalho futuro, possvel apontar a necessidade de extrair uma rede
maior e mais complexa para anlises de colaborao nacional ou mundial. Ainda no
domnio de um grupo de pesquisa, pode-se trabalhar com pesos nas arestas e atributos
enfatizando a intensidade de relacionamentos de co-autoria. Os atributos como idade,
tempo de estadia no grupo de pesquisa, localizao geogrfica, sexo e outros seriam
teis para cruzar informaes com as estatsticas tiradas atravs das ferramentas e gerar
novas anlises.

7. Referncias

BASTIAN M., HEYMANN S., JACOMY, 2009,. Gephi: an open source software for
exploring and manipulating networks. International AAAI Conference on Weblogs
and Social Media.
BAUR, M. 2008, Visone - Software for the Analysis and Visualization of Social
Networks. Ph.D. Thesis, Universitt Karlsruhe (TH). November 2008.
DE NOOY, W., MRVAR, A., BATAGELJ, V. Exploratory Social Network Analysis
with Pajek (Structural Analysis in the Social Sciences) bridge University Press, 2005.
ISBN: 0521602629.
FREIRE, V.P.M., 2010, Uma Mtrica Para Ranqueamento em redes de Colaborao
Baseada em Intensidade de Relacionamento
LATTES, 2010, Plataforma Lattes, Disponvel em <http://lattes.cnpq.br/>, Acessado
em 10 de Dezembro de 2010.
MONCLAR, R. S., OLIVEIRA, J., SOUZA, J. M. de, 2007, Use of Space and Time
Information for Context Identification, In: Proceedings of the CSCWD
Conference; Melbourne, Australia, April 26-28, 2007, pp. 141-143.
NEWMAN, M. E. J. The structure of scientific collaboration networks. In:Proc. Natl.
Acad. Sci. USA, v. 98, pp. 404?409, jan. 2001.
SOCNETV, 2010, SocNetV - Social Network Analysis Software , Disponvel em
<http://socnetv.sourceforge.net/docs/manual.html> , Acessado em 19 de Dezembro
de 2010.
SONNENWALD, D.H., 2007, Scientific Collaboration, In: Annual Review of
Information Science and Technology, Medford, NJ: Information Today, ed. B.
Cronin, Vol. 41, pp. 643-681.

Você também pode gostar