Você está na página 1de 22

Medidas de Centralidade de Redes

Otimização Combinatória

L ETÍCIA L EITE

Departamento de Matemática
Universidade de Aveiro

Professor Agostinho Agra

4 de junho de 2018
Conteúdo

1 Introdução 5

2 Medidas de Centralidade de Redes 7


2.1 Centralidade de grau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Centralidade de proximidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Centralidade de intermediação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4 Centralidade de vetor próprio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 Centralidade de Katz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.6 Centralidade PageRank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3 Conclusão 19

Referências Bibliográficas 21

3
Capítulo 1

Introdução

O estudo de redes é de grande interesse na área científica, devido à capacidade de uma determinada
rede poder representar por meio de modelação diversos problemas de natureza real [1]. Existem diversos
tipos de redes, dos quais se destacam: as redes sociais, de transportes, tecnológicas e biológicas.
Uma rede constitui um conjunto de objetos conectados entre si de alguma forma. Atualmente, o ramo
da matemática conhecido como teoria dos grafos constitui a base da modelação matemática para o estudo
da ciência das redes. Segundo esta teoria uma rede pode ser representada matematicamente por um grafo
que é constituído por um conjunto de pontos, os nós ou vértices, conectados por linhas que expressam
uma relação entre eles, as arestas [2]. Todas as redes podem ser representadas por um grafo. Cada posição
na rede corresponde a um nó no grafo e cada possível relação entre as posições corresponde a uma aresta
que conecta um par de nós [1].
As redes sociais são um tipo específico de rede compostas por indivíduos ligados por um ou mais tipos
específicos de interdependência, como amizade, parentesco, relações comerciais, poder, conhecimento
ou prestígio [1]. Por exemplo, o Facebook e o LinkedIn são redes sociais. A teoria de grafos tem sido
utilizada na análise de redes sociais devido à sua capacidade de representação e simplicidade [2]. Assim
sendo, os nós representam as pessoas e as arestas as relações que estas estabelecem entre si.
Numa rede social, existem pessoas que têm um marco importante sendo frequentemente envolvidas
nas relações com outras pessoas. Esta envolvência torna-as mais visíveis possuindo um maior controlo
sobre a rede e, por sua vez, consideradas mais centrais na rede. Assim, surgem as medidas de centralidade
que tentam descrever as propriedades da localização de uma pessoa na rede. Estas medidas levam
em consideração as diferentes formas que uma pessoa interage e comunica com a restante rede, sendo
classificados como centrais os nós localizados em posições mais estratégicas na rede [1].
A realização deste trabalho tem como principal objetivo o estudo de medidas de centralidade de redes.
Assim, abordar-se-á os principais tipos de medidas de centralidade, descrevendo cada uma delas com
exemplos ilustrativos, os modelos matemáticos associados e expondo aplicações às quais estas medidas
podem ser usadas em múltiplas circunstâncias.

5
Capítulo 2

Medidas de Centralidade de Redes

Na teoria dos grafos e na análise de redes, a centralidade é uma medida desenvolvida para determinar
a importância dos nós e ligações utilizando as características estruturais das redes [2].
Com o desenvolvimento dos estudos baseados em grafos na área das ciências sociais, um dos
primeiros problemas encontrados foi o de avaliar quais as pessoas que possuíam uma maior importância
dentro do grupo em análise [3]. Em 1948, a noção de centralidade em redes sociais foi introduzida por
Bavelas quando este afirmou que num grupo de pessoas, um determinado indivíduo que se encontra
estrategicamente localizado num caminho mais curto de comunicação entre pares de indivíduos, encontra-
se numa posição mais central da rede. Esse indivíduo será responsável por transmitir, modificar ou reter
informação entre os membros do grupo e quanto mais central estiver posicionado na rede mais importante
é o indivíduo na rede [1]. Deste modo, as medidas de centralidade surgem no contexto da análise de redes
sociais [2].
Freeman, em 1979, abordou o conceito de centralidade conferindo a existência de um grande número
de medidas até à data publicadas e reduziu-as apenas a três definições clássicas: centralidade de grau,
centralidade de proximidade e centralidade de intermediação. Ao longos dos anos, investigadores em
redes têm introduzido diversas medidas de centralidade com o objetivo de medir a importância dos nós
de acordo com critérios pré-estabelecidos [1]. Este trabalho apenas se focará nas seguintes medidas:
centralidade de grau, de proximidade, de intermediação, de vetor próprio, de Katz e PageRank.

2.1 Centralidade de grau


A centralidade de grau é considerada a medida mais simples de todas as medidas de centralidade.
Esta medida avalia a importância de um nó analisando a quantidade de nós que estão ligados a ele. Deste
modo, quanto maior é o número de nós ligados ao nó a ser avaliado maior será a importância desse nó
para a rede e, portanto, maior o valor atribuído ao nó pela centralidade [3].
Desta forma, a centralidade de grau é a contagem do número de adjacências de um nó, ou seja,
coincide com o próprio grau do nó [1]. Utilizando-se a seguinte expressão matemática calcula-se a

7
centralidade de grau de um nó vi numa rede,
n
X
cD (vi ) = aij (2.1)
j=1

onde A = (aij ) são os elementos da matriz de adjacência do grafo e n o número de nós do grafo.
Na figura 2.1, apresenta-se um grafo G simples com cinco nós e seis arestas.

Figura 2.1: Grafo G.

Aplicando a expressão (2.1), obtém-se para cada nó o respetivo grau,

cD (v1 ) = 1, cD (v2 ) = 2, cD (v3 ) = 3, cD (v4 ) = 2 e cD (v5 ) = 4.

Verifica-se que o nó v5 possui maior centralidade de grau devido ao número de arestas que lhe são
incidentes, o nó v3 encontra-se conectado a três nós, os nós v2 e v4 ficam empatados na mesma posição
com um mesmo número de arestas incidentes e, em último, tem-se o nó v1 com apenas uma aresta
incidente. Conclui-se que o nó v5 é o nó central e a ordenação crescente dos nós é dada por: v1 , v2 , v4 , v3
e v5 .
A matriz de adjacências é uma das formas de se representar um grafo, onde as linhas e colunas da
matriz estão associadas aos nós da rede. Quando existe uma ligação entre dois nós a matriz é preenchida
pelo valor 1 e, não havendo ligação entre os nós a matriz é preenchida com valor 0. Perante uma rede
onde não existe pesos nas ligações, a matriz de adjacência é simétrica. Por outro lado, havendo pesos nas
ligações obtém-se duas matrizes para representar o grafo, a matriz de adjacência indicando se existem
ligações entre os nós e a matriz de pesos que contém os pesos das ligações [3].
Perante o exemplo apresentado anteriormente, a matriz de adjacência do grafo G é dada por,
 
0 0 0 0 1
 0 0 1 0 1 
 
 
A(G) =   0 1 0 1 1 

 0 0 1 0 1 
 

1 1 1 1 0

Assim sendo, tal como seria de esperar, o grau de cada nó coincide com a soma dos respetivos
elementos da i-ésima linha ou da j-ésima coluna da matriz A(G).
A centralidade de grau é aplicável, por exemplo, em redes que representam uma situação estática,
ou seja, redes de pequena dimensão onde o panorama da rede não é complexo nem sofre alterações, e o
objetivo consiste em avaliar a importância dos nós em função dos seus contactos diretos [1].

8
2.2 Centralidade de proximidade
A centralidade de proximidade é obtida pelo inverso da soma das distâncias de um nó em relação aos
restantes nós da rede sendo modelada pela seguinte expressão [1],
1
cC (vi ) = Pn (2.2)
j=1 dist(vj , vi )

onde dist(vj , vi ) é a distância entre os nós vj e vi . Esta distância corresponde ao comprimento do


menor caminho entre dois nós, ou seja, o caminho mais curto.
O propósito desta medida é avaliar o quanto um determinado nó se encontra distante relativamente aos
outros, ou seja, mede a centralidade de um nó em termos da capacidade para alcançar os outros nós [3][5].
Assim, quanto maior for a distância de um nó na rede para os restantes nós, menor é a sua medida de
centralidade de proximidade. Como consequência, o nó é central quanto menor é o caminho que precisa
de percorrer para alcançar os restantes nós da rede. Por isso, o nó com maior valor de centralidade de
proximidade é o que alcança com maior agilidade todos os outros.
Para ilustrar a medida de proximidade, considere-se o grafo G da figura 2.2 com cinco nós e cinco
arestas.

Figura 2.2: Grafo G.

As distâncias entre o nó v1 e os restantes nós são dadas por:

dist(v2 , v1 ) = 2, dist(v3 , v1 ) = 3, dist(v4 , v1 ) = 2, dist(v5 , v1 ) = 1

Utilizando a expressão em (2.2), a centralidade de proximidade do nó v1 será:


1 1 1
cC (v1 ) = P5 = =
j=1 dist(vj , v1 )
2 + 3 + 2 + 1 8

Para os restantes nós, a medida de centralidade é obtida de modo análogo tal como para o nó v1 ,
obtendo-se:
1 1 1 1
cC (v2 ) = , cC (v3 ) = , cC (v4 ) = , cC (v5 ) =
6 7 6 5

Conclui-se, assim, que o nó v5 é o nó central de acordo com esta medida de centralidade e a ordenação
crescente dos nós será: v1 , v3 , v2 , v4 e v5 .
Observe-se que a expressão obtida em (2.2) quando utilizada em redes que representam grafos
desconexos não tem qualquer significado uma vez que nem todos os nós terão um caminho entre si, o que

9
significa que pertencem a diferentes componentes conexas. Deste modo, obtém-se que d(vj , vi ) = ∞ o
que torna o somatório em (2.2) infinito e, como consequência, cC (vi ) = 0 (qualquer que seja o nó).
Para obter a medida de centralidade de proximidade é necessário o cálculo das distâncias entre todos
os pares de nós. Este cálculo pode ser obtido usando o algoritmo de Floyd-Warshall com complexidade
O(n3 ) [6]. Note-se que este algoritmo apenas é utilizado em grafos orientados pelo que o grafo da rede
terá de ser orientado para o algoritmo funcionar.
Esta medida é importante na análise da velocidade de acesso do fluxo de dados ou de informação a
partir de um nó para todos os restantes na rede. Por exemplo, numa rede de transportes, o nó com menor
valor de centralidade de proximidade é aquele que consegue alcançar de forma mais ágil todos os outros
nós. Esta medida também pode ser utilizada para auxiliar na tomada de decisão em relação à escolha de
uma região para instalação de um centro de distribuição de mercadorias. A região com o menor valor de
centralidade de proximidade é aquela que poderá realizar com maior rapidez o processo de deslocamento
das mercadorias para as outras regiões [4].

2.3 Centralidade de intermediação


A centralidade de intermediação quantifica o número de vezes que um nó age como ponte ao longo do
caminho mais curto entre outros dois nós.
Esta medida calcula a importância de um nó, vi , pela razão entre o número de caminhos mais curtos
que passam por vi e o total de caminhos mais curtos entre pares de nós da rede. Deste modo, considerando
que o grafo G = (V, E) representa qualquer rede, onde V é o conjunto de nós e E é o conjunto das
arestas, define-se a centralidade de intermediação de um nó vi como sendo:
X σst (vi )
cB (vi ) = (2.3)
σst
s6=vi 6=t∈V

onde σst é o total de caminhos mais curtos entre os nós s e t, e σst (vi ) é o número de caminhos mais curtos
que passam por vi . Note-se que se não existir caminho entre os pares de nós a medida de centralidade é
nula.
Para ilustrar a medida de intermediação, considere-se a figura 2.3 que representa um grafo G com sete
nós e sete arestas [1].

Figura 2.3: Grafo G.

10
Os caminhos mais curtos entre vi e vj , vi , vj ∈ V , i < j = 2, ..., 7, bem como os caminhos que
passam pelo nó v1 , são dados por:
σ23 = 1 e σ23 (v1 ) = 0; σ24 = 1 e σ24 (v1 ) = 0; σ25 = 1 e σ25 (v1 ) = 0; σ26 = 2 e σ26 (v1 ) =
2; σ27 = 1 e σ27 (v1 ) = 0; σ34 = 2 e σ34 (v1 ) = 1; σ35 = 1 e σ35 (v1 ) = 0; σ36 = 1 e σ36 (v1 ) =
1; σ37 = 1 e σ37 (v1 ) = 0; σ45 = 1 e σ45 (v1 ) = 0; σ46 = 1 e σ46 (v1 ) = 1; σ47 = 1 e σ47 (v1 ) =
0; σ56 = 2 e σ56 (v1 ) = 2; σ57 = 1 e σ57 (v1 ) = 0; σ67 = 2 e σ67 (v1 ) = 2.
Assim, utilizando a expressão (2.3), a medida de centralidade de intermediação do nó v1 é:

0 0 0 2 0 1 0 1 0 0 1 0 2 0 2 11
cB (v1 ) = + + + + + + + + + + + + + + = = 5, 50.
1 1 1 2 1 2 1 1 1 1 1 1 2 1 2 2

De forma análoga, tem-se a medida de centralidade para os restantes vértices dada por:

cB (v2 ) = 8.50; cB (v3 ) = cB (v4 ) = 3; cB (v5 ) = 5 e cB (v6 ) = cB (v7 ) = 0.

Portanto, de acordo com os resultados obtidos, o nó com maior valor de centralidade de intermediação
é o nó v2 e, a ordenação crescente dos nós será: v6 , v7 , v3 , v4 , v5 , v1 e v2 .
Para os casos em que se trabalha com grafos de redes com uma dimensão enorme, tanto o procedimento
de identificação dos nós como a contagem do número de caminhos mais curtos entre os nós requer um
trabalho exaustivo. Deste modo, existem algoritmos que ajudam nesses processos, nomeadamente o
algoritmo de Brandes. Este algoritmo é utilizado para calcular a intermediação de todos os nós de um
grafo sem pesos. A sua complexidade é O(|V ||E|) em tempo e O(|V | + |E|) em espaço, onde V é o
conjunto dos nós e E é o conjunto das arestas de um grafo G [7].
Esta medida de centralidade tem grande aplicação nos casos de entrega de mercadorias, onde o destino
e a melhor rota são conhecidos. Nestes casos, o nó com um valor elevado de centralidade de intermediação
pode controlar o fluxo da rede. Em alguns casos, esse nó é o ponto de ligação entre pontos isolados da
rede, ou seja, é o único elo de ligação entre eles [4].
Na figura 2.4, está representado um grafo G com cinco nós e cinco arestas.

Figura 2.4: Grafo G.

Visualmente, percebe-se que o nó v2 é o ponto de ligação da rede. Este nó participa oito vezes nos
menores caminhos para unir os possíveis pares de nós do grafo, destacando-se os pares: (v1 , v4 ), (v1 , v5 ),
(v1 , v6 ), (v3 , v4 ), (v3 , v5 ), (v3 , v6 ), (v5 , v4 ) e (v5 , v6 ).
Assim, os valores da medida de intermediação dos nós são:

cB (v1 ) = 0; cB (v2 ) = 8; cB (v3 ) = 0 cB (v4 ) = 4; cB (v5 ) = 0 e cB (v6 ) = 0.

11
Logo, tendo em conta os valores obtidos conclui-se que o nó v2 é de facto o nó que apresenta o maior
valor de medida de centralidade de intermediação. A respetiva ordenação crescente dos nós é dada por:
v1 , v3 , v5 , v6 , v4 e v2 .

2.4 Centralidade de vetor próprio


Em 1987, Bonacich, propôs uma medida denominada centralidade de vetor próprio baseada em
valores próprios e vetores próprios de matrizes simétricas. Este tipo de centralidade atribui uma elevada
relevância a um nó em função da sua relação com os seus vizinhos, ou seja, mesmo que um nó vk esteja
somente ligado a outro nó vi e, por isso, pode-se afirmar que vk possui um valor pequeno da medida de
centralidade de grau, os vizinhos de vi podem ser importantes e, consequentemente, o nó vk também será,
logo terá um elevado valor de centralidade de vetor próprio [1].
Denotando a centralidade de vetor próprio de um nó vi por xvi , esta medida pode ser obtida por,
n
1X
x vi = aij xvj (2.4)
λ
j=1

onde λ é o maior valor próprio em módulo da matriz de adjacência e A = (aij ) são os elementos da
matriz de adjacência do grafo [8].
Note-se que a escolha do maior valor próprio em módulo tem por base o teorema de Perron-Frobenius.
Este teorema diz que: seja A uma matriz quadrada, irredutível, de ordem n com entradas não negativas.
Então, existe um vetor próprio v de componentes todas positivas e o correspondente valor próprio ρ é
simples e tal que para qualquer valor próprio λ de A, |λ| ≤ ρ [2].
Definindo o vetor das centralidades por x = (xv1 , xv2 , ..., xvn ), a expressão (2.4) é reescrita em
notação matricial de tal forma que se obtém,

Ax = λx (2.5)

As soluções de λ e (xv1 , ..., xvn ) para a equação (2.5) correspondem, respetivamente, aos valores
próprios e vetores próprios da matriz de adjacência do grafo. Deste modo, utilizam-se os valores dos
vetores próprios associados ao maior valor próprio da matriz para identificar os nós de maior influência na
rede. Portanto, quanto maior for o valor de xvi , maior será a centralidade do nó vi , denotada por cE (vi )
[4].
Considere-se a figura 2.5 que representa um grafo G com cinco nós e seis arestas de forma a
exemplificar a medida de centralidade de vetor próprio [4].

Figura 2.5: Grafo G.

12
A matriz de adjacência do grafo é dada por:
 
0 1 0 0 1
 1 0 1 1 0 
 
 
A(G) = 
 0 1 0 1 0 

 0 1 1 0 1 
 

1 0 0 1 0

Pelo que o vetor associado aos valores próprios de A(G) será:


 
−2.00
 −1.17 
 
 
λA(G) =
 0.00 

 0.68 
 

2.48

Por sua vez, a matriz de vetores próprios de A(G) será:


 
0.50 0.20 0.50 0.58 0.36
 0.50 0.43 0.50 0.18 0.53 
 
 
xA(G) =
 0.00 0.74 0.00 0.52 0.43 

 0.50 0.43 0.50 0.18 0.53 
 

0.50 0.20 0.50 0.58 0.36

O quinto elemento do vetor λA(G) é o maior valor próprio em módulo, por isso o vetor escolhido
na matriz de vetores próprios será o quinto vetor associado à quinta coluna. Assim sendo, o valor da
centralidade de vetor próprio, denotada por para cada nó do grafo corresponde aos valores do vetor obtido,
isto é cE (v1 ) = 0.36, cE (v2 ) = 0.53, cE (v3 ) = 0.43, cE (v4 ) = 0.53 e cE (v5 ) = 0.36. Conclui-se,
assim, que os nós centrais são v2 e v4 e, a respetiva ordenação crescente será: v1 , v5 , v3 , v2 e v4 .
Esta medida de centralidade é ideal para analisar casos de difusão de informação ou infeção, onde
se consideram múltiplos caminhos simultâneos com percursos aleatórios. Neste casos, um elemento
conectado a nós que por sua vez esses nós estão conectados a um grande número de outros nós é um
potencial transmissor indireto de informações ou doenças. Assim, um nó com um elevado valor de medida
de centralidade de vetor próprio terá uma grande probabilidade de transmitir fluxo para muitos outros
elementos da rede de forma indireta, através dos elementos aos quais ele se conecta [4].

2.5 Centralidade de Katz


A centralidade de Katz foi introduzida em 1953 por Leo Katz, e em sua homenagem o nome da
medida tem o seu apelido. Esta medida é considerada uma generalização da centralidade de grau. A
centralidade de grau mede o número de vizinhos mais próximos de um nó, enquanto a centralidade de
Katz tem em conta o número de vizinhos mais próximos e ainda o número total de caminhos entre os
pares de nós envolvidos.

13
Seja A = (aij ) a matriz de adjacência de um grafo orientado. A centralidade de Katz, xi , do nó vi é
dada por,
n
X
xvi = α aij xvj + β (2.6)
j=1

onde α e β são constantes positivas [10].


Esta medida é semelhante à centralidade de vetor próprio, no entanto ao contrário da centralidade
de vetor próprio, na centralidade de Katz nenhum nó terá centralidade nula uma vez que o valor de β
contribuirá para a centralidade do nó. Em geral, é comum considerar que β assume sempre o valor 1.
Em formato matricial tem-se,
x = αAx + β

pelo que x pode ser calculado como,



X
x = β(I − α aij )−1 = β αk (ak )ij
k=1

onde β é um vetor cujos elementos são todos iguais a uma dada constante positiva [10].
A contribuição de um nó distante é penalizado por um fator, designado por fator de amortecimento
e representado por α. O seu valor deve ser escolhido de forma a que o processo iterativo não sofra
1
divergência. Assim, para garantir a convergência do processo α deve ser escolhido entre 0 e ρ(A) , onde
ρ(A) é o maior valor próprio da matriz de adjacência [10].
Considere-se a figura 2.6 que ilustra um grafo orientado com seis nós e nove ligações e a tabela 2.1
onde se apresenta o grau de entrada, o grau de saída e a medida de centralidade de Katz para cada nó [11].

Figura 2.6: Grafo G.

Nó vi Grau de entrada Grau de saída Medida de Katz


1 1 2 13.0
2 2 1 1.0
3 3 1 1.0
4 2 3 11.4
5 2 1 6.2
6 2 4 12.6
Tabela 2.1: Medida de centralidade de Katz do grafo G.

14
O tamanho dos nós faz referencia às respetivas medidas de centralidade consoante estas assumirem
valores elevados ou baixos da medida de centralidade de Katz. Verifica-se que o nó que possui maior valor
de centralidade de Katz é o nó v1 , e os nós v2 e v3 são os que têm menor valor da medida. Seria de esperar
que o nó v6 tivesse o maior valor de centralidade uma vez que este nó possui muitas ligações, no entanto
o nó v1 é aquele que possui um maior número de caminhos entre os pares de nós uma vez que a ele estão
ligados os nós v4 e v6 que possibilita a ligação entre os nós v2 , v3 e v5 , o que faz com que o nó v1 tenha o
maior valor da medida. Conclui-se que a ordem de importância dos nós é dada por: v2 , v3 , v5 , v4 , v6 e v1 .
A centralidade de Katz é adequada na análise de grafos acíclicos orientados, cuja centralidade de
vetor próprio é inútil. Nos casos em que se trabalha com grafos de redes com uma dimensão muito
grande, a contagem do número de caminhos entre todos os pares de nós é bastante exaustiva. Por isso,
computacionalmente torna-se mais eficiente. Uma possibilidade de calcular esta medida de centralidade
pode ser com recurso ao software R ou por Matlab implementando uma função, com parâmetros de
entrada: um grafo, o valor de α e β, e com parâmetros de saída: um vetor com as respetivas medidas de
centralidade e o número de iterações que correspondem ao número de nós do grafo.

2.6 Centralidade PageRank

A centralidade de PageRank é considerada uma variação da centralidade de vetor próprio para grafos
orientados [1]. Na construção da medida de PageRank, a web é vista como uma rede de citações, cada
nó corresponde a uma página e cada ligação corresponde a uma referência de uma página para outra,
designada por hiperligação. A medida atribuí um valor a cada nó da rede e, um valor maior corresponde
a um nó mais importante na rede. Do ponto de vista da teoria das redes, PageRank é uma medida de
centralidade. Esta medida baseia-se na estrutura de hiperligações da web para produzir o valor para cada
página da rede, não dependendo assim do conteúdo das páginas [12].
Seja A = (aij ) a matriz de adjacência de um grafo orientado. A centralidade PageRank, xi , do nó vi
é dada por,

n
X xvj
xvi = α aij +β (2.7)
dj
j=1

onde α e β são constantes e dvj é o grau de saída do nó vj . Nesta medida, α deve ser escolhido entre
1
0e dvj (AD−1 )
, onde D é uma matriz diagonal com Dii = max(dvj , 1). Além disso, se o grafo não for
orientado então dvj = 1 [10].
A estrutura de hiperligações da web é bastante complexa e computacionalmente torna-se mais eficiente
calcular a medida de PageRank para todas as páginas inseridas numa rede recorrendo a um algoritmo. O
algoritmo PageRank foi criado por Lawrence Page e Sergey Brin em 1996 na Universidade de Stanford,
no contexto de um projeto de investigação sobre um novo tipo de motor de busca [12].
De uma forma bastante simplificada, o algoritmo do PageRank baseia-se na seguinte explicação:
considere-se que a rede é constituída por n páginas, P1 , P2 , ..., Pn (os nós da rede), o conjunto M (Pi )
representa o conjunto de páginas que referenciam Pi e, L(Pj ) representa o número de ligações que saem
de Pj , ou seja, o grau de saída de Pj . A expressão para o cálculo do valor do PageRank de uma qualquer

15
1−α
página pode ser reescrita da seguinte forma, onde β = n [12] [13]:

1−α X P R(Pj )
P R(Pi ) = +α (2.8)
n L(Pj )
Pj ∈M (Pi )

Considere-se um exemplo muito simples ilustrado pela figura 2.7 [14]. Seja G = (V, E) o grafo
orientado de ordem n, onde V = P1 , ..., Pn é o conjunto de páginas disponibilizadas pela web e (Pi , Pk )
é um arco de G se a página Pi tem uma hiperligação para a página Pj . Assim, o grafo possui três nós
e quatro arcos, ou seja, três páginas web e quatro hiperligações. Seja α = 0.7 o valor para o fator de
amortecimento.

Figura 2.7: Grafo G.

Verifica-se que o grau de saída dos nós são: L(P1 ) = 1, L(P2 ) = 2 e L(P3 ) = 1. Assim, utilizando a
expressão (2.8) vem que,
 
1−α P R(P2 )
P R(P1 ) = +α = 0.1 + 0.35 × P R(P2 )
n 2
 
1−α P R(P3 )
P R(P2 ) = +α = 0.1 + 0.70 × P R(P3 )
n 1
 
1−α P R(P1 ) P R(P2 )
P R(P3 ) = +α + = 0.1 + 0.70 × P R(P1 ) + 0.35 × P R(P2 )
n 1 2
Resolvendo o sistema, obtém-se o valor do PageRank para cada nó dado por,

P R(P1 ) = 0.2314, P R(P2 ) = 0.3753 e P R(P3 ) = 0.3933.

pelo que a ordem crescente de importância é: P1 , P2 e P3 .


A utilidade de um motor de pesquisa depende da relevância dos resultados que retorna. A maioria
dos motores de pesquisa usa métodos para criar um ranking dos resultados, por forma a apresentar os
"melhores"resultados primeiro [15]. Por exemplo, o Google, fundado por Larry Page e Sergey Brin, é um
dos motores de busca que utiliza o PageRank para ordenar as páginas e assim definir a importância de
uma página consoante um determinado assunto pesquisado.
O PageRank de uma página é obtido segundo o PageRank das páginas com hiperligações para essa
página [15]. Uma página terá um valor alto de PageRank se contiver muitas hiperligações ou se existirem
algumas hiperligações com uma medida de PageRank elevada.
Considere-se a figura 2.8 que representa um grafo de uma rede com onze nós e dezassete ligações.
As percentagens expressas nos nós correspondem à medida de PageRank e o tamanho de cada nó a sua
importância [12].

16
Figura 2.8: Medida de PageRank para os nós de uma rede.

Constata-se que o nó B é o que possui o maior valor da medida de PageRank e os nós G, H, I, J e K


o menor valor. Quanto maior for o tamanho do nó maior será a sua contribuição para os restantes nós a
que está ligado. Por exemplo, verifica-se que o nó C tem um valor de PageRank mais elevado que o nó E,
apesar de existir apenas uma ligação para C. Esta ligação vem de um nó importante, o nó B, e, por isso,
C também terá um valor elevado da medida. Assim, a ordenação é: G, H, I, J, K, A, D, F , E, C e B.

17
Capítulo 3

Conclusão

Este trabalho teve como principal objetivo o estudo das principais medidas de centralidade de redes.
Foram descritas as medidas, apresentando exemplos simples e algumas aplicações em problemas de
natureza real. Deste modo, foi possível analisar o comportamento das várias medidas em diversas
situações.
Uma das razões pelas quais existem várias medidas de centralidade resulta pelo facto de que todas
elas têm limitações. Não existe uma medida de centralidade universal que considere que em qualquer
rede existe uma determinada medida que pode ser melhor que as restantes. Cada uma das medidas é
considerada como mais apropriada a determinados tipos de problemas.
De acordo com a análise das medidas, é de realçar que um determinado nó não estará obrigatoriamente
na mesma posição. Isto ocorre uma vez que o modelo matemático utilizado para o cálculo de cada medida
está associado a um objetivo diferente. Assim sendo, é fundamental compreender a dinâmica e influência
da rede de forma a que seja implementada a medida de centralidade mais adequada.

19
Referências Bibliográficas

[1] L. Freitas, Medidas de centralidade em grafos, Instituto Alberto Luiz Coimbra de Pós-Graduação e
Pesquisa de Engenharia, 2010.

[2] P. A. Laranjeira e L. Cavique, Métricas de Centralidade em Redes Sociais, Revista de Ciências da


Computação, 2014, no 9.

[3] J. R. F. Ronqui, Medidas de centralidade em redes complexas, Instituto de Física de São Carlos, 2014.

[4] T. S. A. Silva, Um Estudo de Medidas de Centralidade e Confiabilidade em Redes, Centro Federal de


Educação Tecnológica Celso Suckow da Fonseca, 2010.

[5] A. M. Machado e M. C. S. Boeres, Aplicação de Medidas de Centralidade, Simpósio Brasileiro de


Pesquisa Operacional, 2016.

[6] E. M. Borba, Medidas de Centralidade em Grafos e Aplicações em redes de dados, Instituto de


Matemática, 2013.

[7] U. Brandes, A Faster Algorithm for Betweenness Centrality, University of Konstanz, Department of
Computer and Information Science, Journal of Mathematical Sociology, 2001.

[8] M. E. J. Newman, The mathematics of networks, Center for the Study of Complex Systems, University
of Michigan.

[9] A. J. Alvarez-Socorro, G. C. Herrera-Almarza and L. A. González-Díaz, Eigencentrality based on


dissimilarity measures reveals central nodes in complex networks, Scientific Reports, 2015.

[10] M. Mohaisen, Social Network Analysis - Measures and Metrics, Korea University of Technology
and Education, Department of EEC Engineering.

[11] S. Borgatti, Centrality - Katz example, 2005.

[12] “PageRank.” [Online]. Available: https://pt.wikipedia.org/wiki/PageRank.

[13] A. Arratia e R. Ferrer-i-Cancho, Centrality, Universitat Politècnica de Catalunya, 2018.

[14] D. Zhang, PageRank Examples, 2006.

21
[15] P. Rama, A matemática do algoritmo do PageRank do Google, Departamento de Matemática,
Universidade de Aveiro, 2017.

22

Você também pode gostar