Você está na página 1de 62

Universidade Federal Fluminense

Instituto de Computa c

ao
Departamento de Ci

encia da Computa c

ao
Ronald Chiesse de Souza
Avaliacao sobre Estrategias para Distribuicao de
Conte udo em Redes de Larga Escala
Niter oi-RJ
2014
ii
RONALD CHIESSE DE SOUZA
AVALIA C

AO SOBRE ESTRAT

EGIAS PARA DISTRIBUI C

AO DE CONTE

UDO EM
REDES DE LARGA ESCALA
Trabalho submetido ao
Curso de Bacharelado em
Ciencia da Computac ao da Universidade
Federal Fluminense como requisito parcial
para a obtenc ao do ttulo de Bacharel em
Ciencia da Computac ao.
Orientador: Prof. ANTONIO AUGUSTO DE ARAG

AO ROCHA, D.Sc.
Niteroi-RJ
2014
iii
RONALD CHIESSE DE SOUZA
AVALIA C

AO SOBRE ESTRAT

EGIAS PARA DISTRIBUI C

AO DE CONTE

UDO EM
REDES DE LARGA ESCALA
Trabalho submetido ao
Curso de Bacharelado em
Ciencia da Computac ao da Universidade
Federal Fluminense como requisito parcial
para a obtenc ao do ttulo de Bacharel em
Ciencia da Computac ao.
Aprovado por:
Prof. ANTONIO AUGUSTO DE ARAG

AO ROCHA, D.Sc. - Orientador


UFF
Prof. IGOR MONTEIRO MORAES, D.Sc.
UFF
Prof. PEDRO BRACONNOT VELLOSO, D.Sc.
UFF
Niteroi-RJ
2014
iv
A todos que intercederam em meu auxlio,
pelo simples e admiravel proposito de contri-
buir para tornar este trabalho uma realidade.
v
Agradecimentos
A Deus acima de tudo.
`
A minha mae por todo apoio recebido, me orientando e me dando for ca no dia a
dia, com carinho e paciencia, para que eu conseguisse chegar ate aqui.
`
A minha namorada Fernanda, por todo o amor, todo o apoio e pela enorme paci-
encia durante esse tempo.
Ao amigo Jorge Thiago, pelas revis oes e pela imensa ajuda durante a confecc ao
deste trabalho.
Ao meu orientador Antonio Augusto, pela orientac ao e pelo enriquecimento deste
trabalho.
Ao professor Daniel Figueiredo, por me introduzir ao mundo das Redes Complexas
e pela contribui cao fundamental, com muitas ideias e esclarecimentos.
`
A Cinthya Franca, pelas dicas e suporte sobre a linguagem R e a biblioteca igraph.
Ao Fabrcio Murai, pelo conte udo gentilmente cedido para consultas.
Aos professores Igor Moraes e Pedro Velloso, pela presen ca na banca examinadora.
vi
Resumo
O estudo de Redes Complexas vem se intensicando com o tempo. As pessoas estao
cada vez mais conscientes do quanto o assunto e proximo das suas rotinas e do quanto o
mesmo contribui para explicar diversos fen omenos que as cercam. Um desses fenomenos e
a ocorrencia de epidemias. O termo, antes estritamente usado para denotar a propagacao
de doen cas entre individuos, teve seu emprego emancipado na area de estudo formal
denominada Epidemia em Redes. Seu proposito e entender a din amica pela qual uma
inuencia se espalha em uma rede, independentemente da natureza dessa rede. O crescente
entendimento dos mecanismos que regem fen omenos de propaga cao pode desdobrar-se em
importantes aplica coes pr aticas, como e o caso do Marketing Viral.
Este trabalho busca, por meio de simulac oes de epidemia em modelos de Redes
Complexas, entender quais caractersticas dos n os devem ser consideradas para compor
um conjunto semeador capaz de, numa dada rede, proliferar ao m aximo uma infeccao em
um certo perodo de tempo.
Os dados foram coletados empiricamente atraves de um simulador de epidemias
desenvolvido neste trabalho. Metricas relativas a esses dados foram extradas e analisadas,
de modo a caracterizar os fen omenos observados.
Palavras-chave: Redes Complexas, Epidemia em Redes, Semeadura Epidemica, proprie-
dades estruturais.
vii
Abstract
The study of complex networks has intensied with time. People are increasingly
aware of how the subject is close to their routines and how much it contributes to explain
various phenomena that surround them. One such phenomenon is the occurrence of
epidemics. The term, rst used strictly to denote the spread of disease among individuals,
had emancipated its usage in the formal study called Epidemic Networks. Its purpose is
to understand the dynamics by which an inuence spreads in a network, regardless of
the nature of this network. The growing understanding of the mechanisms governing
propagation phenomena may unfold in important practical applications, such as Viral
Marketing.
This work aims, through simulations of epidemic models of complex networks, to
understand which features of the vertices must be considered together to compose a sower
able, in a given network, to proliferate the most an infection in a certain period of time.
Data were collected empirically through a simulator of epidemics developed in this
work. Metrics concerning these data were extracted and analyzed in order to characterize
the observed phenomena.
Keywords: Complex Networks, Epidemic Networks, Epidemic Seeding, structural proper-
ties.
Sumario
Resumo vi
Abstract vii
Lista de Figuras xi
1 Introducao 1
1.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Organizac ao do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Conceitos de Redes Complexas 5
2.1 Formaliza cao de Redes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Propriedades Estruturais da Rede . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Grau de um Vertice . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 Grau Medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.3 Densidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.4 Distribuic ao de Grau . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Modelos de Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3.1 Modelo G(n, p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3.2 Modelo de Barab asi-Albert . . . . . . . . . . . . . . . . . . . . . . . 8
3 Epidemia em Redes 10
3.1 Modelo Suscetvel / Infectado . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2 Modelo de Threshold para Epidemias . . . . . . . . . . . . . . . . . . . . . 11
4 Caracterizacao das Simulacoes 13
4.1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
viii
ix
4.2 Caracterizac ao Emprica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.3 Pseudo-C odigo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.4 Experimentos Realizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.5 Metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5 O Simulador 19
5.1 Visao Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
5.2 Implementac ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
5.2.1 Algoritmos de Contrata cao . . . . . . . . . . . . . . . . . . . . . . . 20
5.2.2 Algoritmo da Epidemia . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.3 Recursos Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.3.1 Visualizador de Epidemias . . . . . . . . . . . . . . . . . . . . . . . 24
5.3.2 Polticas Adicionais de Contratac ao . . . . . . . . . . . . . . . . . . 26
5.3.3 Simulador de Redes Externas . . . . . . . . . . . . . . . . . . . . . 26
6 Analise dos Resultados 27
7 Conclusao 46
7.1 Possveis Melhorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.2 Diculdades Encontradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.3 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Lista de Figuras
4.1 Pseudo-c odigo com uma vis ao geral da simulac ao. . . . . . . . . . . . . . . 16
5.1 Algoritmo de contratac ao de maior grau. . . . . . . . . . . . . . . . . . . . 21
5.2 Algoritmo de contratac ao de menor grau. . . . . . . . . . . . . . . . . . . . 21
5.3 Algoritmo de contratac ao de grau mediano. . . . . . . . . . . . . . . . . . . 22
5.4 Algoritmo de contratac ao de grau aleat orio. . . . . . . . . . . . . . . . . . 23
5.5 Algoritmo de propaga cao da epidemia. . . . . . . . . . . . . . . . . . . . . 24
5.6 Etapas de uma infec cao, geradas pelo Visualisador de Epidemias. . . . . . 25
6.1 Distribuicao de grau dos contratados em cenario Barab asi-Albert com d = 4
e k = 0.05, quando alpha = 0.5. . . . . . . . . . . . . . . . . . . . . . . . . 28
6.2 Distribuicao de grau dos contratados em cenario Barab asi-Albert com d = 4
e k = 0.05, quando alpha = 1. . . . . . . . . . . . . . . . . . . . . . . . . . 28
6.3 Distribuicao de grau dos contratados em cenario Barab asi-Albert com d = 4
e k = 0.05, quando alpha = 2. . . . . . . . . . . . . . . . . . . . . . . . . . 29
6.4 Compara cao da Frac ao de Infectados vs Tempo em cenario Barab asi-Albert
com d = 4 e k = 0.05, para alpha = 0.5 (acima) e alpha = 1 (abaixo). . . . 31
6.5 Compara cao da Frac ao de Infectados vs Tempo em cenario Barabasi-Albert
com d = 8 e k = 0.01, para alpha = 0.5 (acima) e alpha = 1 (abaixo). . . . 34
6.6 Compara cao da Frac ao de Infectados vs [Poltica, alpha] em cenario Barabasi-
Albert com d = 4 e k = 0.05, para threshold = 1 (acima) e threshold = 2
(abaixo). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
6.7 Compara cao da Fracao de Infectados vs [Poltica, threshold] em cen ario
Barab asi-Albert com d = 4 e k = 0.05, para alpha = 0.5 (acima) e alpha = 2
(abaixo). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
x
xi
6.8 Frac ao de Infectados vs Tempo em cen ario G(n, p) com d = 8 e k = 0.01,
para alpha = 0.5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.9 Frac ao de Infectados vs Tempo em cen ario G(n, p) com d = 8 e k = 0.01,
para alpha = 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6.10 Frac ao de Infectados vs Tempo em cen ario G(n, p) com d = 8 e k = 0.01,
para alpha = 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6.11 Comparativo da Distribuic ao de Grau dos contratados em cen ario G(n, p)
com d = 8 e k = 0.01, para alpha = 0.5, 1 e 2. . . . . . . . . . . . . . . . . 40
6.12 Comparativo da Frac ao de Infectados vs Tempo em cen ario G(n, p) com
d = 8 e k = 0.05, quando alpha = 0.5 (acima) e alpha = 1 (abaixo). . . . . 42
6.13 Comparativo da Distribuic ao de Grau dos contratados em cen ario G(n, p)
com d = 8 e k = 0.05, para alpha = 0.5 e alpha = 1. . . . . . . . . . . . . . 43
6.14 Comparativo da Fra cao de Infectados vs Tempo entre os cen arios G(n, p)
de k = 0.05, quando d = 8 (acima) e d = 9 (abaixo). . . . . . . . . . . . . . 44
Captulo 1
Introducao
Seja uma doenca de consideravel grau de contagio a acometer uma pequena frac ao
de indivduos de uma dada populacao - os focos iniciais. Prever a maneira e a dimensao
de seu cont agio gura-se importante ferramenta de combate ` a amea ca epidemica, uma
vez que auxilia a tomada de ac oes preventivas (campanhas de vacinac ao, por exemplo)
que inibam futuros cont agios. Identicamos a uma possibilidade que representaria grande
benefcio ` a sociedade, e que para tornar-se concreta depende da resposta ` a perguntaComo
as doencas se espalham por uma populacao?. Essa situac ao, porem, e muito especca,
n ao obstante sua importancia. Numa abordagem mais generica, poderemos compreender
melhor diversos fen omenos conceitualmente equivalentes, se a pergunta mudar paraComo
algo se espalha numa rede?. A area de estudo que busca tal resposta diz respeito ao tema
formalmente conhecido como Epidemia em Redes.
Embora o termo Epidemia sugira que apenas a propagac ao de doencas seja discu-
tida, na verdade o conceito e bem mais amplo. Busca-se entender a dinamica pela qual
uma inuencia (seja ela uma informa cao, boato, ideia, doenca, ou qualquer outra coisa
propagavel) se espalha por uma rede, e qual a relacao entre essa din amica e a estrutura
da rede em si.
Com o advento do Marketing Viral tal estudo ganhou ainda mais atenc ao. A sua
aplica cao passou a assumir conotac oes comerciais, auxiliando empresas a divulgarem, de
maneira mais planejada e direcionada, seus produtos pelas redes sociais. Neste caso, o
custo de difus ao e muito inferior ao dos tradicionais meios de comunicac ao em massa.
Seja, por exemplo, uma empresa que deseja divulgar pela Internet um novo pro-
duto, iniciando uma campanha em redes sociais, contratando algumas pessoas por algum
2
criterio arbitrario para esse m (por exemplo, contratando artistas para que citem o pro-
duto nessas redes, no intuito de gerar rumores a respeito). Uma questao fundamental
que se coloca e, quais indivduos, se contratados, formariam um conjunto capaz de di-
vulgar o produto com a maior abrangencia possvel em um dado perodo de tempo?

E
intuitivo que a escolha correta dos difusores iniciais (chamados aqui de semeadores) exerce
um papel fundamental no sucesso da propagac ao. Aqui, novamente, ocorre uma quest ao
cuja primitiva, assim como no exemplo da doenca, e a que procura entender como as
coisas se espalham numa rede. Este trabalho motiva-se pela busca de tal entendimento.
Mas anal, o que e uma rede? Em sua denic ao mais geral, uma rede e uma
abstrac ao que permite codicar algum tipo de relacionamento entre pares de objetos [1].
Por desconsiderar a natureza da rede, tal denicao permite modelar todas elas de forma
parecida e identicar caractersticas estruturais em comum.
Retomando-se as redes exemplicadas, foi por m constatado que, embora distin-
tas, uma mesma pergunta, caso respondida, permitiria entender a din amica epidemica
de ambas. Essa correlac ao so foi possvel porque as duas foram observadas segundo a
denicao mais geral de rede, mencionada acima.
De fato, na primeira decada do seculo 21 surge a area formal de estudo dedicada a
entender a estrutura das redes, denominada Redes Complexas. O interesse por esta ciencia
cresceu explosivamente gracas ` a constata cao de que, apesar das diferencas aparentes, o
surgimento e a evoluc ao de redes distintas s ao guiados pelos mesmos princpios, permitindo
modelagens semelhantes para elas [2].
O nome Redes Complexas deve-se essencialmente a dois fatos:
1. As redes estudadas s ao derivadas de sistemas complexos, como, por exemplo, a
sociedade humana, composta por bilhoes de indivduos, ou ainda as infraestruturas
de comunicac ao que integram bilhoes de telefones celulares com computadores e
satelites. Sao, portanto, redes gigantescas e, por isso mesmo, complexas;
2. Seu estudo busca entender o mecanismo pelo qual se formam as conexoes existentes
na rede e o quanto a funcionalidade dela e inuenciada por essas conex oes, o que e
complexo.
Redes Complexas, portanto, e uma area multidisciplinar que procura entender
como as coisasse conectam e quais as consequencias disso [1].

E, desse modo, fundamen-
3
tal para o estudo de epidemias, visto que a din amica epidemica depende essencialmente
da estrutura da rede e, por isso mesmo, constitui a base de atuac ao desse trabalho.
1.1 Objetivo
Esse trabalho busca, por meio de simulacoes de epidemia em modelos de Redes
Complexas, entender quais caractersticas dos n os devem ser consideradas para compor
um conjunto semeador capaz de, numa dada rede, proliferar ao m aximo uma infeccao em
um certo perodo de tempo.
Como o estudo de epidemias tem no Marketing Viral uma vertente cuja aplica-
c ao e potencialmente menos custosa e mais efetiva para as empresas [3], logo de grande
import ancia e interesse socioecon omicos, o estudo a considera em sua modelagem. A
determinac ao dos semeadores leva em conta um orcamento preestabelecido e um custo
contratual, cujo valor se deduz do or camento para cada novo n o integrado ao conjunto
semeador. Apesar da modelagem de Marketing Viral ter sido considerada, o estudo pode
ser aplicado a diferentes modelos de redes.
Busca-se, portanto, subsdios empricos que auxiliem a responder: Dado um orca-
mento, um custo de contrato e uma rede cuja estrutura e conhecida, de qual(is) maneira(s)
pode-se contratar semeadores, de modo a espalhar uma epidemia com a maior abrangencia
e rapidez possveis?
Nos estudos, simulac oes foram realizadas sobre os modelos de rede G(n, p) e Barabasi-
Albert. Esses modelos foram escolhidos pois ao mesmo tempo que capturam caractersti-
cas de redes reais, possuem estruturas muito distintas entre si, o que e muito interessante
para o procedimento emprico de disseminacao epidemica. Alem disso, tratam-se de mo-
delos de referencia na area de Redes Complexas, muito conhecidos e estudados, servindo
assim de base analtica para outros trabalhos baseados em modelos mais complexos.
As contribui coes resultantes desse projeto sao: (i) a disponibilizac ao de uma ferra-
menta computacional - um simulador de epidemias - capaz de conferir maior visibilidade
e entendimento tanto do processo de escolha de estrategias epidemicas quanto dos seus
desdobramentos na din amica de espalhamento em uma rede; e (ii) uma an alise detalhada
dos modelos epidemicos a partir das informacoes obtidas nas simulac oes.

E v alido ressal-
tar que existem v arios modelos de epidemia em rede, cada um abstraindo a din amica de
4
propagacao sob uma determinada otica comportamental. O simulador baseia-se em um
deles, o SI com threshold, o qual e descrito nos captulos seguintes.
1.2 Organizacao do Texto
Alem deste primeiro captulo, no qual foram apresentadas a motiva cao e o ob-
jetivo para o desenvolvimento do trabalho, o restante do texto encontra-se organizado
da seguinte forma: No Captulo 2 sao brevemente apresentados os conceitos de Redes
Complexas necessarios para o entendimento do estudo, formalizando matematicamente as
entidades e metricas empregadas. No Captulo 3 s ao introduzidos alguns dos principais
modelos de epidemia em redes e apresentado com mais detalhes o modelo utilizado nesse
trabalho. No Captulo 4 e apresentado o modelo de semeadura epidemica empregado e
caracterizados os dados empricos coletados para an alise.

E apresentado, ainda, o pseudo-
c odigo panoramico da simulac ao, compreendendo as etapas de contrata cao de vertices e
de infecc ao da rede. Por m, s ao relacionados os cen arios sobre os quais se deram as
simulac oes. O Captulo 5 descreve em detalhes o simulador desenvolvido e utilizado nos
experimentos. Nele s ao especicadas linguagem e bibliotecas utilizadas; apresentados os
algoritmos de contratac ao de vertices; descritos os parametros de entrada e as sadas pos-
sveis/geradas; apresentado o algoritmo da epidemia; descrita a maneira de se executar
simulac oes em geral, incluindo uma discuss ao sobre simulac oes paralelas; e apresentada
uma ferramenta auxiliar - o visualizador epidemico - que permite, em pequenas redes,
visualizar todas as etapas da epidemia, incluindo a contratac ao. No Captulo 6 s ao ana-
lisados os resultados obtidos ap os a execu cao das simula coes para cada um dos cen arios
propostos. Finalmente, o Captulo 7 apresenta a conclusao do trabalho, as sugestoes de
melhorias, diculdades encontradas e ideias para trabalhos futuros.
Captulo 2
Conceitos de Redes Complexas
A seguir s ao apresentados os conceitos de Redes Complexas empregados no estudo,
conferindo o necess ario entendimento das etapas posteriores.
2.1 Formalizacao de Redes
A denicao de rede vista na introducao, embora a represente do ponto de vista ide-
ologico, por si so n ao permite estabelecer matematicamente suas propriedades estruturais
necess arias ao desenvolvimento desse estudo.

E preciso, portanto, formalizar alguns dos
termos que comp oem essa deni cao.
Denominaremos vertices ou nos da rede o conjunto de objetos nela contidos, deno-
tados por V . A quantidade de vertices da rede ser a dada por n = |V |. Um relacionamento
existente entre dois vertices i e j, tais que i, j V , ser a denominado aresta. Sera deno-
tado por E o conjunto de todas as arestas da rede. Portanto E = {(i, j)|i, j V, i est a
relacionado com j}. O n umero de arestas da rede, representado por m, ser a dado por
m = |E|.
No que se refere aos relacionamentos existentes entre seus n os, as redes podem ser
classicadas como simetricas ou assimetricas. Numa rede simetrica, a existencia de um
relacionamento de um n o A para um n o B implica que o mesmo relacionamento e v alido
quando de B para A. Um exemplo dessa rede e a sociedade de castas da

India, onde um
relacionamento e estabelecido entre individuos pertencentes `a mesma casta. Desse modo,
dados dois indivduos i e j, se i pertence ` a casta de j, ent ao j pertence ` a casta de i.
Nas redes assimetricas a implicac ao acima n ao ocorre. Um no A pode relacionar-se
6
com um no B e o contr ario n ao se vericar.

E o caso das paginas na Internet. Dado
que um p agina A referencia uma outra pagina B, n ao necessariamente B fara referencia
a A. Como o escopo desse estudo abrange apenas as redes simetricas, um relacionamento
existente entre dois vertices i e j ser a representado pelo par n ao-ordenado (i, j).
Formalizadas tais entidades, e ent ao possvel denir a rede em si, caracterizada
pelos conjuntos de n os e arestas descritos acima, logo, R = (V, E), o que na pr atica
corresponde ` a denicao de um grafo. Grafo e rede s ao, portanto, conceitualmente equiva-
lentes.
2.2 Propriedades Estruturais da Rede
Os pr oximos sub-t opicos compreendem os conceitos de algumas das propriedades
estruturais de uma rede, utilizados nesse trabalho.
2.2.1 Grau de um Vertice
Dado um vertice i, i V , o n umero de arestas incidentes a i e chamado grau de i,
e ser a denotado por d
i
. Seu valor determina a quantidade de relacionamentos existentes
com o vertice, o que pode variar de 0 a (n 1).
2.2.2 Grau Medio
Denotado por d, corresponde ` a media aritmetica dos graus de todos os nos, expressando-
se como segue:
d =
1
n

iV
d
i
(2.1)
2.2.3 Densidade
Metrica indicativa da raz ao entre a quantidade de arestas que a rede de fato possui
e quantidade m axima que ela poderia ter, denotada por . Seu valor, portanto, varia entre
0 e 1. A quantidade m de arestas existentes ja e conhecida, restando apenas determinar
a m axima. O n umero maximo de arestas incidentes em um dado no da rede (isto e, o seu
grau m aximo) e, conforme j a mencionado, (n 1). Possuindo a rede n n os, o m aximo
7
de arestas da rede seria, em princpio, n (n 1). Importante notar, porem, que nessa
express ao cada aresta foi contada duas vezes, uma vez que qualquer dada aresta possui
duas pontas, incidentes sobre vertices distintos. Assim, e preciso dividir seu resultado por
2, obtendo nalmente a quantidade maxima de arestas, dada por n (n 1)/2.
Intuitivamente, entende-se que as noc oes de grau medio e densidade est ao de al-
guma maneira relacionadas, sendo diretamente proporcionais. De fato, a densidade pode
ser expressa pela seguinte equac ao:
=
m
n(n 1)/2
(2.2)
Isto equivale dizer que
=
d
n 1
(2.3)
conrmando uma relac ao direta e linear entre grau medio e densidade.
2.2.4 Distribuicao de Grau
A distribuicao de grau determina a frac ao de n os que possui um determinado grau
k. Desse modo, para uma dada rede R = (V, E), e para uma quantidade n
k
de vertices
com grau igual a k, tal frac ao e determinada por:
f
k
=
n
k
n
(2.4)
2.3 Modelos de Rede
S ao brevemente explicados a seguir os modelos de rede utilizados nesse estudo.
Convem ressaltar que, embora estes sejam comumente ditos modelos de rede, numa
perspectiva mais rigorosa o termo modelos aleat orios de rede seria mais preciso. Isso
porque, tratam-se de modelos matematicos cujo proposito n ao e gerar redes de maneira
determinstica, mas sim obedecendo a alguma lei de formac ao. Consequentemente, in u-
meras redes distintas podem ser geradas a partir de um mesmo modelo, porem com
caractersticas estruturais em comum.
8
2.3.1 Modelo G(n, p)
O G(n, p) tambem e conhecido como Modelo de Erdos-Renyi em homenagem aos
principais responsaveis por descobertas e provas acerca das propriedades estruturais de
redes baseadas nesse modelo, os matematicos Paul Erd os e Alfred Renyi, entre as decadas
50 e 60 [1] [4] [5].
Sua modelagem contempla somente dois par ametros, n e p, pelos quais se estabelece
uma lei de formac ao bem simples. O par ametro n representa a quantidade de vertices da
rede, referenciados por uma sequencia numerica de 1 a n, e p e a probabilidade de, dados
dois nos, criar-se um relacionamento (aresta) entre ambos, desconsiderando a maneira
como as demais arestas sao includas.
A distribui cao de grau de um modelo G(n, p) e binomial - raz ao pela qual tambem
e chamado Modelo binomial - e, por consequencia, a probabilidade de existir na rede
um vertice cujo grau e ordens de grandeza maior que o grau medio e t ao baixa que e
considerada desprezvel. Por isso mesmo, apesar de sua vasta contribuic ao para o cres-
cente entendimento acerca de propriedades estruturais de redes, o G(n, p) nao captura
satisfatoriamente um aspecto muito comum `as estruturas de diversas redes reais - a dis-
tribuic ao de grau por lei de potencia, tambem conhecida como distribuic ao com cauda
pesada, caracterizada pela probabilidade signicativa de existirem nos cujo grau e ordens
de grandeza maior que o grau medio da rede. Para contemplar esta importante e fre-
quente propriedade na an alise emprica, foi considerado no estudo um segundo modelo,
mais adequado `a reproducao desse cenario.
2.3.2 Modelo de Barabasi-Albert
O modelo de rede proposto por Albert-Lazl o Barabasi e Reka Albert no incio da
decada de 90 foi concebido especicamente para estudos sobre a formac ao e o crescimento
da Web [1] [6]. Ele busca reproduzir o comportamento que os autores supunham explicar
tal processo: quando uma nova p agina e inserida na Web, seus hiperlinks (se existentes)
tendem a referenciar paginas populares. Na estrutura da Web eles identicaram, por
meio de an alises empricas, que isso e muito comum e, na pr atica, descreve uma rede cuja
distribuic ao de grau segue uma lei de potencia (possui cauda pesada). O modelo presume,
portanto, que novas p aginas tendem a referenciar p aginas de grande popularidade.
A noc ao de popularidade empregada no modelo corresponde ao grau de entrada
9
dos n os quando a rede e assimetrica; nas redes simetricas, utilizadas nesse trabalho, cor-
responde simplesmente ao grau. Para ambos os casos, porem, quanto maior o respectivo
grau, maior a popularidade. Ainda, a probabilidade de um novo no relacionar-se com
um n o existente e proporcional ao grau de entrada deste ultimo. Barabasi e Albert, pro-
ponentes desse mecanismo, o denominaram preferential attachment, o que em portugues
signica anexa cao preferencial.
O modelo Barabasi-Albert considera o tempo no processo de forma cao da rede,
assumindo-se intervalos discretos, ou seja, t = 0, 1, . . . . Seja t = 0 o tempo referente ` a
rede Web inicial.

E inserida na rede um novo n o (pagina) a cada instante de tempo t > 0.
Cada n o inserido ir a se relacionar com m n os existentes, isto e, seus m relacionamentos
(hyperlinks) apontarao para m n os (paginas) existentes, denidos aleatoriamente. Dados
um vertice u existente na rede, um instante de tempo t, e sendo d
u
(t) o grau de u no
instante t, a probabilidade de uma nova aresta incidir em u ser a
p
u
(t) =
d
u
(t)

vV (t)
d
v
(t)
(2.5)
da resultando que
p
u
(t) =
d
u
(t)
2(m
o
+ mt)

d
u
(t)
2mt
(2.6)
para um dado conjunto V (t) de vertices presentes na rede num instante t grande o su-
ciente. A demonstrac ao da aproximac ao acima est a alem dos objetivos desse trabalho,
podendo ser encontrada em [1].
Pela equa cao acima, nota-se que t inuencia na probabilidade de uma aresta incidir
sobre u, resultando da que vertices antigos ter ao maior grau. Finalmente, dado um vertice
v
i
, adicionado ` a rede no instante i, considera-se o mesmo pertencente ao conjunto de nos
da rede para todos os instantes subsequentes, isto e, v
i
V
j
para todo j > i.
Captulo 3
Epidemia em Redes
Conforme ja comentado, a estrutura da rede tem bastante inuencia sobre o espa-
lhamento. Trabalhos sobre Marketing Viral que fazem an alises por simulac oes, e que usam
grafos aleat orios, em geral adotam o G(n, p). Esse modelo de rede e considerado um dos
mais apropriados para realizar uma analise global [7]. Isto se deve ` a constatacao de que,
ao incorporar nos modelos fatores como propens oes de adesao, distribuic oes observadas
empiricamente, etc., os desdobramentos da epidemia variam muito, gerando discordancia
sobre qual estrategia possui melhor desempenho. Alem disso, o Marketing Viral e voltado
essencialmente para redes sociais, onde a distribui cao nao segue uma lei de potencia.
Por outro lado, experimentos baseados em dados reais, embora mais precisos, s ao
igualmente mais especcos, tornando sua aplicac ao mais limitada e contribuindo menos
para o entendimento global [7]. Convem notar, porem, que o escopo desse estudo n ao se
restringe ao Marketing Viral. Tal fato, alem do j a comentado na introducao, motivou o
uso de redes Barabasi-Albert, cuja distribuic ao por lei de potencia a torna estruturalmente
mais parecida com varias redes reais.
Fora a questao estrutural, o comportamento dos n os ao longo do tempo e outro
fator muito inuente. A necessidade de se modelar as variantes comportamentais das
epidemias decorre do mesmo princpio pelo qual modelam-se Redes Complexas: dispor
de recursos matem aticos que auxiliem a entende-las. Quanto mais preciso um dado mo-
delo se verica quanto ` a captura de caractersticas epidemicas do mundo real, maior o
entendimento sobre a epidemia em si e mais previsvel o seu desdobramento. As vanta-
gens desse poder preditivo sao numerosas, como, por exemplo, determinar estrategias de
campanhas de vacinac ao no caso de espalhamento de uma doenca; renar os mecanismos
11
de protec ao sistemica, quando propagado um virus de computador; aumentar o controle
sobre campanhas publicit arias pautadas no Marketing Viral.
Cada modelo epidemico busca reproduzir a din amica de infecc ao numa rede su-
pondo um determinado comportamento de seus n os ap os infectados, o que interfere dire-
tamente no modo de propagac ao. Alguns assumem que os n os, uma vez infectados, nao
poderao curar-se no futuro. Outros consideram que ao longo do tempo um n o pode vir
a se recuperar da infecc ao, mantendo-se sao da em diante. Outros ainda, assumem que
vertices podem ser reinfectados ap os uma recuperac ao [4]. Todas essas possibilidades,
entre outras, resultam em dinamicas muito distintas. Ser a detalhado a seguir o modelo
SI.
3.1 Modelo Suscetvel / Infectado
Tambem conhecido como SI, esse pode ser considerado o modelo epidemico mais
trivial. Seu nome vem de seus dois unicos estados: o Suscetvel e o Infectado, denotados
por S e I, respectivamente. Nesse modelo, a infecc ao propaga-se em tempos discretos
t = 0, 1, .... Considera-se um conjunto I(t), eventualmente unit ario, de nos infectados
inicialmente (instante t = 0). Todos os demais nos pertencem ao conjunto S(t) dos
suscetveis. Uma vez que o estado de um no muda para infectado ele jamais retorna para o
estado suscetvel, permanecendo infectado durante todo o processo, conforme especicado
a seguir:
Seja um grafo simetrico R = (V, E) com n = |V | n os. Seja s
i
(t) {S, I} a fun cao
que indica o estado do vertice v
i
V no tempo t 0, para 1 i n.
Seja N(v
i
) o conjunto dos n os vizinhos a v
i
. Por m, seja f
it
= |N(v
i
) I(t)| o
n umero de vizinhos de v
i
que est ao infectados no instante t. Para todo vertice v
i
tal que
s
i
(t) = S, se f
it
> 0 ent ao s
i
(t + 1) = I e, consequentemente, v
i
I(t

) para todo t

> t.
A epidemia acaba somente quando toda a rede e infectada.
3.2 Modelo de Threshold para Epidemias
Muito empregado em modelagens de epidemia [8] [9] [10], seu proposito depende do
contexto onde e aplicado. Nos cen arios que tratam dissemina cao de inuencias tais como
doencas em seres humanos ou vrus em computadores, n ao ha por parte do n o a intenc ao de
12
infectar seus vizinhos. Isso, na verdade, e indesejado. Ocorre involuntariamente e depende
de fatores especcos de cada ambiente, como o contato pessoal entre um infectado e um
suscetvel com baixa imunidade, no caso de humanos. Formulas de probabilidade podem
ser aplicadas para cada n o, individualmente, para determinar o qu ao suscetvel `a infeccao
ele esta.
Se considerado, porem, o ponto de vista do Marketing Viral, percebe-se uma in-
vers ao de prop osito - a infecc ao e desej avel e ampara-se na acao volunt aria de cada n o
adepto. O threshold, nesse caso, pode ser entendido como uma especie de propens ao a
ades ao, isto e, a probabilidade de um n o assimilar (comprar e/ou divulgar) o produto.
Nesse caso, pode ser denida, por exemplo, em func ao de dois fatores: a inuencia dos
vizinhos e as preferencias individuais de cada n o [7].
Nesse trabalho, busca-se uma abordagem apropriada para ambos os casos, uti-
lizando para isso uma modelagem mais simplicada. Nao s ao consideradas preferencias
individuais. Alem disso, em vez de uma probabilidade vari avel de infecc ao, emprega-se um
ndice xo a > 0, o qual estabelece uma inuencia externa mnima para um no infectar-se,
expressa em uma quantidade n de nos vizinhos infectados, tal que n > a. O ndice a e,
portanto, o threshold de infecc ao aplicado nesse trabalho. Desse modo, seja um vertice v
com threshold a. Se v possui mais de a vizinhos infectados num tempo t, entao v estara
infectado em t + 1. O valor de a e unico na rede, ou seja, e o mesmo para todos os n os.
Para expressar tal conceito no modelo SI basta uma pequena modicac ao em sua
modelagem: originalmente, um vertice v
i
infectava-se no tempo t + 1 quando f
it
> 0.
Agora, porem, v
i
ser a infectado em t + 1 se, para um threshold a, f
it
> a. O modelo SI
original torna-se, por essa nova denicao, o caso particular em que a = 0.
Captulo 4
Caracterizacao das Simulacoes
As formalizacoes a seguir referem-se essencialmente ao modelo proposto em [11].
Na sequencia, sao enumerados os cen arios simulados.
4.1 Modelo
O modelo de simulac ao denido a seguir considera todas as formalizac oes j a apre-
sentadas. S ao considerados uma rede R = (V, E) de n = |V | n os e o modelo de epidemia
SI com threshold.
O conjunto O dos vertices inicialmente infectados (isto e, quando t = 0), corres-
ponde ` a estrategia de semeadura, e possui tamanho h = |O|. O termo estrategia tambem
ser a utilizado como forma de referencia ao conjunto O.
`
A acao de integrar um novo
vertice ao conjunto O dar-se-a o nome contratar, de modo que os vertices pertencentes
` a estrategia s ao considerados vertices contratados. Para se contratar um no v
i
e preciso
cobrir um custo contratual c
i
, o qual depende do grau desse n o e e dado por c
i
= d(v
i
)

onde d(v
i
) e a func ao que determina o grau de v
i
e 0 e uma constante que controla o
peso do grau sobre o custo.
Seja c(O) a funcao que determina o custo total de implementac ao da estrategia,
denida como o somatorio dos custos individuais c
j
, j = 1, 2, ..., h, de cada vertice de O,
conforme segue:
c(O) =
h

j=1
d(o
j
)

, o
j
O. (4.1)
Seja um orcamento b (tambem comumente denominado budget) disponvel para
14
contratar n os, dependente do tamanho e do grau medio da rede, tal que b = kn(d

), onde
k e uma frac ao do tamanho da rede.
Os criterios utilizados para determinar a tendencia de selec ao de n os s ao denomi-
nados polticas de selecao ou simplesmente polticas. Elas estabelecem quais n os ter ao
preferencia durante a etapa de contratac ao. A razao pela qual as polticas denem prefe-
rencias e que nem sempre o n o contratado pertence ao perl ideal da poltica. Isso se deve,
em certos casos, ` a diminuicao do orcamento e, em outros, ao esgotamento do perl de con-
tratac ao intencionado. Por exemplo, supondo-se uma poltica de selec ao focada em nos de
maior grau, os sucessivos contratos dessa natureza eventualmente reduzem o orcamento
a tal ponto que, em algum momento, somente nos de baixo grau serao contratados.
A performance p(O) da estrategia corresponde ao total de nos infectados ao m
da epidemia, ou seja, p(O) = max
t0
I(t).
4.2 Caracterizacao Emprica
Seja um modelo de rede (G(n, p) ou Barabasi-Albert), um tamanho de rede n,
um grau medio d, uma frac ao k de vertices para denic ao do orcamento, um conjunto
de valores para o threshold a, um conjunto de valores para a constante da func ao de
custo, e um conjunto de polticas de contratac ao. Esse conjunto de parametros, com
seus respectivos valores atribudos e denominado cenario de simulacao ou simplesmente
cenario.
Uma simulacao caracteriza-se pelo processo de, dado um cen ario, contratar n os e
espalhar a epidemia um n umero r de vezes, gerando gr acos relacionados ` a media das
itera coes. Uma nova rede e gerada estocasticamente a cada iteracao, baseada no modelo,
tamanho e grau medio preestabelecidos.
A estrategia e concebida em t = 0, mediante o contrato do maior n umero possvel
de vertices para um dado orcamento, ou seja, as contratacoes cessam apenas quando o
or camento restante for insuciente para cobrir o custo de qualquer outro n o da rede.
Desse ponto em diante, para favorecer a nota cao, as referencias ` a constante ser ao
feitas por meio do identicador alpha, ou seja, = alpha.
Vertices sao contratados com base nas polticas maior grau, menor grau, grau medi-
ano e grau aleatorio, denidas abaixo, lembrando que os respectivos algoritmos encontram-
15
se na Secao 5.2.1:
maior grau - vertices sao contratados em ordem decrescente de custo, respeitando
a viabilidade do orcamento. Por exemplo: supondo V = {v
1
, v
2
, v
3
, v
4
, v
5
, v
6
},
n = |V | = 6, com graus d(V ) = {1, 4, 2, 3, 2, 5} e constante alpha = 1, tem-se
c(V ) = {1, 4, 2, 3, 2, 5}. Supondo agora um orcamento b = 7 (desconsiderando aqui
a fun cao que o determina), o conjunto estrategia seria O = {v
6
, v
3
} ou O = {v
6
, v
5
}
dependendo de como o espaco amostral foi ordenado, visto que d(v
3
) = d(v
5
) = 2.
Em ambos os casos, h = |O| = 2.
menor grau - vertices s ao contratados em ordem crescente de custo. Por exemplo:
supondo os mesmos par ametros V , n, d(V ) e c(V ) do exemplo acima, e supondo
ainda um orcamento b = 6, o conjunto estrategia seria O = {v
1
, v
3
, v
5
}, com h =
|O| = 3 restando, nesse caso, um or camento residual b

= b c(O) = 1.
grau mediano - vertices sao contratados preferencialmente em torno da mediana do
espaco amostral determinado pelos graus dos vertices. O processo de contratac ao
afasta-se da mediana de forma intercalada para a direita e para a esquerda, iniciando
por convencao sempre `a direita. Por exemplo: supondo os mesmos V , n e c(V ) dos
exemplos anteriores, um orcamento b = 6 e uma constante = 1, os graus dos
vertices, dispostos em ordem crescente, seriam d(V ) = {1, 2, 2, 3, 4, 5}. A mediana,
desse modo, encontra-se entre o grau 2 e o grau 3. Pela descric ao, o afastamento da
mediana inicia-se pela direita, o que no caso corresponde ao grau 3. Como alpha = 1,
o vertice v
4
correspondente a esse grau tem custo c(v
4
) = d(v
4
)
1
= 3, sendo portanto
contratado. A seguir, o afastamento se d a pela esquerda, sendo analisado o grau
2, o qual e tambem contratado. Retomando ` a direita, o grau analisado sera o 4,
para cujo contrato n ao h a orcamento suciente, sendo portanto ignorado. Desse
momento em diante o afastamento ocorre somente pela esquerda, pois e garantido
que o orcamento nao mais poder a contratar pela direita (onde o custo s o aumenta).

E portanto considerada a segunda ocorrencia do grau 2, sendo porem ignorada pois


o orcamento tornou-se insuciente. Novamente se avanca ` a esquerda, contratando-se
por m o n o correspondente ao grau 1, esgotando-se o orcamento. Duas estrategias
s ao possveis: O = {v
4
, v
3
, v
1
} ou O = {v
4
, v
5
, v
1
}, dependendo de como o espaco
amostral foi ordenado, visto que d(v
3
) = d(v
5
) = 2.
16
grau aleatorio - vertices s ao contratados aleatoriamente, respeitando a viabilidade
do orcamento.
Ap os cada simula cao, os seguintes gracos s ao gerados: Distribuicao de Grau dos
Contratados, Frac ao de Infectados vs Tempo, Frac ao de Infectados vs [Poltica, threshold]
e Frac ao de Infectados vs [Poltica, alpha], apresentados e analisados no Captulo 6.
4.3 Pseudo-C odigo
O pseudo-c odigo exibido na Figura 4.1 diz respeito ` a vis ao geral da simula cao. Suas
duas principais etapas, porem, correspondentes ` a contratacao de nos e ao espalhamento
da epidemia, sao detalhadas nas Sec oes 5.2.1 e 5.2.2 respectivamente.
Figura 4.1: Pseudo-c odigo com uma vis ao geral da simulac ao.
4.4 Experimentos Realizados
As simula coes foram executadas sobre redes G(n, p) e Barab asi-Albert, todas de
componente conexo unico. Os seguintes valores atribudos aos par ametros s ao comuns a
17
todas as simulac oes:
tamanho da rede n = |V | = 10000;
threshold a = {1, 2, 3};
constante alpha = {0.5, 1, 2};
poltica = {maior grau, menor grau, grau mediano, grau aleatorio};
repetic oes r = 30 para cada a, para cada alpha e para cada poltica, totalizando
1080 repetic oes por simula cao.
Nota-se, com base na quantidade de combinacoes possveis, que o n umero de gra-
cos gerados e muito alto, tornando-se fundamental estabelecer cen arios que agreguem
ao objetivo do trabalho e evitem desperdcio de tempo e esforco computacionais com a
geracao de dados que retratam situac oes equivalentes, o que inclusive prejudica a etapa
de analise de resultados.
Os cen arios escolhidos para simulac ao precisaram levar isto em conta. O tama-
nho da rede escolhido (10 mil vertices) deve-se ao fato de ser desej avel uma rede ao
mesmo tempo grande o suciente para a observac ao da dinamica epidemica e com bom
desempenho computacional. O emprego de 30 repetic oes confere aos gracos intervalos
de conanca bem representativos das tendencias epidemicas de cada poltica. Os valores
atribudos aos demais parametros buscam aumentar o entendimento sobre os impactos
desses mesmos par ametros na disseminac ao. Seja, por exemplo, a constante : em 0.5 ela
faz o custo aumentar lentamente conforme avalia-se o contrato de n os com graus cada vez
maiores; em 1 faz o custo crescer linearmente com o grau; em 2 faz o custo crescer mais
rapidamente que o grau.
As epidemias simuladas correspondem a estes cinco cen arios:
1. Redes Barabasi-Albert com grau medio d = 4 e fracao de vertices k = 0.05
2. Redes Barabasi-Albert com grau medio d = 8 e fracao de vertices k = 0.01
3. Redes G(n, p) com grau medio d = 8 e frac ao de vertices k = 0.01
4. Redes G(n, p) com grau medio d = 8 e frac ao de vertices k = 0.05
18
5. Redes G(n, p) com grau medio d = 9 e frac ao de vertices k = 0.05
A razao para a escolha desses cen arios encontra-se no incio do Captulo 6.
4.5 Metricas
As metricas analisadas nesse estudo sao enumeradas a seguir.

E v alido ressaltar que
a cada cenario nao necessariamente as mesmas metricas foram analisadas, visto que cada
um tem o proposito de capturar fenomenos especcos. Considerados todos os cenarios
porem, chega-se ao seguinte conjunto de metricas, extradas para todas as polticas:
Distribuic ao de Grau dos vertices semeadores;
Fra cao de nos infectados / Tempo;
Fra cao de nos infectados / par [poltica, alpha], xado um threshold;
Fra cao de nos infectados / par [poltica, threshold], xado um alpha;
Captulo 5
O Simulador
A seguir sao detalhadas as caractersticas principais do simulador de epidemias
desenvolvido para esse trabalho.
5.1 Visao Geral
O simulador utilizado no estudo foi desenvolvido na linguagem R [12], a qual ofe-
rece recursos poderosos para manipulacao de massa de dados, alem de bibliotecas tanto
para confecc ao de gr acos altamente personalizaveis quanto para manipula cao eciente
de grafos, o que permitiu concentrar o desenvolvimento nas questoes acerca da simulacao
em si.
Para confecc ao dos gr acos foram utilizadas as bibliotecas sciplot [13] e Cairo [14].
Dos recursos do sciplot empregados, destacam-se a montagem de gr acos com sobre-
posic ao de curvas, legendas mais informativas e melhor alocadas, calculo e exibic ao de
intervalos de conanca por regras edit aveis, e salvamento de gr acos em arquivos de ima-
gem. O pacote Cairo permitiu aplicar antialiasing aos gracos produzidos.
Para a gerac ao e manipulac ao das redes foi utilizado o pacote igraph [15].
Ate aqui, as referencias ` a parte computacional do trabalho sugerem a existencia
de um unico c odigo, o que embora tenha facilitado o entendimento das caractersticas ja
apresentadas, n ao e verdade. Tratam-se de dois codigos distintos, um para cada modelo de
rede. Tal separac ao deve-se aos seguintes fatos: cada tipo de rede e gerado obedecendo a
processos distintos; cada modelo emprega um conjunto pr oprio de par ametros de entrada;
algumas operacoes s ao especcas de cada modelo.
20
A junc ao em c odigo unico, portanto, prejudicaria a legibilidade do codigo e a per-
formance de execuc ao, pois cada operacao especca ` a um modelo implicaria uma operac ao
previa de selecao do modelo. Alem disso, o simulador foi concebido em linguagem inter-
pretada, n ao dispondo, portanto, das otimizac oes comuns `as linguagens compiladas. Por
m, como mostra o pseudo-codigo da Sec ao 4.3, h a quatro blocos de repeti cao aninhados.
Quanto mais interno o laco, maior o impacto de se incluir uma nova operac ao. Em vista
de todos esses motivos, a separac ao dos codigos foi realizada.
Todos os codigos de simulacao encontram-se disponveis em:
https://github.com/rchiesse/simuladoresEpidemicos
5.2 Implementacao
Os proximos sub-topicos apresentam os detalhes de implementac ao que contribuem
para um melhor entendimento das etapas da simulacao.
5.2.1 Algoritmos de Contratacao
A seguir, da Figura 5.1 a 5.4, s ao exibidos os algoritmos de contratac ao implemen-
tados no simulador.
21
Figura 5.1: Algoritmo de contrata cao de maior grau.
Figura 5.2: Algoritmo de contrata cao de menor grau.
22
Figura 5.3: Algoritmo de contrata cao de grau mediano.
23
Figura 5.4: Algoritmo de contrata cao de grau aleat orio.
24
5.2.2 Algoritmo da Epidemia
A Figura 5.5 exibe o algoritmo da etapa de propaga cao da epidemia.
Figura 5.5: Algoritmo de propagacao da epidemia.
5.3 Recursos Complementares
Os recursos oferecidos pelos simuladores desenvolvidos n ao est ao restritos ao escopo
desse estudo. Um deles e a metrica Tempo Total da Epidemia/Poltica de Contrata cao,
que pode ser bem conveniente em certos casos, embora nao perten ca ao conjunto de
resultados aqui analisados.
A seguir s ao relacionados brevemente os demais m odulos e funcionalidades adicio-
nais. Maiores detalhes sobre cada um constam no proprio c odigo do simulador, disponvel
no link indicado anteriormente.
5.3.1 Visualizador de Epidemias
Este recurso tem proposito meramente ilustrativo, nao sendo apropriado para redes
grandes. Por meio desta ferramenta e possvel visualizar todas as etapas do processo
epidemico, desde a deni cao da estrategia ate o ultimo passo da epidemia. Considere,
25
por exemplo, o cenario: rede G(n, p) com n = 10 vertices e p = 4/n = 0.4; or camento
arbitr ario b = 10; peso do grau alpha = 1; threshold de infec cao a = 1; poltica de
contrato por maior grau. Aplicado no visualizador, uma possvel sequencia de exibic ao
deste cenario, da esquerda para a direita e de cima para baixo, e a da Figura 5.6.
Figura 5.6: Etapas de uma infeccao, geradas pelo Visualisador de Epidemias.
Pela sequencia exibida na Figura 5.6, pode-se notar a inuencia do orcamento na
escolha dos nos semeadores 1 e 4, destacados inicialmente, em 5.6(a). Apos contratar
o vertice 1 cujo grau (de valor 6) corresponde ao maior da rede, o orcamento restante
n ao foi suciente para custear n os de grau 5 (caso dos n os 6 e 10), contratando assim
26
o no 4, de grau 4, e esgotando-se em seguida.
Na Figura 5.6(b) sao destacadas as arestas incidentes sobre vertices suscetveis
que cumprem a condi cao de infecc ao, ou seja, possuem um mnimo de dois vizinhos
infectados. A infecc ao destes ocorre em 5.6(c). O mesmo processo se repete a cada etapa,
evidenciando o efeito do threshold (de valor 1) sobre o comportamento da infeccao. A cada
passo, apenas n os que possuem mais de um vizinho infectado em um tempo t infectam-
se em t + 1. O vertice 2, por exemplo, embora vizinho direto de um dos semeadores,
infectou-se somente apos decorridos 3 tempos da epidemia, em 5.6(g), quando nalmente
sua restric ao de threshold foi satisfeita pelos nos 1 e 8.
Neste exemplo toda a rede foi infectada, mas isso nem sempre acontece. Supondo
um n o de grau 1 presente nessa rede, o mesmo n ao se infectaria pois seu threshold jamais
seria satisfeito. Em vista disso, para deixar sempre claro para o usuario o momento em
que um processo epidemico chega ao m, o visualizador escurece o fundo da imagem,
como mostra o ultimo quadro da sequencia ilustrada, em 5.6(h).
5.3.2 Polticas Adicionais de Contratacao
Embora ate aqui as polticas mencionadas tenham sido todas relacionadas ao grau
do vertice, o simulador tambem permite a contrata cao por duas outras polticas, baseadas
nas centralidades de Closeness e Betweenness respectivamente. Informac oes sobre os
conceitos teoricos de tais centralidades podem ser encontradas em [15] e a aplicac ao no
simulador encontra-se descrita no proprio c odigo fonte.
5.3.3 Simulador de Redes Externas
Tambem e possvel submeter qualquer rede externa interpret avel pelo igraph ` as
simulac oes, existindo um c odigo especco para tanto, que a recebe como argumento de
entrada.
Captulo 6
Analise dos Resultados
Neste captulo sao apresentados os principais resultados obtidos das simulac oes,
assim como as analises realizadas a partir desses resultados. Convem pontuar que, cada
cen ario proposto gera um total de 33 gr acos. Sendo cinco os cen arios, totaliza-se 165
gr acos, o que exigiu para esse estudo uma selec ao dos resultados considerados mais
expressivos, baseada nos fenomenos e comportamentos identicados.
O primeiro cenario analisado e o de Redes Barab asi-Albert, com grau medio d = 4
e frac ao de vertices k = 0.05. As Figuras 6.1, 6.2 e 6.3 mostram a distribuicao de grau
dos n os contratados, nas etapas onde alpha - o peso do grau no custo do no - assume os
valores 0.5, 1 e 2, respectivamente.
Antes da an alise propriamente dita, e para um melhor entendimento dos resulta-
dos, e preciso uma descric ao da maneira como um graco de Distribuic ao de Grau dos
Contratados e confeccionado pelo simulador.
Cada gr aco dessa natureza apresenta 4 (quatro) distribui coes, uma para cada
poltica, xando um valor comum de alpha. Importa notar que, o valor do threshold,
embora exibido na legenda, n ao tem nenhuma inuencia sobre as distribuicoes, dado que
nem o calculo do orcamento nem do custo do vertice, e nem mesmo os algoritmos de
contrata cao empregam esse parametro. Cada distribuicao presente no gr aco e resultante
do conjunto uni ao de todos os n os contratados ao longo das 30 itera coes. O que se exibe,
portanto, e a distribui cao desse conjunto resultante.
A razao de tal abordagem e o fato de que n ao necessariamente os mesmos graus
ocorrem a cada iterac ao, dado que cada nova rede e gerada por um processo nao determi-
nstico. Por m, as legendas localizadas no canto superior direito de cada graco indicam,
28
Figura 6.1: Distribuic ao de grau dos contratados em cen ario Barab asi-Albert com d = 4
e k = 0.05, quando alpha = 0.5.
Figura 6.2: Distribuic ao de grau dos contratados em cen ario Barab asi-Albert com d = 4
e k = 0.05, quando alpha = 1.
29
Figura 6.3: Distribuic ao de grau dos contratados em cen ario Barab asi-Albert com d = 4
e k = 0.05, quando alpha = 2.
em notac ao abreviada, os valores referentes a cada par ametro. As correspondencias de
abreviatura s ao: tsh = threshold; gm = grau medio; a = alpha; k = fracao de vertices
para calculo de or camento; rep = repeticoes; v = total de vertices da rede. Esta mesma
notac ao foi empregada em todos os demais gracos gerados.
Retomando a analise do cen ario, observa-se na Figura 6.2 que os sucessivos contra-
tos da poltica de maior grau apresentaram um comportamento intrigante: a disposic ao
da maioria dos graus em linha reta. Isto signica que a probabilidade de um vertice de
grau d = k ser contratado por essa poltica, dada uma rela cao linear entre grau e custo
(alpha = 1), tende a ser a mesma para qualquer k.
Considerando agora as polticas menor grau e grau mediano, percebe-se que, para
alpha = 0.5 (Fig. 6.1) e alpha = 1 (Fig. 6.2), ambas as polticas contratam todos os nos
com exatamente o mesmo grau d. Mais que isso, esse grau e especicamente d = 2, o
menor da rede. Constata-se aqui um comportamento consequente da estrutura da rede.
Uma das consequencias da distribuic ao de grau por Lei de Potencia, caracterstica das
redes Barab asi-Albert, e a elevada quantidade de vertices de grau mnimo na rede (em
torno de 80% do total). Por um lado, e imediato constatar que a poltica de menor grau
30
sempre contrata nos de grau mnimo. De fato, pela deni cao, o orcamento disponvel nesse
cen ario e b = nk(d)

= 100000.05(4)
1
= 2000. Sendo o grau mnimo d = 2, o montante
permite o contrato de 2000/2 = 1000 vertices de grau mnimo. Tal quantidade, de fato,
est a muito abaixo do total de n os de grau mnimo da rede disponveis para contrato (mais
de 8000 n os). Quando, porem, e considerada a poltica de grau mediano, e preciso estimar
o quanto os sucessivos contratos se afastar ao da mediana pela direita, aproximando-se da
ocorrencia de graus maiores que o mnimo. Pela denicao do algoritmo de contratac ao
por grau mediano, conclui-se que contratos ` a direita ocorrem, no m aximo, na metade dos
casos, o que aqui representa 500 vertices. Tal n umero encontra-se ainda muito abaixo
do total de n os de grau mnimo presentes na rede. Em vista disso, conclui-se que a
distribuic ao observada para ambas as polticas e coerente com os resultados te oricos.
Quanto ` a distribuicao de grau da poltica de grau aleatorio, em todos os tres casos
(Figuras 6.1 a 6.3) e interessante notar a caracterstica de sua curva: aproxima-se de uma
linha reta. Os eixos dos gr acos encontram-se em escala logartmica, o que signica que a
distribuic ao observada segue uma Lei de Potencia, tal como a distribui cao da propria rede
em si. Isso se deve ao car ater aleatorio das contrata coes, ao qual impoem-se as mesmas
distribuic oes de probabilidades da rede.
S ao analisados a seguir os gracos de Frac ao de Infectados vs Tempo, os quais
exibem o progresso da epidemia. Tambem aqui e necess ario, primeiramente, detalhar o
processo de confec cao destes gracos.
Cada ponto exibido em um gr aco de Fra cao de Infectados vs Tempo exibe, para
um dado tempo t, a media aritmetica da fracao infectada em cada uma das 30 repetic oes
naquele dado tempo.

E, portanto, cumulativo e emprega intervalos de conanca quando
necess ario. Tendo em vista que as 30 repeticoes nao contemplam todas as possibilidades de
frac ao para um tempo t, percebe-se que a media calculada e amostral e nao populacional.
Outro ponto e que o desvio padr ao precisa ser determinado `a partir do espa co amostral.
Por esses motivos, a distribuic ao utilizada para o calculo dos intervalos de conanca foi a
t de Student [16], com nvel de conanca em 95%.
Nos gracos da Figura 6.4 nota-se que, para alpha = 0.5, a poltica de maior grau
contrata uma quantidade de nos que corresponde a aproximadamente 1/4 do n umero de
semeadores de menor grau. Ainda assim, seu desempenho e claramente melhor ate t = 5,
quando a epidemia j a infectou em torno de 90% da rede. Isso ocorre pois os vertices de
31
Figura 6.4: Comparac ao da Frac ao de Infectados vs Tempo em cen ario Barabasi-Albert
com d = 4 e k = 0.05, para alpha = 0.5 (acima) e alpha = 1 (abaixo).
32
maior grau s ao necessariamente centrais nas redes Barab asi-Albert. Desse fato constata-
se que, dado um mesmo orcamento, a poltica de maior grau contratou muito menos nos
que a de menor grau mas, ainda assim, teve melhor performance durante a infecc ao de
grande parte da rede. Curioso notar, porem, que a poltica de menor grau, ao nal, foi
a mais rapida. Isso possivelmente se deve ` a interferencia do threshold: partindo-se do
grau menor para o maior, a conectividade da rede aumenta, fazendo com que o threshold
interra cada vez menos na velocidade da propagacao; partindo-se do grau maior para o
menor, porem, seu impacto e cada vez mais expressivo, chegando ao maximo quando o
grau do n o suscetvel e d = 2. A epidemia pela poltica de menor grau n ao sofre tanto esse
impacto justamente porque uma parte desses verticesde mais difcil acessoj a se encontra
infectada inicialmente, e a conectividade da rede a partir da s o aumenta. Constata-se,
em vista disso, que a decisao sobre a melhor poltica a ser adotada dentre essas duas
depende do contexto: uma oferece melhor performance na maior parte do tempo; a outra,
no tempo nal.
Observa-se tambem que a poltica de menor grau sempre contratar a mais vertices
conforme aumenta o valor de . Mais que isso, pode-se armar que o total de contratados
dessa poltica depende exclusivamente da frac ao k utilizada para determinar o orcamento,
como segue: seja b = (d

)nk o orcamento disponvel, conforme a deni cao; seja tambem


o grau mnimo d
min
de uma rede Barabasi-Albert, o qual equivale a d/2. O custo para se
contratar n vertices de grau mnimo sera, desse modo,
n(d
min
)

= n(
d
2
)

. (6.1)
A relac ao entre o orcamento e o custo de se contratar graus mnimos e, portanto,
b
n(d
min
)

=
(d

)nk
n(
d
2
)

= 2k. (6.2)
Isto e, quando = 1, a poltica de menor grau contrata exatamente 2k vertices. Por
raciocnio an alogo, pode-se determinar a rela cao quando = 2. Nesse caso, a relac ao
entre o orcamento e o contrato de n graus mnimos vale
(d

)nk
n(
d
2
)

=
(d
2
)nk
n(
d
2
)
2
=
(d
2
)nk
(
(nd
2
)
4
)
= 4k. (6.3)
Conrma-se, desse modo, que aumentar implica aumentar a estrategia de menor grau.
33
Ainda na Figura 6.4, analisando o gr aco onde alpha = 1 em contraste ao de cima,
e possvel notar que (i) a poltica de maior grau e muito sensvel a variac oes de alpha e
(ii) as demais, embora tambem sensveis a alpha, reetem impactos muito menores sobre
seu comportamento em geral.
Para melhor ilustrar o quanto a poltica de maior grau e afetada por alpha, e
apresentada na Figura 6.5 um caso extremo, correspondente ao segundo cen ario simulado.
Ali constata-se que, preservados os demais parametros, variar alpha de 0.5 para 1 signicou
retirar a estrategia de maior grau de um contexto onde infectava toda a rede, para um
outro onde a epidemia sequer chega a existir.
Retomando o cen ario original, observando agora a poltica de grau aleatorio da
Figura 6.4, percebe-se uma evolucao epidemica pr oxima a das polticas de menor grau
e grau mediano, embora sempre abaixo quanto ao desempenho. Quando alpha = 0.5,
a diferenca e sutil; quando alpha = 1, porem, a distincao torna-se mais evidente. Tal
comportamento e resultante do peso que os n os de maior grau exercem sobre o orcamento
quando contratados aleatoriamente. Como ja visto, graus muito elevados ocorrem com
baixa probabilidade, mas n ao s ao desprezveis. Quando alpha = 0.5, o custo desses graus
e bem menor, resultando da que contratos aleat orios dessa natureza implica deducoes
mais brandas no or camento. Em contrapartida, para alpha = 1 estes mesmos contratos
fazem com que o orcamento diminua mais rapidamente e, por consequencia, contratem
menos vertices.
Prosseguindo nesse cen ario, s ao apresentadas a seguir comparacoes baseadas nos
gr acos Fracao de Infectados vs [Poltica, alpha] (Figura 6.6) e Frac ao de Infectados vs
[Poltica, threshold] (Figura 6.7). A confecc ao de ambos obedece aos mesmos processos
descritos para os demais gr acos. A peculiaridade destes, porem, encontra-se no eixo X,
o qual n ao representa um par ametro mas sim um par de parametros. Quando xado
um alpha, o eixo X exibe todas as combinacoes Poltica - threshold simuladas; xado
um threshold, exibe todas as combina coes Poltica - alpha, analogamente. Para conferir
maior leveza `a notac ao, foram abreviados os nomes de exibicao das polticas, conforme
segue: al = grau aleatorio; ma = maior grau; md = grau mediano; me = menor grau.
Nas Figuras 6.6 e 6.7 os comportamentos expressos demonstram que a epidemia,
em quase todos os casos, e mais sensvel a mudancas de threshold que a mudancas de alpha,
` a excessao da poltica de maior grau. De fato, na Figura 6.6, onde threshold = 1, somente
34
Figura 6.5: Comparac ao da Frac ao de Infectados vs Tempo em cen ario Barabasi-Albert
com d = 8 e k = 0.01, para alpha = 0.5 (acima) e alpha = 1 (abaixo).
35
Figura 6.6: Compara cao da Frac ao de Infectados vs [Poltica, alpha] em cenario Barab asi-
Albert com d = 4 e k = 0.05, para threshold = 1 (acima) e threshold = 2 (abaixo).
36
Figura 6.7: Comparac ao da Fracao de Infectados vs [Poltica, threshold] em cen ario
Barab asi-Albert com d = 4 e k = 0.05, para alpha = 0.5 (acima) e alpha = 2 (abaixo).
37
os contratos por maior grau tiveram seu desempenho inuenciado pela varia cao de alpha,
ainda assim, somente para alpha = 2. Observando-se agora a Figura 6.7, a despeito de
um conjunto de par ametros distintos, encontra-se expressa a mesma percepc ao obtida na
analise da Figura 6.6. Aqui, porem, um outro fenomeno tambem se observa: o aumento
de alpha e favor avel ao desempenho das polticas de menor grau e grau mediano e, ao
mesmo tempo, prejudicial `as demais, conforme j a visto.
A seguir, s ao apresentadas an alises acerca do terceiro cen ario de espalhamento
epidemico: Redes G(n, p), com grau medio d = 8 e frac ao de vertices k = 0.01. As
Figuras 6.8, 6.9 e 6.10 mostram os gr acos de Frac ao de Infectados vs Tempo para essa
simulac ao.
Figura 6.8: Frac ao de Infectados vs Tempo em cen ario G(n, p) com d = 8 e k = 0.01,
para alpha = 0.5.
Uma constatac ao imediata, ao analis a-las, e de que as epidemias das estrategias de
menor grau e grau mediano evoluem de forma bem distinta para qualquer alpha. Esse e
um grande contraste em relac ao ao comportamento dessas mesmas estrategias nos cen arios
Barab asi-Albert. Atesta-se aqui, novamente, a grande inuencia que a estrutura da rede
exerce sobre a dinamica epidemica.
Considerando agora as quatro polticas, outro fen omeno bem interessante se apre-
senta: A grande sensibilidade da epidemia ` a variacao do alpha para todas as estrategias,
38
Figura 6.9: Frac ao de Infectados vs Tempo em cen ario G(n, p) com d = 8 e k = 0.01,
para alpha = 1.
Figura 6.10: Fracao de Infectados vs Tempo em cen ario G(n, p) com d = 8 e k = 0.01,
para alpha = 2.
em oposicao aos cen arios anteriores. Mais que isso, tal impacto chega mesmo ao ponto de,
para alpha = 2, provocar desdobramentos completamente distintos para cada epidemia.
39

E fundamental compreender que, do aumento aplicado a alpha, derivam-se fenomenos de


efeitos opostos: De um lado, isso implica um orcamento maior; de outro, eleva tambem
o pre co dos vertices, tanto mais rapido quanto maior o grau destes. Ambos os efeitos
derivam da pr opria denic ao das func oes de orcamento e de custo apresentadas. Diante
desse fato, surgem tres possibilidades quando aumentado o valor de alpha: contratar mais
vertices, dado que o or camento disponvel e maior; contratar menos vertices, dado que
o custo desses aumentou; contratar em torno da mesma quantidade, sob uma rela cao
mutuamente excludente entre or camento e custo. Qual dessas condi coes prevalescer a no
momento da contratac ao e algo que depende da poltica. Para a de maior grau, o custo
contratual pesa muito mais que o ganho orcamentario, isto e, o aumento de recursos e
insuciente para que o n umero de contratados seja, no mnimo, equivalente ao do cenario
anterior. S ao contratados menos vertices e, portanto, a performance diminui. O contr ario
se da com a poltica de menor grau - os n os contratados tem graus menores ou iguais
ao grau medio (Figura 6.11), o que signica que o orcamento cresce mais que o custo,
contratando mais nos e, consequentemente, melhorando sua performance.
As polticas de grau mediano e grau aleatorio s ao melhor observadas comparati-
vamente. Para alpha = 0.5, ha menor distinc ao entre ambas as performances. Conforme
alpha aumenta, suas respectivas epidemias desdobram-se com maior diferenca. A poltica
aleat oria e mais sujeita a utuac oes estatsticas - e mais sensvel a variac oes de custo dos
vertices. Sempre que um vertice de grau elevado e contratado, a dedu cao correspondente
no orcamento e muito mais expressiva, provocando uma diminui cao muito mais acentuada
no montante disponvel e, consequentemente, no total de contratados. Ja a poltica me-
diana tem natureza mais determinstica (e isso nao depende da rede), jamais assimilando
os nos mais caros ` a estrategia e, por isso mesmo, nunca sofrendo dedu coes orcamentarias
proximas do custo m aximo a cada novo semeador contratado. Seu or camento nao est a,
portanto, sujeito a quedas bruscas, tal como ocorre na abordagem aleat oria.
O aumento do alpha, desse modo, confere ` a mediana maior poder de contratac ao.
Comparada ` a poltica aleatoria, a de grau mediano consegue contratar mais vertices,
consequentemente apresentando melhor performance.
As distribuic oes de grau dos contratados para cada poltica sao exibidas na Fi-
gura 6.11.
40
Figura 6.11: Comparativo da Distribuic ao de Grau dos contratados em cen ario G(n, p)
com d = 8 e k = 0.01, para alpha = 0.5, 1 e 2.
41
O pr oximo cenario e o de Redes G(n, p), com grau medio d = 8 e fracao de vertices
k = 0.05. A Figura 6.12 mostra um comparativo dos gracos de Frac ao de Infectados vs
Tempo para essa simulac ao, quando alpha = 0.5 e alpha = 1.
No que diz respeito ` as polticas de grau aleatorio e grau mediano, e not avel a
semelhanca de desempenho. Esse e mais um comportamento resultante da inuencia da
estrutura da rede sobre a propagac ao. De fato, quando comparadas ambas as polticas nos
cen arios de redes Barab asi-Albert, a referida semelha ca n ao se verica. Intuitivamente,
essa proximidade de ambos os desempenhos para este cen ario G(n, p) sugere que as res-
pectivas distribuic oes de grau dos contratados s ao bem parecidas. Observa-se, porem, na
Figura 6.13, que esse n ao e o caso. Isto signica que vertices diferentes foram contratados
em cada caso e, ainda assim, disseminaram epidemias semelhantes. A explica cao para o
fato e a caracterstica binomial da distribuic ao do G(n, p). As probabilidades concentram-
se em torno da media, nao ocorrendo o fen omeno de cauda pesada. Por consequencia, a
mediana da amostragem corresponde tambem ` a media da amostragem. Baseando-se em
tais considerac oes, e por m constatado que a abordagem mediana resulta em contratos
de nos cujo grau corresponde ` a media. Ainda, a abordagem aleat oria, pela distribuic ao
binomial de probabilidade a qual obedece, contrata vertices em torno da media.
O ultimo cenario analisado e o de Redes G(n, p), com grau medio d = 9 e frac ao
de vertices k = 0.05. As considerac oes, porem, s ao feitas em comparac ao com um dos
resultados obtidos no ultimo cenario, onde uma rede, tambem G(n, p) com k = 0.05,
possua d = 8. A Figura 6.14 mostra um comparativo de gr acos de Frac ao de Infectados
vs Tempo entre essas simula coes.

E importante notar que, para esse graco, todos os
par ametros tem seus valores mantidos, ` a excessao do grau medio, o qual varia de d = 8
para d = 9. Percebe-se que o simples aumento do grau medio, de uma unidade, e suciente
para alterar o comportamento de todas as polticas. Pouco muda em relac ao ` as estrategias
de maior e menor grau. A estrategia de abordagem aleat oria mostra um consideravel
ganho de performance. Ainda mais impressionante, porem, e constatar a varia cao no
comportamento da poltica de grau mediano. Quando atuante em uma rede onde d = 8,
n ao logrou infectar sequer 10% dos n os. A mesma abordagem, no entanto, no contexto
em que d = 9, infecta a rede por completo. Importante notar, ainda, que o tempo total da
epidemia para essa poltica, conforme exibe o graco, nao necessariamente corresponde
ao ultimo ponto de sua curva. Considerados os intervalos de conanca, observa-se que,
42
Figura 6.12: Comparativo da Frac ao de Infectados vs Tempo em cenario G(n, p) com
d = 8 e k = 0.05, quando alpha = 0.5 (acima) e alpha = 1 (abaixo).
43
Figura 6.13: Comparativo da Distribuic ao de Grau dos contratados em cen ario G(n, p)
com d = 8 e k = 0.05, para alpha = 0.5 e alpha = 1.
44
Figura 6.14: Comparativo da Fra cao de Infectados vs Tempo entre os cen arios G(n, p) de
k = 0.05, quando d = 8 (acima) e d = 9 (abaixo).
45
para algumas das simula coes, sua epidemia atingiu toda a rede, por exemplo, ja no tempo
t = 18. Esse fen omeno que, sob pequenas modicac oes estruturais na rede, dispara o
processo de infecc ao, j a e conhecido no universo de estudo de Epidemias em Rede. Existem
estudos que mostram que h a um limite te orico para a congurac ao dos par ametros da
rede, como o grau medio e o threshold de infeccao dos vertices, acima do qual a epidemia
ocorre [4]. Tal condi cao e formalmente denominada Transicao Epidemica.
Se os par ametros de incio da infecc ao possuem valores acima dessa congurac ao
mnima, a epidemia espalha-se pela rede inteira. Se abaixo, porem, a epidemia termina
rapidamente e com baixa performance.
Captulo 7
Conclusao
Pelo estudo de Epidemia em Redes busca-se o entendimento sobre a din amica pela
qual inuencias propagam-se em uma rede. O estudo apresentado procurou ampliar tal
vis ao por meio de dados empricos, considerando em sua modelagem o Marketing Vi-
ral, o qual gura-se um dos mais ostensivos desdobramentos do conceito de semeadura
epidemica. A compreens ao dos diversos mecanismos pelos quais as informac oes se proli-
feram numa rede pode ter benefcios signicativos. Do ponto de vista do Marketing Viral
permite, por exemplo, estabelecer estrategias de divulgac ao mais ecazes e econ omicas.
Nesse sentido, compreender os referidos comportamentos em estruturas mais basicas e
a chave para a formulac ao de abordagens analticas que sejam capazes que extrair tais
informacoes de estruturas mais complexas. O estudo emprico realizado demonstrou fatos
muito interessantes a respeito, baseando-se em redes vastamente estudadas.
Os cen arios escolhidos para simulac ao buscaram capturar os fenomenos e as cau-
sas de determinadas variac oes de comportamento, observadas conforme alteravam-se: as
estruturas das redes; as condi coes de semeadura; e as condicoes de espalhamento da epi-
demia.
A partir das an alises, foi intrigante notar os v arios casos onde, dados dois princpios
de epidemia, iniciados `a primeira vista de forma equivalente, a disseminac ao de ambos
ocorreu de maneira totalmente distinta.
Foi possvel constatar empiricamente a ocorrencia do que a teoria chama de Tran-
sicao Epidemica, implicando comportamentos completamente distintos para uma mesma
estrategia, dependendo isto exclusivamente da conectividade da rede.
Tambem vericou-se que, nas redes cuja distribuic ao segue uma Lei de Potencia,
47
expressas aqui pelas redes Barab asi-Albert, o peso utilizado para estimar tanto o orca-
mento quanto o custo do n o, de um modo geral, interfere pouco na performance nal
das polticas, ` a excecao do maior grau. Justamente o contr ario foi observado nas redes
G(n, p), onde cada peso dado ` a relacao orcamento-custo repercutiu signicativamente no
comportamento de todas as estrategias.
Observou-se tambem que a simples mudanca na estrutura da rede provoca que
polticas comportem-se ora de forma equivalente, ora de formas bem distintas. Nesse
sentido, as estrategias de menor grau e grau mediano mostraram-se equivalentes apenas
em Redes Barab asi-Albert. Por outro lado, as polticas de grau aleatorio e grau mediano
comportaram-se de forma similar apenas nas redes G(n, p).
Constatou-se, ainda, que em redes G(n, p) a poltica de grau mediano, muito em-
bora nao apresente o melhor desempenho de um modo geral, demonstra maior estabilidade
sob variacoes de alpha. Sua adocao e, portanto, particularmente interessante nos casos
onde nao se conhece muito sobre a estrutura da rede, mas sabe-se que sua distribui cao
n ao segue uma lei de potencia. Esse e um possvel contexto de atuac ao de campanhas de
Marketing Viral.
Por m, identicou-se que, sob certas condic oes, a melhor poltica depender a do re-
sultado que se espera, conforme ilustrado no primeiro cen ario proposto. Nele, identicou-
se que a estrategia de maior grau, muito mais rapidamente que as demais, infecta em torno
de 90% da rede. Porem, a epidemia que infecta primeiro a toda a rede e a da estrategia
de menor grau.
Uma contribui cao desse trabalho e a disponibilizac ao de um simulador de epide-
mias, adaptado aos estudos atuais sobre Marketing Viral, capaz de gerar diversos gr acos
para suporte a estudos empricos, e contemplando o modelo de threshold para epidemias.
Outra contribuic ao e a massa de dados aqui analisada, a qual auxilia a entender um pouco
melhor alguns dos comportamentos acerca das dinamicas epidemicas.
7.1 Possveis Melhorias
Pode ser interessante aplicar uma modicac ao nas polticas de contratac ao de ver-
tices por Maior Grau e Menor Grau, de modo a analisar previamente a centralidade de
autovetor de cada vertice elegvel. Sabe-se que vertices cuja tal centralidade assume va-
48
lores elevados est ao ligados a vertices inuentes na rede [17]. Nesse caso, os algoritmos
de contratacao de vertices dessas polticas poderiam, para cada grau avaliado, identicar
quais vertices possuem a maior centralidade de autovetor e, entao, contrat a-los. Intuitiva-
mente as estrategias determinadas com o auxlio dessa metrica apresentarao performance
igual ou superior (e nunca inferior) ` aquelas estabelecidas pelos algoritmos apresentados
neste trabalho, possivelmente conferindo ao orcamento uma aplica cao mais ecaz. A ava-
liac ao emprica pode revelar comportamentos bem interessantes nesse sentido. Exemplos
de estudos sobre a identica cao de vertices inuentes em uma rede s ao apresentados em[18]
e [7]. Ainda, sua determinacao, ao contrario de metricas como Closeness e Betweenness,
e computacionalmente bem mais viavel.
7.2 Diculdades Encontradas
A linguagem R, embora ofereca diversos recursos, como j a mencionado, tem tam-
bem algumas desvantagens relacionadas principalmente ao desempenho computacional e
gerenciamento de mem oria. A passagem de parametros de suas func oes da-se apenas
por c opia; o codigo e interpretado e, consequentemente, n ao dispoe das otimizac oes que
linguagens compiladas oferecem; a linguagem e fracamente tipada, o que se torna ruim
conforme o tamanho do c odigo aumenta; no R, os blocos de repeticao do tipo for desperdi-
cam muita mem oria pela criacao desnecessaria de vetores - refatorac oes de contorno foram
realizadas; os blocos de repeti cao do R s ao, de maneira geral, muito lentos em relac ao a
funcao apply(), porem a utiliza cao da mesma e muito restrita; a escrita de codigo inline
mostra desempenho notavelmente superior `a abordagem de chamada de func ao. Como a
necessidade de ganho de desempenho era um fator muito importante, a escrita foi quase
totalmente assim congurada, diminuindo sua legibilidade. Dentre as medidas tomadas
para atenuar o problema, denotam-se o c odigo amplamente comentado e os nomes de
vari aveis autoexplicativos na medida do possvel, tornando seu prop osito mais intuitivo.
Alguns dos motivos para menor performance n ao eram obvios. Por exemplo, du-
rante a simulac ao, os dados coletados eram adicionados a uma estrutura de dados de-
nominada, na terminologia do R, um data frame. O data frame e a entidade do R que
permitiu a geracao dos gr acos apresentados e pode ser entendido como um agregado he-
terogeneo de agregados homogeneos, isto e, uma especie de matriz onde cada linha pode
49
conter dados de diferentes tipos, mas cada coluna possui um tipo apenas. Embora fosse
possvel adicionar os resultados de cada iterac ao ao data frame diretamente, pesquisas
revelaram que trabalhar com matrizes numericas durante o processo iterativo, e somente
ao nal converter tal matriz para um data frame, e entao adicionando nele as colunas n ao
numericas, representava um ganho de desempenho signicativo. Porem s ao necess arias
estruturas auxiliares para permitir essa abordagem, o que torna o c odigo mais denso e
menos legvel.
7.3 Trabalhos Futuros
Uma sugest ao de trabalho futuro seria implementar a metrica descrita na Sec ao 7.1.
Outro ponto a considerar seria a implementac ao do simulador na linguagem C++, tambem
suportada pelo igraph, para um ganho de desempenho computacional. Isto permitiria
aplicar simulac oes em redes muito maiores, com mais rapidez e melhor utilizac ao de
mem oria.
Referencias Bibliogracas
[1] D. R. Figueiredo, Introduc ao a redes complexas, 2011.
[2] Network science, 2012. http://barabasilab.neu.edu/networksciencebook.

Ultimo
acesso em 03/01/2014.
[3] Viral Marketing, 2008. http://cmginteractive.com/.

Ultimo acesso em 04/01/2014.
[4] M. E. J. Newman, Introduction to Networks. Oxford University Press, 1 ed., 2010.
[5] ErdosRenyi model, 2013. http://en.wikipedia.org/wiki/Erd%C5%91s%E2%80%9-
3R%C3%A9nyi model.

Ultimo acesso em 13/01/2014.
[6] Barab asiAlbert model, 2013. http://en.wikipedia.org/wiki/Barab%C3%A1si%E2-
%80%93Albert model.

Ultimo acesso em 13/01/2014.
[7] S. Aral, L. Muchnik e A. Sundarajan, Engineering Social Contagions: Optimal
Network Seeding in the Presence of Homophily. Forthcoming in Network Science,
2003.
[8] W. Chen, Y. Yuan e L. Zhang, Scalable Inuence Maximization in Social Networks
under the Linear Threshold Model, IEEE International Conference on Data Mining
(ICDM), 2010.
[9] N. Pathak, Ar. Banerjee e J. Srivastava, A Generalized Linear Threshold Model for
Multiple Cascades, IEEE International Conference on Data Mining (ICDM), 2010.
[10] M. Granovetter, Threshold Models of Collective Behavior, The American Journal
of Sociology, vol. 83, no. 6, pag. 14201443, 1978.
[11] D. R. Figueiredo, Epidemic Seeding in Networks, 2013.
50
51
[12] The R Foundation for Statistical Computing, 2013. http://www.r-
project.org/foundation/.

Ultimo acesso em 12/01/2014.
[13] Scientic Graphing Functions for Factorial Designs, 2013. http://www.inside-
r.org/packages/cran/sciplot/docs/lineplot.CI.

Ultimo acesso em 12/01/2014.
[14] R graphics device using cairo graphics library for creating high-quality bitmap (PNG,
JPEG, TIFF), vector (PDF, SVG, Postscript) and display (X11 and Win32) output.,
2013. http://cran.r-project.org/web/packages/Cairo/index.html.

Ultimo acesso em
12/01/2014.
[15] Network analysis and visualization, 2013. http://cran.r-
project.org/web/packages/igraph.

Ultimo acesso em 12/01/2014.
[16] Distribuic ao t de Student, 2013. http://pt.wikipedia.org/wiki/Distribui%C3%A7%-
C3%A3o t de Student.

Ultimo acesso em 13/01/2014.
[17] L. Spizzirri, Justication and Application of Eigenvector Centrality, 2011.
[18] D. Kempe, J. Kleinberg e E. Tardos, Maximizing the Spread of Inuence through a
Social Network, 2003.

Você também pode gostar