Você está na página 1de 2

Discussão Redes Complexas 1

O questionamento acerca de machine learning resultar em modelagens ‘a-teóricas’ é válido,


ciência de dados não é ciência: prever subidas ou quedas de preços não explica razões para
sua subida ou descida. No entanto, a aprendizagem de máquina gera modelos matemáticos,
apenas eles não são interpretáveis à luz dos conhecimentos matemáticos atuais – não temos
ferramentais analíticos que nos permitam elencar propriedades das funções geradas que
comprimam informação acerca delas, de onde o uso de simulações numéricas se tratar de uma
estratégia aceitável em nosso estado atual de desenvolvimento matemático. Outros desafios
metodológicos decorrem deste e serão apresentados adiante.

Pretendo integrar duas linhas de estudos: (a) Matemático-computacional na simulação de


redes propícias à geração de comportamentos complexos. (b) Aplicação de medidas
estatísticas na aferição de correspondências ou não entre os padrões obtidos nas simulações e
bases de dados empíricas. Há ausência de consenso acerca de em até que ponto simulações
computacionais como as propostas por Barabasi1 são aplicáveis a redes empíricas de modo a
explicar eventuais processos subjacentes. Uma primeira dificuldade diz respeito ao
estabelecimento de métodos estatísticos suficientes para aferir em bases públicas as
características pretendidas em distribuições power law. Em resposta às críticas de Broido e
Clauset (BC)2, Barabasi argumenta que os critérios pretendidos por esses últimos, e que os
levam a concluir pela não aplicabilidade do modelo BA (Barabasi-Albert), igualmente não
permitiriam reconhecer redes artificialmente geradas por simulações computacionais seguindo
critérios de preferential attachment e geração randômica de vértices 3. Incapaz de identificar
redes reconhecidamente geradas por estes processos, a metodologia utilizada na crítica por BC
seria igualmente inválida.

Em parte, as razões para o não estabelecimento de métricas adequadas para aferição empírica
decorrem da própria vagueza matemática dos conceitos envolvidos 4. Barabasi argumenta pela
inexistência de redes power law puras na natureza, o que implicaria na necessidade de se
proporem famílias de distribuições estatísticas mais gerais, ainda não bem especificadas
matematicamente. Proposições envolvendo distribuições lognormais, intermediárias entre
exponenciais e power law, são tentativas nesse sentido, mas a imprecisão matemática do que
se pretende por redes ‘scale free’ ou ‘heavy tailed’ permanece, ainda que consideradas
‘visualmente identificáveis’ por Barabasi. Essa vagueza do desenvolvimento atual, no entanto,
pode não necessariamente implicar na inviabilidade de metodologias baseadas em simulações
computacionais, tratando-se tão somente de uma das fronteiras epistemológicas da ciência
atual. Entendo haver 4 desafios envolvidos na pretensão de se estabelecer uma teoria geral de
redes: (i) matemático, (ii) computacional, (iii) de instrumentação, (iv) de medidas estatísticas.

A ausência de soluções matemáticas (i) analíticas para equações não-lineares, em particular


equações caóticas, demanda soluções numéricas computacionalmente custosas 5, (ii). A

1
“Emergence of Scaling in Random Networks”, Barabasi.
2
“Scale-free networks are rare”, Broido e Clauset.
3
All you need is love”, Barabasi.
4
“Scant Evidence For Power Laws Found in Real-World Networks.”, Erica Klarreich: “Critics object that
terms like “scale-free” and “heavy-tailed” are bandied about in the network science literature in such
vague and inconsistent ways as to make the subject’s central claims unfalsifiable.”.
5
Sistemas caóticos como a gravitação de 3 corpos, mapas logísticos ou autômatos celulares de Wolfram
e Conway se caracterizam por um conjunto de regras simples, mas que geram padrões complexos. Em
teoria da complexidade algorítmica, o correspondente a tais sistemas são programas com baixa
complexidade de Kolmogorov, mas com longo tempo de processamento na geração de strings
aparentemente aleatórias no que diz respeito a testes estatísticos, ainda que elas sejam altamente
sensibilidade a condições iniciais de sistemas caóticos reflete esse custo computacional e leva
a problemas de instrumentação, visto a sensibilidade a ruídos de sistemas com estas
características inviabilizar medidas com precisão adequada (iii). Essa última característica, por
sua vez, resulta em maior dificuldade no estabelecimento de métricas estatísticas na detecção
de padrões que correspondam aos gerados pelos processos computacionalmente simulados 6.
Sendo assim, o objetivo inicial de estudo é realizar simulações para verificar na prática as
dificuldades que se apresentam na obtenção de critérios estatísticos para identificar redes
geradas por processos computacionais. Caso sejam obtidos métodos satisfatórios na
classificação das redes simuladas, aplicar esses mesmos critérios em bases de dados públicas.

Devo utilizar a biblioteca NetworkX do Python nas simulações. Para além de processos
gerativos e de preferential attachment, em que vértices e ligações são geradas mas nunca
destruídas, pretendo utilizar versões adaptadas para redes de sandpile models 7. A ideia é
identificar quais parametrizações para colapsos (avalanches) obtêm processos capazes de
originar topologias small world, scale free e power law, assim como dinâmicas em edge of
chaos8. A seguir, utilizar critérios estatísticos na tentativa de identificar tipos de distribuição
geradas por essas parametrizações. Em caso de sucesso na identificação de processos
simulados, aplicar os mesmos critérios a redes empíricas, como feito por Broido e Clauset em
The Colorado Index of Complex Networks (ICON) (https://icon.colorado.edu/#!/).

regulares em verdade (strings com lógica profunda, ou deep logics, An introduction to Kolmogorov
Complexity, Vitányi, sec.7.7). Teorias da física usualmente possuem grande capacidade de compactação
informacional no sentido de Kolmogorov, mas casos com tempos de processamento demasiado longos
demandando simulações apenas surgem em sistemas caóticos, dada a própria natureza das equações
envolvidas nesses casos. Suponho que seja possível aplicar estas métricas para eventualmente
quantificar a intensidade da característica edge of chaos em sistemas dinâmicos (talvez effective
complexity seja melhor para edge of chaos). A proposta do uso de sandpile models em redes,
mencionada mais adiante, busca exatamente gerar dinâmicas nesse sentido.
6
Apesar de bons resultados em física, a detecção de comportamentos caóticos em outras áreas é
questionável. Um grande volume de artigos em economia foi publicado durante certo período, como
Deterministic Chaos and Fractal Attractors as Tools for Nonparametric Dynamical Econometric Inference
(Barnet e Chen), por exemplo, na detecção de expoentes de Lyapunov e de dimensões fractais, mas o
ramo passou posteriormente por um período de estagnação. Na modelagem de propagações
epidêmicas, há artigos contra e a favor da possibilidade de serem detectados padrões caóticos na
propagação do sarampo, por exemplo (não localizei os artigos, que havia estudado há mais tempo).
7
Ver Complex Adaptive Dynamical Systems (Claudius Gros) e Dynamic Network Generative Model
(Habiba & Tanya).
8
Métodos para detecção empírica de expoentes de Lyapunov e dimensões fractais talvez possam ser
utilizados (ver rodapé 6), uma vez que a característica scale-free poderia ser entendida uma topologia
fractal, mas a literatura que encontrei acerca da assertividade desses métodos é controversa.

Você também pode gostar