Você está na página 1de 195

Tiago Badre Marino

TRATAMENTO DE INFORMAES GERADAS A


PARTIR DE FONTES DE COLABORAO
HETEROGNEAS PARA APOIO RESPOSTA EM
EMERGNCIAS

TESE DE DOUTORADO

Rio de Janeiro
2015

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO


INSTITUTO DE MATEMTICA
INSTITUTO TRCIO PACITTI DE APLICAES E PESQUISAS COMPUTACIONAIS
PROGRAMA DE PS-GRADUAO EM INFORMTICA

TIAGO BADRE MARINO

TRATAMENTO DE INFORMAES GERADAS A


PARTIR DE FONTES DE COLABORAO
HETEROGNEAS PARA APOIO RESPOSTA EM
EMERGNCIAS
Tese de Doutorado apresentada ao Programa de
Ps-Graduao em Informtica, Instituto de
Matemtica, Instituto Trcio Pacitti de
Aplicaes e Pesquisas Computacionais,
Universidade Federal do Rio de Janeiro, como
parte dos requisitos necessrios obteno do
grau de Doutor em Informtica.

Orientadores:
Prof. Marcos Roberto da Silva Borges, Ph.D.
Profa. Maria Luiza Machado Campos, Ph.D.

Rio de Janeiro
2015

Marino, Tiago Badre


TRATAMENTO DE INFORMAES GERADAS A PARTIR DE FONTES DE
COLABORAO HETEROGNEAS PARA APOIO RESPOSTA EM EMERGNCIAS /
TIAGO BADRE MARINO. Rio de Janeiro: UFRJ, 2015.
195 f.: il.
Tese de Doutorado em Informtica Universidade Federal do Rio de Janeiro,
Instituto de Matemtica, Instituto Trcio Pacitti de Aplicaes e Pesquisas
Computacionais, Programa de Ps-Graduao em Informtica, 2015.
Orientadores: Marcos Roberto da Silva Borges, Maria Luiza Machado Campos
1. Fontes de Informaes Heterogneas. 2. Sistemas Complexos. 3. Colaborao. 4.
Integrao de Informao. 5. Apoio Deciso. 6. Gesto de Emergncias. I. Marcos
Roberto da Silva Borges (Orient.). II. Maria Luiza Machado Campos (Coorient.). III.
Universidade Federal do Rio de Janeiro. Instituto de Matemtica. Instituto Trcio
Pacitti. IV. Ttulo.
CDD.

TRATAMENTO DE INFORMAES GERADAS A PARTIR DE


FONTES DE COLABORAO HETEROGNEAS PARA APOIO
RESPOSTA EM EMERGNCIAS
Tiago Badre Marino

Tese de Doutorado apresentada ao Programa de


Ps-Graduao em Informtica, Instituto de
Matemtica, Instituto Trcio Pacitti de
Aplicaes e Pesquisas Computacionais,
Universidade Federal do Rio de Janeiro, como
requisito parcial obteno do ttulo de Doutor
em Informtica.
Aprovado em 26/06/2015

__________________________________________________________

Prof. Marcos Roberto da Silva Borges, Ph.D., UFRJ (Presidente)

__________________________________________________________

Profa. Maria Luiza Machado Campos, Ph.D., UFRJ

__________________________________________________________

Profa. Jonice de Oliveira Sampaio, D.Sc., UFRJ

__________________________________________________________

Profa. Adriana Santarosa Vivacqua, D.Sc., UFRJ

__________________________________________________________

Prof. Jorge Xavier da Silva, Ph.D., UFRJ

__________________________________________________________

Profa. Flvia Maria Santoro, Ph.D., UNIRIO

__________________________________________________________

Prof. Jugurta Lisboa Filho, D.Sc., UFV

Aos meus amados pais. Saudade imensa.


Sigo em frente, com vocs nas minhas melhores lembranas...

AGRADECIMENTOS
Aos Professores e orientadores cientficos desta tese, Marcos Roberto da Silva
Borges e Maria Luiza Machado Campos, pelo apoio e conhecimentos transmitidos durante o
desenvolvimento, e tambm pelo compromisso assumido e empenho que dedicaram a este
trabalho. Agradeo ainda, pela anlise de cada captulo, as sugestes, os esclarecimentos e
comentrios, sempre oportunos, que espero ter sabido aproveitar, e claro, por acreditarem em
mim desde o incio desta longa, porm velocssima jornada.
Universidade Federal Rural do Rio de Janeiro (UFRRJ) e meus companheiros de
departamento, por acreditarem em meu projeto e permitirem que eu pudesse estabelecer e
dedicar-me parcialmente s minhas pesquisas de doutorado.
Aos incansveis Professores Jorge Xavier da Silva e Maria Hilde de Barros Goes,
meus gurus, amigos, grandes incentivadores, maiores responsveis por hoje eu trilhar a vida
acadmica, com muita satisfao e motivao em converter o conhecimento adquirido em
benefcios para nossa sociedade. Serei eternamente grato aos conhecimentos transmitidos,
de inestimvel valor.
Aos professores John Breslin e Maciej Dabrowiski, do Digital Enterprise Research
Institute/National University of Ireland (DERI/NUIG), na cidade de Galway, Repblica da
Irlanda, que abraaram minha pesquisa e pelos ensinamentos e orientaes de grande valia,
das quais pude absorver novas e valiosas contribuies para este trabalho. Por toda simpatia,
ateno e colaborao na disponibilizao de dados fundamentais aos experimentos
realizados no trabalho, quando lhes foram solicitados e tambm pelas crticas construtivas
durante nossas sesses de acompanhamento da pesquisa.
Ainda em Galway - simptica cidade que me acolheu durante quase um ano - meus
cumprimentos so extensivos aos colegas do grupo Social Software, contribuindo sempre
com boas dicas e referncias. No esquecendo tambm dos companheiros estrangeiros e
brasileiros que l estiveram e partilharam comigo alguns momentos descontrados: meus
companheiros da equipe de vlei da NUIG, Nicholas Ciuferri e Petre Stefanov; e meus
companheiros de pesquisa no DERI, Joo Carlos Pereira, Andr Freitas e Bianca Pereira.
Estendo meus agradecimentos Coordenao de Aperfeioamento de Pessoal de
Nvel Superior (CAPES), que me apoiou financeiramente durante o estgio de doutorado
sanduche no exterior e tornou este projeto possvel.

Agradeo tambm valiosa contribuio e cordialidade dos coordenadores das


Organizaes No Governamentais Mission 4636 e Sahana Eden em partilhar as suas
bases de dados comigo, para fins de experimentao nesta pesquisa de tese.

Estas

Organizaes desempenharam um papel essencial e notrio em atividades de coleta,


organizao e divulgao de informaes relacionadas ajuda humanitria durante a
resposta ao terremoto ocorrido em Porto Prncipe (Haiti), em janeiro de 2010. As bases de
dados cedidas foram fundamentais para a elaborao de um cenrio de experimentao que
retratasse fidedignamente as circunstncias reais de uma emergncia.
Aos meus colegas do Laboratrio de Emergncias, Fabrcio Firmino, Cristiano
Expedito, Ins Bosca, Augusto Escobar por participarem e colaborarem ativamente em
minhas pesquisas. Tambm aos meus colegas de doutorado do PPGI, em especial Bruno
Nascimento e Kelli Cordeiro, grandes colaboradores nesta pesquisa, fomentada por boas
discusses e alguns trabalhos em parceria.
Secretaria do Programa de Ps-Graduao em Informtica, em especial ao
funcionrio Anibal Ferreira, pelo constante e eficiente apoio na soluo de questes
burocrticas junto Universidade. Seu apoio foi tambm fundamental para a viabilizao do
meu estgio no exterior.
Por ltimo, porm no menos importante, minha famlia. Meu pai Mario Marino (in
memoriam), maior incentivador e entusiasta deste projeto, meu heri, lutador na fico e na
vida real. Minha mame, Lourdes Helena (in memoriam), minha grande companheira, sem
dvidas o maior amor da minha vida. Hoje cuidam de mim de l de cima. Minha incansvel
valente e durona sndica, vov dona Hell-Nice.
verdadeiros amigos Tedinho e Fernando Marino.

Meus irmos, grandes parceiros e


Aos melhores padrinhos do mundo,

queridos Fonseca e Janete.


No posso deixar tampouco de agradecer minha famlia de corao, em especial aos
meus irmos Bruno, Fernanda, Marcinho, Vav e meus pais adotivos Jorge Tubagi e Jos
Luiz Schmidt. E finalmente, minha amvel companheira e parceira de caminhada e aventuras
pelo mundo, Maria Augusta e sua linda famlia, que me abraaram e deram foras para
seguir em frente, e pela pacincia...

RESUMO
MARINO, Tiago Badre. Tratamento de Informaes Geradas a Partir de Fontes de
Colaborao Heterogneas para Apoio Resposta em Emergncias. 2015. 195 f. Tese
(Doutorado em Informtica). Instituto de Matemtica, Instituto Trcio Pacitti, Universidade
Federal do Rio de Janeiro, Rio de Janeiro, 2015.
O envolvimento de cidados no enfrentamento de crises no mais novidade. O advento de
novas tecnologias de informao e comunicao aliado popularizao de dispositivos
mveis criam oportunidades para o aumento da gerao de informao contextual originada
atravs da participao social. No passado a escassez de dados constitua uma das principais
barreiras impostas aos gestores pblicos no processo de tomada de deciso. Hoje a situao
se inverte, quando o desafio est em gerenciar um excesso de dados, totalmente dinmicos
e provenientes de distintas fontes: sensores remotos ambientais, redes sociais, equipes de
campo, imagens de satlite, mdia. Em um ambiente de emergncia, a preocupao no mais
se d em coletar dados para exercer uma melhor leitura do ambiente afetado, mas sim em
saber organizar, integrar, classificar e separar o que de fato til ao gestor da emergncia
para cada fase de resposta. Entretanto, para organizar e integrar necessrio promover um
diagnstico inicial sobre o conjunto de dados disponibilizados por cada fonte de
informaes. necessrio, por exemplo, identificar em cada fonte considerada, quem, onde,
quando, em que situao a informao foi originada. Deve-se tambm compatibilizar o
formato de dados das fontes de modo a possibilitar comparaes, agrupamentos e o
estabelecimento de associaes de informaes correlatas. Em suma, preciso estruturar e
organizar a informao processada de modo que, quem venha a consumi-la disponha de boas
condies para determinar se tal informao ou no til para a tomada de deciso.
Portanto, este estudo tem por objetivo a concepo e experimentao de uma arquitetura de
tratamento da informao colaborativa que considera os aspectos da complexidade do
ambiente no contexto de emergncias e, a partir da coleta e integrao de informaes
originadas de fontes heterogneas, busca promover o enriquecimento do conhecimento
contextual atual e, desta forma, apoiar a deciso dos gestores da resposta a emergncias.

Palavras-chave: Fontes de Informaes Heterogneas, Sistemas Complexos, Colaborao,


Integrao de Informao, Apoio Deciso, Gesto de Emergncias.

ABSTRACT
MARINO, Tiago Badre. Processing Information Generated from Heterogeneous
Collaborative Sources to Support Emergencies Response. 2015. 195 p. Thesis (Doctor in
Computer Science). Instituto de Matemtica e do Ncleo de Computao Eletrnica da
Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2015.
The involvement of citizens supporting crisis situations is not new. The advent of new
information and communication technologies coupled with the popularization of mobile
devices raises opportunities for increasing generation of contextual information originated
through social participation. Formerly, lack of data was one of the main barriers to public
managers in the decision-making process. Nowadays the situation is reversed as the
challenge is to manage data in excess, dynamic and originated from different sources:
remote sensors, social networks, response field teams, satellite images, media. During an
emergency response situation, a main concern is no longer to collect data for a better
understanding of the affected environment, but in knowing how to organize, aggregate and
separate what is actually useful to the manager on each emergency response phase.
However, for this to happen, it is necessary to identify data structure and meaning (metadata)
associated to each information resource (SMS, e-mail, social networks, environmental
sensors, information originated from field agents, etc.). For each source, it is necessary to
identify who, where, when, and under which circumstances the information has been
originated. It also contemplates matching of data format of information sources, in order to
allow comparisons, clustering procedures and associations among correlated information. In
summary, it is necessary to structure and organize the acquired information so that
consumers are able to determine whether or not such information is useful for decision
making. Therefore, this research aims to design and experiment an architecture for treatment
of collaborative information that considers environmental complexity aspects in the context
of emergencies and, by collecting and integrating information derived from heterogeneous
sources, aims to enrich current contextual knowledge and thus support decision makers
during emergency responses.

Keywords: Heterogeneous Information Sources, Complex Systems, Crisis and Disaster


Management, Collaboration, Information Integration, Decision Support, Emergency
Management.

Lista de Figuras
Figura 1.1. Sequncia das diferentes fases de um evento emergencial e a diviso setorial dos
grupos de trabalho da equipe UNDAC durante respostas a desastres. Adaptado de OCHA
(2012)...................................................................................................................................... 25
Figura 1.2. Mapa conceitual dos tipos de conhecimentos que apoiam a fase de resposta de
uma emergncia. Adaptado de Diniz et al. (2005) ................................................................. 26
Figura 1.3. Cenrio clssico de resposta a emergncias: dificuldades de acesso, comunicao
e aquisio de informao ...................................................................................................... 28
Figura 1.4. Agentes de aquisio de dados ambientais e meios de comunicao hoje
disponveis no apoio a construo do conhecimento contextual atual ................................... 30
Figura 2.1. Porcentagem da populao usuria de smartphones por pas. Fonte:
OurMobilePlanet.com............................................................................................................. 41
Figura 2.2. Mashup de colaborao social atravs das redes sociais para o apoio a desastres
(ESRI, 2013) ........................................................................................................................... 44
Figura 2.3. As redes sociais propagam informaes com rapidez: pouso de emergncia do
avio da empresa US Airways no Rio Hudson, em janeiro de 2009. Informao publicada
apenas 10 minutos aps o pouso de emergncia da aeronave.

Fonte: Publicao no

microblog Twitter do usurio Janis Krums ............................................................................ 45


Figura 2.4. a) Portal VC NO G1: aproveitamento da colaborao comunitria para a
divulgao de matrias jornalsticas. Fonte: Globo.com; b) Portal Digital Journal:
utilizao de informaes obtidas a partir da colaborao social para a publicao de notcias
................................................................................................................................................ 46
Figura 2.5. Mapa de crise do projeto Ushahidi/Haiti: mapeamento categorizado sobre
incidentes relevantes submetidos pela populao haitiana aps o terremoto do Haiti (2010).
Adaptado de Ushahidi............................................................................................................. 49
Figura 3.1. Identificao de elementos e interaes de um sistema complexo adaptativo: o
meio ambiente......................................................................................................................... 53
Figura 3.2. Organizao da gesto da emergncia em diferentes escalas .............................. 57

Figura 3.3. Evoluo da base de conhecimento contextual atravs de ciclos de feedbacks de


reforo ..................................................................................................................................... 58
Figura 3.4. Distintos aspectos da heterogeneidade no contexto de informaes colaborativas
em situaes de emergncia: a) tipos de agentes geradores de informao colaborativa; b)
meios de comunicao; c) idioma de comunicao ................................................................ 60
Figura 4.1. (a) Avaliaes de deslizamentos por equipes de campo em Terespolis RJ; (b)
Plataforma de coleta e envio remoto de dados estruturados em formulrios eletrnicos
atravs dispositivos mveis (MARINO et al., 2012) ............................................................. 74
Figura 4.2. Atributos de uma publicao da rede social Twitter: destaque da informao das
coordenadas geogrficas do local corrente do emissor no momento da publicao .............. 76
Figura 4.3. Diferena entre a localizao geogrfica corrente do informante e o evento ao
qual ele se refere em uma informao colaborativa publicada atravs de uma rede social.... 77
Figura 4.4. Insero da informao da localidade do evento relatado em uma publicao na
rede social Facebook............................................................................................................... 78
Figura 4.5. Teste de localizao do emissor do e-mail a partir do IP do cabealho da
mensagem na ferramenta WolframAlpha ............................................................................... 79
Figura 5.1. Plataforma Vicon/SAGA: mdulo autnomo de entrada de dados por meio de
dispositivos mveis (MARINO et al., 2012) .......................................................................... 91
Figura 5.2. Linha do tempo referente ao perodo de coleta de mensagens e ocorrncia dos
eventos monitorados por Hugues e Palen. Adaptado de Hugues e Palen (2009) .................. 92
Figura 5.3. Workflow da plataforma Ushahidi. Adaptado de Heinzelman e Waters (2010) .. 94
Figura 5.4. (a) Arquitetura da plataforma EMERSE; (b) Mdulo de entrada de dados para
iPhone. Adaptado de Caragea et al. (2011) ........................................................................... 99
Figura 5.5. Cenrio exemplo para coordenao das ofertas e necessidades atravs das mdias
sociais. Adaptado de Purohit et al. (2013)........................................................................... 104
Figura 5.6. Plataforma MicroMappers: interface colaborativa para anlise e classificao das
mensagens e imagens capturadas do microblog Twitter ...................................................... 108
Figura 5.7. Estratgia da equipe vencedora do desafio Red Ballon Challenge: poltica de
recompensa baseada em marketing multinvel para recrutar participantes .......................... 111

Figura 6.1. Arquitetura para coleta e tratamento de informaes colaborativas no apoio


deciso em ambientes de emergncia ................................................................................... 113
Figura 6.2. Workflow: agentes, processos e interaes envolvidas no ciclo operacional de
gerao, coleta e tratamento da informao colaborativa no contexto de emergncias ....... 116
Figura 6.3. Vocabulrio de referncia para associao de atributos equivalentes e anotao
semntica de publicaes coletadas ...................................................................................... 124
Figura 6.4. Processo [AAV] Associar Atributos ao Vocabulrio: os atributos das
informaes coletadas a partir de diferentes fontes so mapeados e associados com base no
vocabulrio de referncia ...................................................................................................... 125
Figura 6.5. ndice de Correlao: comparao pareada entre publicaes armazenadas no
repositrio de coleta e processamento e a publicao ingressante no processo [EPC]
Encontrar Publicaes Correlatas ....................................................................................... 131
Figura 6.6. Representao ilustrativa dos distintos perodos de validade temporal para
informaes relativas a eventos e entidades ......................................................................... 134
Figura 6.7. Anotao semntica da publicao tratada segundo o padro RDF: informao
sobre os atributos temporal, espacial e taxonmico e suas correlaes com outras
publicaes armazenadas no repositrio de coleta e processamento .................................... 136
Figura 6.8. Exemplo de atributos conflitantes entre publicaes que constituem uma histria
.............................................................................................................................................. 137
Figura 6.9. Analista de informaes analisa o conflito e decide pelo encaminhamento da
situao ................................................................................................................................. 138
Figura 6.10. O Conhecimento Combinado que apoia as Equipes de Deciso uma
propriedade emergente da conjugao dos Conhecimentos Pessoal Anterior, Formal Anterior
e Contextual Atual. Adaptado de Diniz et al. (2005) ........................................................... 139
Figura 6.11. Feedbacks propiciam o enriquecimento e a evoluo da base de conhecimento a
cada novo ciclo de maturao da informao. ...................................................................... 140
Figura 6.12. Organicidade Funcional: conjunto de subsistemas com processamentos internos
singulares, conectados entre si, formando uma unidade coletiva ......................................... 141

Figura 6.13. Multiescalaridade: coleta e tratamento de informao colaborativa para a


construo da base de conhecimento contextual atual. Numa escala mais ampla, combinao
de diferentes tipos de conhecimentos para a formao do conhecimento combinado ......... 142
Figura 7.1. Interface de gerenciamento de fontes de informaes da plataforma experimental
SocialCol. Fonte: Plataforma SocialCol. ............................................................................. 147
Figura 7.2. Parmetros de configurao de uma fonte de informao e resultado do
diagnstico executado sobre o script de coleta e publicao carregado na plataforma
experimental SocialCol. Fonte: Plataforma SocialCol. ....................................................... 148
Figura 7.3. Interface da plataforma experimental SocialCol para associao dos atributos de
uma fonte de informao com termos do vocabulrio de referncia. Fonte: Plataforma
SocialCol............................................................................................................................... 150
Figura 7.4. Interface para o gerenciamento de classes para o evento experimental Terremoto
em Porto Prncipe (Haiti) na plataforma SocialCol. Fonte: Plataforma SocialCol............ 151
Figura 7.5. Classes atribudas a uma publicao aps o processamento de [CLA]
Classificar na plataforma experimental SocialCol. Fonte: Plataforma SocialCol. ............ 152
Figura 7.6. Possibilidade de personalizar parmetros e a equao para o clculo do ndice de
Correlao entre publicaes na plataforma experimental SocialCol.

Fonte: Plataforma

SocialCol............................................................................................................................... 153
Figura 7.7. Exemplo de publicaes extradas da base de dados experimental para o clculo
do ndice de Correlao e deciso quanto ao agrupamento em histria na plataforma
SocialCol. Fonte: Plataforma SocialCol. .............................................................................. 153
Figura 7.8. Disposio cronolgica das publicaes de uma histria em forma de Linha do
Tempo na plataforma experimental SocialCol. Fonte: Plataforma SocialCol. .................. 154
Figura 7.9. Interface para identificao de atributos quantitativos em publicaes na
plataforma experimental SocialCol. Fonte: Plataforma SocialCol. ..................................... 155
Figura 7.10. Identificao de conflitos de informaes em uma histria na plataforma
SocialCol. Fonte: Plataforma SocialCol. Fonte: Plataforma SocialCol. ............................. 155
Figura 7.11. Interface para a resoluo de conflitos supervisionada na plataforma
experimental SocialCol. Fonte: Plataforma SocialCol. ....................................................... 156

Figura 7.12. Bases de dados carregadas na plataforma para a experimentao. Fonte:


Plataforma SocialCol. ........................................................................................................... 157
Figura 7.13. Amostra da base de informaes Ushahidi referente ao terremoto em Porto
Prncipe, Haiti (2010). .......................................................................................................... 159
Figura 7.14. Base de informaes cedida pela iniciativa Sahana Foundation referente s
solicitaes de ajuda enviadas pela populao aps o terremoto em Porto Prncipe, Haiti
(2010).................................................................................................................................... 160
Figura 7.15. A imagem publicada atravs da rede social Flickr retrata o resgate de um
cidado debaixo de escombros aps terremoto em Porto Prncipe, em janeiro de 2010. Fonte:
Flickr ..................................................................................................................................... 161
Figura 7.16. Registros dos sensores da USGS referente aos sismos ocorridos na regio do
Haiti entre janeiro e fevereiro de 2010. Fonte: USGS. ........................................................ 162
Figura 7.17. Amostra da base de informaes recebidas e tratadas pela iniciativa Mission
4636 durante a fase de resposta ao terremoto do Haiti (2010). .......................................... 163
Figura 7.18. Relatrio de registro de informao coletada a parit de vistorias de campo pela
equipe CENACID/UFPR durante atividades de resposta ao terremoto do Haiti (2010). ..... 165
Figura 7.19. Hospitais do Haiti catalogados pela organizao PAHO. ................................ 166
Figura 8.1. A similaridade entre duas publicaes agrupadas numa mesma histria pode ser
notada a partir da inspeo visual. O resultado atesta a efetividade da heurstica elaborada
para a arquitetura .................................................................................................................. 174
Figura 8.2. A deteco duplicidade similar evidencia um caso tpico ocorrido na rede
social Flickr: submisses sucessivas de um nico emissor retratam um mesmo evento...... 175

Lista de Quadros
Quadro 1.1. Benefcios e desvantagens de monitoramento voluntrio. Adaptado de Gouveia
e Fonseca (2008) ..................................................................................................................... 32
Quadro 3.1. Quadro quantitativo de referncias sobre atributos da qualidade de dados.
Adaptado de Amaral (2003) ................................................................................................... 61
Quadro 4.1. Caracterizao de distintas fontes de informao colaborativa segundo aspectos
de disponibilidade e estrutura de dados, formatao, frequncia de publicao e
confiabilidade do emissor ....................................................................................................... 68
Quadro 5.1. Fontes de informao e aspectos relacionados ao tratamento da informao
colaborativa abordados pelas principais referncias de apoio consultadas ............................ 87
Quadro 5.2. Exemplo de mensagens apresentadas em seu texto original (no estruturado) e
sua representao estruturada, gerada automaticamente. Adaptado de Purohit et al. (2013)
.............................................................................................................................................. 105
Quadro 6.1. Fontes de informaes e suas respectivas referncias documentao API .... 120
Quadro 6.2. Exemplo de entradas e resultados do processamento de publicaes no processo
[CFD] Compatibilizar Formato de Data ........................................................................... 127
Quadro 6.3. Definies das propriedades dos Sistemas Complexos e suas respectivas
associaes com os elementos da arquitetura de soluo e o ambiente de emergncia ....... 143

Lista de Grficos
Grfico 6.1. Comportamento da distribuio do ndice de Correlao Espacial (C esp) segundo
diferentes formulaes .......................................................................................................... 132
Grfico 7.1. Distribuio da quantidade de publicaes associadas s classes do evento aps
o processamento de [CLA] Classificar na experimentao. Fonte: Plataforma SocialCol.
.............................................................................................................................................. 169
Grfico 7.2. Distribuio da quantidade de pares de publicaes correlacionadas agrupadas
por intervalos de valores do ndice de Correlao, aps o processamento de [EPC]
Encontrar Publicaes Correlatas na experimentao. Fonte: Plataforma SocialCol........ 170
Grfico 7.3. Resultado processamento de [AGR] Agrupar em Histrias na experimentao:
quantidade de histrias formadas e sua distribuio em funo da mdia do ndice de
Correlao entre as publicaes que compem cada histria. Fonte: Plataforma SocialCol.
.............................................................................................................................................. 170
Grfico 7.4. Participao das fontes de informaes em histrias.

Fonte: Plataforma

SocialCol............................................................................................................................... 171
Grfico 7.5. Tempo de processamento de uma publicao para cada etapa de tratamento
estabelecida na arquitetura de soluo. Fonte: Plataforma SocialCol. ................................ 172
Grfico 7.6. Tempo total, em minutos, para o processamento da base de dados experimental
segmentado pelos processos da arquitetura. Fonte: Plataforma SocialCol.......................... 172

Lista de Siglas
3G

Terceira Gerao

4G

Quarta Gerao

API

Application Programming Interface

CAS

Complex Adaptive System

CENACID

Centro de Apoio Cientfico em Desastres

CSCW

Computer Supported Cooperative Work

CSCWD

Conference on Computer Supported Cooperative Work in Design

DARPA

Defense Advanced Research Projects Agency

DCMI

Dublin Core Metadata Initiative

DDD

Discagem Direta a Distncia

ETL

Extract, Transform, Load

GPS

Global Position System

GPRS

General Packet Radio Service

HTML

HyperText Markup Language

IP

Internet Protocol

LAGEOP

Laboratrio de Geoprocessamento

LBS

Location Based Services

LOD

Linked Open Data

LOV

Linked Open Vocabularies

MOAC

Management of a Crisis

NLP

Natural Language Processing

ONG

Organizao No Governamental

ONU

Organizao das Naes Unidas

OCHA

Office for the Coordination of Humanitarian Affair

PHP

Personal Home Page

REST

Representational State Transfer

RDF

Resource Description Framework

SIG

Sistema de Informao Geogrfica

SIM

Subscriber Identity Module

SIOC

Semantically-Interlinked Online Communities

SMS

Short Message Service

SMOB

Semantic MicroBlogging

UFRJ

Universidade Federal do Rio de Janeiro

UFPR

Universidade Federal do Paran

UNDAC

United Nations Disaster Assessment & Coordination

URL

Uniform Resource Locator

USGS

United States Geological Survey

VICON

Vigilncia e Controle

W3C

World Wide Web Consortium

XML

eXtensible Markup Language

Siglas dos Componentes da Arquitetura de Soluo


[COMU]

Fase de Comunicao

[COL]

Coletar Publicaes

[FED]

Requisitar Feedback

[PREP]

Fase de Pr-Processamento

[AAV]

Associar Atributos ao Vocabulrio

[VTF]

Verificar e Tratar Feedback

[CFD]

Compatibilizar Formato de Data

[CFC]

Compatibilizar Formato de Coordenadas

[VID]

Verificar Idioma

[CLA]

Classificar

[HIST]

Fase de Histrias

[EPC]

Encontrar Publicaes Correlatas

[AGR]

Agrupar em Histrias

[CONF]

Fase de Conflitos

[ICO]

Identificar Conflitos em Histria

[RCO]

Resolver Conflito

[RCOL]

Fase de Reviso Colaborativa

[MIAQ]

Identificar Atributos Quantitativos (Colaboradores)

[MTRA]

Traduzir (Colaboradores)

[MGEO]

Geolocalizar (Colaboradores)

[MCFD]

Compatibilizar Formato de Data (Colaboradores)

20

Sumrio
1

Introduo ..................................................................................................................... 24
1.1

As Fases de um Evento Emergencial .................................................................. 24

1.2

Tipos de Conhecimentos que Apoiam a Fase de Resposta de uma Emergncia 25

1.2.1

Conhecimento Pessoal Anterior.......................................................................... 26

1.2.2

Conhecimento Formal Anterior .......................................................................... 27

1.2.3

Conhecimento Contextual Atual ......................................................................... 27

1.3

Motivao ........................................................................................................... 28

1.4

Apresentao do Problema ................................................................................. 32

1.5

Hiptese .............................................................................................................. 34

1.6

Objetivos ............................................................................................................. 35

1.6.1

Geral.................................................................................................................... 35

1.6.2

Especficos .......................................................................................................... 35

1.7

Metodologia ........................................................................................................ 36

1.8

Contribuies da Tese ......................................................................................... 37

1.9

Organizao do Trabalho .................................................................................... 38

A Computao Mvel e Ubqua Promovendo a Colaborao Social ....................... 40


2.1

Colaborao nas Redes Sociais........................................................................... 42

2.2

Colaborao nas Mdias Oficiais ........................................................................ 45

2.3

Colaborao Social na Resposta a Desastres Naturais ....................................... 46

2.4

Consideraes Complementares ......................................................................... 49

Sistemas Complexos ..................................................................................................... 51


3.1

Propriedades dos Sistemas Complexos e a Colaborao Social no Ambiente de

Emergncias..................................................................................................................... 54
3.1.1

Unidade Coletiva ................................................................................................ 54

3.1.2

Propriedades Emergentes .................................................................................... 55

3.1.3

Adaptabilidade .................................................................................................... 56

3.1.4

Multi-escalas ....................................................................................................... 57

3.1.5

Feedback ............................................................................................................. 58

3.1.6

Imprevisibilidade ................................................................................................ 58

21

3.1.7

Heterogeneidade ................................................................................................. 59

3.2

Complexidade e a Qualidade da Informao em Situaes de Emergncia ....... 61

3.2.1

Relato Pessoal de uma Lio na Primeira Misso de Resposta a Emergncia ... 62

3.2.2

A Complexidade na Avaliao da Qualidade da Informao ............................. 63

3.3

Consideraes Complementares ......................................................................... 65

Fontes de Informaes no Apoio Emergncia: Capacidades e Limitaes .......... 66


4.1

Disponibilidade de Dados ................................................................................... 71

4.2

Nvel de Estruturao dos Dados ........................................................................ 72

4.3

Extrao da Localizao e Georreferenciamento ............................................... 74

4.4

Limite de Caracteres e Apresentao do Contedo ............................................ 80

4.5

Informao Complementar (Arquivos e Contedo Multimdia) ........................ 82

4.6

Frequncia de Colaborao ................................................................................. 82

4.7

Comunicao ...................................................................................................... 83

4.8

Confiabilidade da Fonte ...................................................................................... 84

4.9

Consideraes Complementares ......................................................................... 85

Trabalhos Relacionados ............................................................................................... 86


5.1

Quadro Sntese da Pesquisa ao Estado da Arte................................................... 86

5.2

Escopo, Desafios, Resultados e Concluses das Obras Pesquisadas .................. 88

Descrio da Arquitetura de Soluo ....................................................................... 113


6.1

Ambiente Externo ............................................................................................. 117

6.1.1

Agentes Colaboradores ..................................................................................... 117

6.1.2

Fontes de Informao Colaborativa .................................................................. 118

6.2

Ambiente Interno .............................................................................................. 119

6.2.1

[COMU] Fase de Comunicao ........................................................................ 119

6.2.1.1 [COL] Coletar Publicaes ............................................................................... 120


6.2.1.2 [FED] Requisitar Feedback .............................................................................. 121
6.2.2

[PREP] Fase de Pr-Processamento ................................................................. 123

6.2.2.1 [AAV] Associar Atributos ao Vocabulrio ...................................................... 123


6.2.2.2 [VTF] Verificar e Tratar Feedback ................................................................... 125
6.2.2.3 [CFD] Compatibilizar Formato de Data ........................................................... 126

22

6.2.2.4 [CFC] Compatibilizar Formato de Coordenadas .............................................. 127


6.2.2.5 [VID] Verificar Idioma ..................................................................................... 128
6.2.2.6 [CLA] Classificar .............................................................................................. 129
6.2.3

[HIST] Histrias ............................................................................................... 130

6.2.3.1 [EPC] Encontrar Publicaes Correlatas .......................................................... 130


6.2.3.2 [AGR] Agrupar em Histrias ............................................................................ 135
6.2.4

[CONF] Conflitos ............................................................................................. 136

6.2.4.1 [ICO] Identificar Conflitos em Histria............................................................ 136


6.2.4.2 [RCO] Resolver Conflito .................................................................................. 137
6.2.5

[RCOL] Reviso Colaborativa.......................................................................... 138

6.2.6

Estrutura de Armazenamento e Recuperao ................................................... 138

6.3

Aspectos da Complexidade Relacionados Arquitetura .................................. 139

6.3.1

Propriedades Emergentes e Feedbacks ............................................................. 139

6.3.1.1 Organicidade Funcional e Multiescalaridade ................................................... 140


6.3.1.2 Adaptabilidade e Heterogeneidade ................................................................... 141
6.3.1.3 Multi-escalas ..................................................................................................... 141
7

Aplicao Experimental ............................................................................................. 146


7.1

Prottipo Experimental da Arquitetura ............................................................. 146

7.1.1

Interface para o Gerenciamento de Fontes de Informaes .............................. 146

7.1.2

Associao de Atributos das Fontes de Informaes com o Vocabulrio de

Referncia ...................................................................................................................... 150


7.1.3

Gerenciamento dos Grupos Classificatrios para o Processo [CLA] Classificar


151

7.1.4

Configurao do ndice de Correlao para o Agrupamento no Processo

[HIST] Histrias ......................................................................................................... 152


7.1.5

Valorao de Atributos Quantitativos em Publicaes..................................... 154

7.1.6

Identificao Histrias e Tratamento de Conflitos ........................................... 155

7.2

Bases de Dados Adquiridas para a Experimentao ......................................... 157

7.2.1

Ushahidi SMS ................................................................................................ 158

7.2.2

Sahana SMS e Rede Social Twitter ............................................................... 159

23

7.2.3

Flickr Redes Sociais....................................................................................... 160

7.2.4

United States Geological Survey (USGS) Sensores Sismgrafos ................. 161

7.2.5

Mission 4636 - SMS ......................................................................................... 162

7.2.6

CENACID/UFPR - Vistorias de Equipes de Campo ........................................ 164

7.2.7

PAHO Catlogo Oficial das Unidades de Sade no Haiti ............................. 165

7.3

Resultados da Experimentao ......................................................................... 167

7.3.1

Resultados do Processamento [CFD] Compatibilizar Formato de Data ....... 167

7.3.2

Resultados do Processamento [CFC] Compatibilizar Formato de Coordenadas


168

7.3.3

Resultados do Processamento [CLA] Classificar.......................................... 168

7.3.4

Resultados do Processamento [EPC] Encontrar Publicaes Correlatas ...... 169

7.3.5

Resultados do Processamento [AGR] Agrupar em Histrias........................ 170

7.3.6

Tempo de Processamento e Escalabilidade da Plataforma Experimental ........ 171

Propostas de Encaminhamento e Concluses .......................................................... 174


8.1

Concluses ........................................................................................................ 174

8.2

Propostas de Encaminhamento ......................................................................... 176

Referncias Bibliogrficas.................................................................................................. 178


Apndices ............................................................................................................................. 186
Apndice A Requisitos bsicos para a elaborao de bibliotecas de comunicao para
as fontes de informaes colaborativas ......................................................................... 186
Apndice B Exemplo de cdigo PHP do script para coleta de publicaes da rede
social Facebook atravs do processo [COL] Coletar Publicaes ............................. 187
Apndice C Vocabulrio de referncia organizado para a associao de atributos
comuns e anotao das publicaes tratadas ................................................................. 188
Apndice D Especificao da Ontologia SocialCol para Anotao de Publicaes
Correlatas

190

Apndice E Histrico de contatos por e-mail para a solicitao das bases de dados . 191
Apndice F Diagrama Entidade-Relacionamento (DER) do repositrio de coleta e
processamento da plataforma experimental SocialCol .................................................. 195

24

1 Introduo
1.1

As Fases de um Evento Emergencial


De acordo com Diniz et al. (2005), um evento emergencial pode ser

cronologicamente dividido em trs fases: preveno, resposta e investigao. Durante a


primeira fase so elaboradas as medidas preventivas e os planos de mitigao. A fase de
resposta se inicia quando um incidente anormal comunicado. Esta fase compreende aes
voltadas para reduzir os efeitos negativos da situao de emergncia, nomeadamente a perda
de vidas e propriedades. Finalmente, a investigao tem incio no primeiro momento da
emergncia, mas dura at que as causas da emergncia e seus efeitos sejam identificados.
Outras classificaes (LINDEL et al., 2006; OCHA, 2012; DRANSCH et al., 2013)
incluem mais duas fases: preparao e recuperao. Na primeira, um plano de ao
projetado tendo em vista uma situao de emergncia estar prevista para acontecer em um
futuro prximo. Este o caso, por exemplo, de furaces que se deslocam em direo a uma
regio. A recuperao a fase durante a qual as medidas so adotadas para trazer a situao
de volta ao normal, quando a emergncia no mais existe.
A Figura 1.1 ilustra a ordem sequencial das diferentes fases de um evento
emergencial e a diviso setorial adotada pela UNDAC1 (em ingls, United Nations Disaster
Assessment and Coordination), a equipe de campo do escritrio OCHA (Office for the
Coordination of Humanitarian Affair), formada por um corpo multidisciplinar de
especialistas voluntrios treinados para atuar em misses internacionais de resposta rpida a
desastres.

UNDAC - http://www.unocha.org/

25

Figura 1.1. Sequncia das diferentes fases de um evento emergencial e a diviso setorial dos grupos de trabalho
da equipe UNDAC durante respostas a desastres. Adaptado de OCHA (2012)

1.2

Tipos de Conhecimentos que Apoiam a Fase de Resposta de uma Emergncia


Uma atividade de resposta emergncia envolve equipes de diferentes estruturas

organizacionais (ONGs, agncias de governo, grupos de voluntrios, etc.) e nveis de atuao


(local, estadual, nacional, internacional) que buscam trabalhar de forma cooperativa e
integrada, com o objetivo de salvar vidas e propriedades.
Estas equipes devem ser coordenadas por indivduos experientes, munidos de
informaes relevantes e de boa qualidade (atual, proveniente de fontes confiveis,
completa, sem incongruncias), capazes de gerenciar seus recursos disponveis (pessoal,
equipamentos, verbas), e responsveis por tomar um elevado nmero de decises premidas
por um constante clima de tenso e urgncia.
Em ambientes de emergncia a informao exerce um papel fundamental na
coordenao e na tomada de deciso sobre como os recursos nacionais e internacionais sero
mobilizados durante a fase de resposta. Sobretudo, a informao essencial para a prestao
de assistncia rpida e eficaz aos cidados envolvidos na crise, capacitando organizaes a
ganhar (ou perder) visibilidade e credibilidade. tambm essencial para a ps-ao, anlise,
avaliao e reflexo acerca das lies aprendidas com o evento.
Segundo Cordeiro et al. (2011), algumas informaes seguem um perfil mais
esttico, porm um alto fluxo de informaes pode tambm dinamicamente surgir e, se

26

transformar ao longo da evoluo da situao. A necessidade de um uso combinado de


informaes provenientes de fontes heterogneas torna sua gerncia uma tarefa complexa,
particularmente durante a fase de resposta, quando a presso do tempo e a sobrecarga de
dados ocorrem constantemente.
Diniz et al. (2005) introduziram o mapa conceitual ilustrado na Figura 1.2, que
organiza trs tipos de conhecimento que a equipe de comando, designada para gerenciar uma
emergncia, aplica para a tomada de decises e o direcionamento das operaes das equipes
de campo: o conhecimento prvio (pessoal e formal) e o conhecimento contextual atual.

Figura 1.2. Mapa conceitual dos tipos de conhecimentos que apoiam a fase de resposta de uma emergncia.
Adaptado de Diniz et al. (2005)

1.2.1 Conhecimento Pessoal Anterior


O conhecimento pessoal anterior o conhecimento que um indivduo desenvolve ao
longo do tempo, por meio da experincia adquirida em suas atividades anteriores, agregado
sua formao profissional. Tambm denominado de conhecimento tcito (NONAKA;
TAKEUCHI, 2007), isto , aquele apreendido ao longo da vida e, encontra-se somente na
mente do indivduo, geralmente difcil de ser formalizado ou explicitado, difcil de ser
expresso por palavras, pois subjetivo e inerente s habilidades e experincia de cada um.
Por exemplo, no contexto de situaes de emergncia, as equipes de comando so
constitudas por profissionais experientes, detentores de um extenso histrico de
participaes em respostas a emergncias e treinamentos em simulaes do gnero, o que
ajudou a formar e enriquecer seu conhecimento tcito relativo ao tema. Estes agentes detm
o conhecimento e o controle do processo de emergncia por inteiro.

27

1.2.2 Conhecimento Formal Anterior


O conhecimento formal anterior constitudo por informaes originadas de rgos
oficiais e fontes de alta credibilidade, no necessariamente projetadas para uso de
emergncia. Geralmente se refere a informaes especficas sobre localidades, pessoas ou
recursos, consideradas teis para o comando de tomada de deciso. Dados como mapas
rodovirios, localizao de equipamentos pblicos, capacidade e especialidades de hospitais,
plantas de construo e fornecimento de gua podem ser relevantes para avaliar a situao de
emergncia.
Entretanto, um aspecto crtico para a manuteno da base de conhecimento formal
anterior a tpica falta de padronizao das distintas fontes de origem que a alimentam.
Segundo (CORDEIRO, 2015), a heterogeneidade de formatos e padres de representao de
dados criam dificuldades na interpretao, na integrao, no partilhar da informao, bem
como em sua atualizao.
1.2.3 Conhecimento Contextual Atual
O conhecimento contextual atual se refere informao gerada durante o processo de
evoluo da resposta emergncia, proveniente de avaliaes da situao corrente,
realizadas geralmente por agentes de campo. Quando esta informao combinada com o
conhecimento prvio, constri o que chamado de conhecimento combinado (Figura 1.2),
o que auxilia o comando no processo de tomada de deciso.
Grande parte das decises dos coordenadores apoiada pelo ganho de conhecimento
contextual, ou seja, aquele que se obtm ao longo da evoluo da resposta, a partir das novas
informaes adquiridas pelas equipes diretamente envolvidas na ao de emergncia.
Informaes sobre vtimas, perdas, danos e as ordens emitidas pelo comando e seus efeitos
so exemplos do conhecimento contextual atual.
Ao contrrio dos demais tipos de conhecimentos apresentados, o conhecimento
contextual atual caracteriza-se por um elevado grau de dinamismo. As aes de resposta
tomadas em prol do reestabelecimento da normalidade promovem contnuas alteraes sobre
ambiente e, consequentemente, sobre o dado ambiental, tornando-o desatualizado
rapidamente (como o caso do nmero de leitos disponveis em um hospital). Mesmo
quando coligido por agentes confiveis munidos de equipamentos precisos, importante
considerar que em poucos instantes, este dado pode j no ser mais ser vlido para consumo.

28

Desta forma, torna-se fundamental elaborar mecanismos que viabilizem o monitoramento e o


controle temporal de um dado, levando em considerao a sua natureza e as caractersticas
da fonte de informao que o originou.
A composio da base de conhecimento contextual atual pode ainda ser enriquecida
com informaes fornecidas por cidados envolvidos na emergncia, ou seja, a partir da
colaborao social. Entretanto, a agregao de colaboraes provenientes de fontes no
oficiais (cidados) requer a aplicao de mecanismos sinalizadores e verificadores da
procedncia e confiabilidade da informao recebida. Tais medidas so essenciais de modo
a evitar que possveis interesses sociais possam distorcer o cenrio real, e induzir o comando
a tomar decises parciais e tendenciosas na conduo da resposta.
1.3

Motivao
No passado a escassez de dados e a limitao da acessibilidade e comunicao

representavam algumas das principais barreiras enfrentadas por gestores pblicos no


processo de tomada de deciso. Em um estado de emergncia a situao se agrava ainda
mais, quando a infraestrutura que viabiliza o acesso e trnsito de informao (redes eltrica e
de telecomunicaes) e pessoas (caminhos, rodovias, pontes) comumente interrompida por
eventos decorrentes dos fenmenos desastrosos.
A Figura 1.3 ilustra um cenrio clssico de resposta a uma situao de emergncia,
destacando a presena de agentes, infraestrutura e os tipos de conhecimentos (introduzidos
na seo 1.2) que apoiam a fase de resposta.

Figura 1.3. Cenrio clssico de resposta a emergncias: dificuldades de acesso, comunicao e aquisio de
informao

A equipe de deciso assume o papel de coordenao da resposta, de onde partem as


demandas para as atividades das equipes de campo, baseadas:

29

na conjugao de planos de ao e dados prvios (mapeamentos, relatrios, etc.), que


constituem o conhecimento formal anterior;

no conhecimento tcito, isto , o conhecimento pessoal anterior de cada membro da


equipe, adquirido ao longo do tempo, atravs de participaes em atividades dentro
de circunstncias semelhantes;

nas atividades das equipes de campo, que enriquecem a base do conhecimento


contextual atual gerando informaes dinmicas acerca das transformaes causadas
pela situao de emergncia e tambm da evoluo da resposta.
Contudo, diante deste cenrio, alguns obstculos podem impedir o fluxo eficiente da

informao como, por exemplo, uma interrupo da infraestrutura de comunicao e


circulao de pessoas.

Consequentemente, o enriquecimento da base de conhecimento

contextual atual quantitativa e qualitativamente prejudicado, uma vez que o tempo de ao


da resposta completamente dependente desta infraestrutura, tanto para acesso da equipe
quanto para o trfego da informao gerada.
Hoje a situao se inverte, quando o desafio est em gerenciar um excesso de
dados altamente dinmicos e provenientes de fontes cada vez mais diversificadas: sensores
remotos ambientais, redes sociais, equipes de resposta, imagens de satlite, mdia, etc..
Apesar da coleta de dados representar uma etapa indispensvel para a compreenso
do ambiente de emergncia, as abordagens cientficas, que outrora focavam sobre esta etapa,
hoje experimentam melhores mtodos para processar os dados coletados, e distinguir o que
pode ser til ao gestor da emergncia em cada momento da fase de resposta.
Segundo Xavier-da-Silva (2009), o desafio est em transformar um grande volume de
dados2, que representam registros de ocorrncias, ora desorganizados, no estruturados e
incompletos, em informaes teis deciso, o que representa o ganho de conhecimento.

Segundo Miranda (1999, p.285), os dados representam um conjunto de registros qualitativos ou quantitativos
conhecidos que, organizado, agrupado, categorizado e padronizado adequadamente, transforma-se em
informao, isto , um conjunto de dados organizados de modo significativo, sendo subsdio til tomada de
deciso.

30

Figura 1.4. Agentes de aquisio de dados ambientais e meios de comunicao hoje disponveis no apoio a
construo do conhecimento contextual atual

A Figura 1.4 ilustra novamente um cenrio de resposta a situaes de emergncia,


desta vez considerando alguns exemplos dos novos meios de comunicao hoje disponveis e
tambm destacando a presena de novos agentes de aquisio de dados ambientais:

Humanos: representados pelas equipes de campo, devidamente treinadas para


atuarem oficialmente na resposta da emergncia. Alm disso, os prprios cidados
tendem a colaborar no enfrentamento de situaes adversas normalidade de sua
comunidade.

Hoje sua colaborao facilitada pelos inmeros recursos de

comunicao, cada vez mais sofisticados, prticos, onipresentes e, que requerem


baixo custo de aquisio e operao;

Automatizados: representados por equipamentos eletrnicos que auxiliam o


monitoramento e aquisio de dados ambientais, como sirenes de alertas, cmeras,
sensores remotos, satlites, hoje com custos de aquisio, implantao e
operacionalizao cada vez mais reduzidos. O monitoramento automatizado tambm
reduz a margem de erro das aferies, dispensa gastos com treinamento, mobilizao
de pessoal e polticas de incentivo e recompensa ao trabalho realizado, alm da
capacidade de monitorar locais inabitveis, como reas de altitudes ou temperaturas
extremas e alta radioatividade.
Apesar dos benefcios obtidos pela adoo dos agentes automatizados, como a

capacidade de gerar e processar grandes volumes de dados de forma gil, os computadores


operam de forma restrita somente ao que foram programados, ideais para tarefas repetitivas e
ininterruptas.

31

O recurso humano, por sua vez, apesar de sua limitao fsica, dispe da capacidade
de interagir com o ambiente devido a sua habilidade de raciocnio lgico. Sendo assim, o
recurso humano capaz, especialmente em ambientes de alto dinamismo e imprevisibilidade
(como o caracterizado pelas emergncias), de perceber uma determinada situao, avaliar,
elaborar alternativas de ao, decidir, agir e analisar os efeitos de sua ao. De forma
recursiva, pode iniciar uma nova iterao, levando em conta a evoluo da situao
provocada pelos efeitos de suas aes anteriores. Desta maneira, considerando as vantagens
e limitaes relativas a cada tipo de agente, conclui-se que ambos podem produzir resultados
mais efetivos quando operam de forma combinada e complementar.
Com relao aos novos meios de comunicao representados na Figura 1.4, as
oportunidades de colaborar so ampliadas pela Computao Mvel e Ubqua3.
Equipamentos portteis, telefonia celular, redes sem fio e objetos inteligentes expandem os
limites dos locais e dos momentos nos quais um indivduo pode exercer colaborao, pois
possibilitam o uso de informaes de sua localizao e tornam os ambientes cada vez mais
interativos, modificando sua relao com o espao urbano e abrindo espao para a oferta de
servios colaborativos inovadores (FILIPPO et al., 2011).
No segmento das redes sociais, a tecnologia aliada popularizao cada vez maior de
dispositivos mveis e pesados investimentos em infraestrutura e middleware4, abrem as
portas para um enorme volume de informaes, agora, submetidas a partir de qualquer
localidade geogrfica. As redes sociais, dentre outros inmeros meios de comunicao,
podem ento ser aproveitadas como verdadeiros instrumentos de colaborao entre cidados
de uma comunidade afetada por eventos emergenciais (DAVID; MACIEL, 2011).
Gouveia e Fonseca (2008) descrevem alguns benefcios e desvantagens decorrentes
do monitoramento ambiental baseado no apoio voluntrio, conforme o Quadro 1.1.

Segundo Weiser (1991), a Computao Ubqua a terceira era da computao: aps a era da computao de
grande porte (vrios usurios compartilham um computador) e a era dos computadores pessoais (cada usurio
usa seu prprio computador), a era da Computao Ubqua a dos dispositivos de tamanho reduzido (cada
usurio usa vrios dispositivos).
4
No contexto de desenvolvimento e execuo de sistemas colaborativos, middleware um software para
facilitar o desenvolvimento e execuo de sistemas distribudos. Consiste numa infraestrutura para dar suporte
a diversas caractersticas desejveis para a implementao dos sistemas colaborativos: interoperabilidade,
integrao, portabilidade, escalabilidade e suporte a diferentes modos de colaborao.

32

Quadro 1.1. Benefcios e desvantagens de monitoramento voluntrio. Adaptado de Gouveia e Fonseca (2008)

Aspecto
Dado

Benefcios
Enriquecimento da base de
informaes contextual.

Desvantagens
Carncia de credibilidade dos dados.
Metadados so escassos.
Baixo grau de estruturao.
Devido falta de conhecimento
especfico e treinamento a informao
geogrfica no sempre compatvel aos
dados recolhidos por outros.

Logstica A participao de voluntrios


pode reduzir significativamente
os custos operacionais para a
gerao de dados ambientais.
Aumento da abrangncia
geogrfica e o perodo de tempo
de monitoramento.
Impactos Pblico mais informado e
Sociais educado sobre problemas
ambientais e mtodos
cientficos.
Monitoramento voluntrio
promove a cooperao e
integrao comunitria ao invs
de sua partio.
1.4

A participao pblica pode exigir


formao anterior e tambm demanda
alocao de pessoal para a superviso do
trabalho voluntrio (organizao,
validao, distribuio de demandas).
Requer a organizao de materiais de
treinamento.
Nvel imprevisvel de comprometimento
voluntrio.
O princpio NIMBY5 (em portugus,
no em meu quintal) pode afetar a
participao do cidado, distorcendo,
em alguns casos, as metas da iniciativa
voluntria.

Apresentao do Problema
evidente que o aumento das possibilidades e circunstncias de gerao de

informaes ambientais pode trazer muitos ganhos, como a economia de recursos, ampliao
da capacidade de monitoramento e, consequentemente, o enriquecimento da base de
conhecimento.
Entretanto, necessrio controlar e organizar este novo vasto e heterogneo volume
de dados. Deve-se, por exemplo, avaliar o conjunto de dados disponveis em cada uma das

NIMBY um acrnimo ingls (de Not In My Back Yard, que significa "no em meu quintal", em portugus)
uma expresso usada por urbanistas e profissionais da rea norte-americanos, para descrever a oposio a
certos projetos polmicos ou que possam ser prejudiciais ao entorno (como construo ou expanso de
estruturas ou zonas tais como aeroportos, uma estrada movimentada, um grande centro comercial ou um aterro
sanitrio).

33

fontes de dados utilizadas, ou seja, compreender seus metadados6. preciso identificar, por
exemplo, para cada fonte, quem, onde, quando, em que situao o dado foi originado e,
principalmente, apresentar na forma mais clara e organizada possvel para que quem o
consuma disponha de melhores condies para determinar se este ou no til, e a
colaborao seja de fato efetiva para sua tomada de deciso.
Por exemplo, a identificao da procedncia da informao colaborativa7 (tipo de
fonte de comunicao, identificao e meios de contato com o responsvel pela informao)
imprescindvel. Ainda que no se julgue sua qualidade ou sua utilidade, preciso sinalizar
e diferenciar o que uma informao oficial (originados por agentes oficialmente envolvidos
na resposta) do que no . Muitas vezes, por mais que se preste a colaborar com a resposta
emergncia por boa f, um cidado pode envolver seus sentimentos e interesses pessoais a
fim de ser prioritariamente atendido, mesmo que seu apelo no seja a prioridade dentre
muitas outras que possam existir. Este indivduo est limitado apenas ao conhecimento de
seus problemas, enquanto a equipe de comando possui uma viso holstica do cenrio de
emergncia, alm de agir com imparcialidade e dispor de uma gama maior de informaes,
sendo, portanto, capaz decidir melhor a reais prioridades de atendimento.
Esta imprevisibilidade devido atuao de cidados como colaboradores pode
comprometer a eficcia do apoio resposta. Trata-se de uma tpica caracterstica de um
sistema complexo (MITCHELL, 2009) e que deve ser considerada e modelada em uma
soluo que se prope a apoiar a tomada de deciso baseada em informaes colaborativas.
Sob o ponto de vista tecnolgico, distintas fontes de informaes implicam em um
elevado grau de heterogeneidade envolvendo distintos conjuntos de dados e protocolos de
transmisso (BENBYA; MCKELVEY, 2006).

necessrio compreender a forma de

operao de cada uma dessas fontes e criar um protocolo comum de captura e organizao
dos dados, alm de ser capaz de se adaptar (outra propriedade dos sistemas complexos) ao
provvel futuro surgimento de novas tecnologias.
preciso analisar em cada informao coletada, por exemplo, se a gama de dados
disponvel suficientemente completa e clara para seu processamento e tambm para o

Metadado - dados que descrevem os dados, ou seja, so informaes teis para identificar, localizar,
compreender e gerenciar os dados. Quando documentamos os metadados e os disponibilizamos, estamos
enriquecendo a semntica do dado produzido, agregando seu significado real, e dando suporte atividade de
administrao de dados executada pelo produtor desse dado.
7
A informao colaborativa aquela gerada a partir da colaborao social.

34

consumo. No caso de insuficincia de dados, necessrio promover mecanismos para


requisit-los de modo a viabilizar o prosseguimento da triagem na cadeia de tratamento e
evitar seu descarte de forma prematura.
Os exemplos a seguir ilustram situaes crticas e requisitos classicamente
encontrados no cenrio estabelecido, e devem ser abordados e devidamente encaminhados na
proposio da soluo:

Como quantificar um dado qualitativo?


Exemplo: muitos feridos equivale a quanto numericamente?

Como lidar com a incompatibilidade de formatos de dados semanticamente


equivalentes, gerados por duas fontes distintas?
Exemplo 1: Facebook.created_time = 2014-10-29T16:49:11+0000 X Flickr.datetaken
= 2014-10-29 16:49:11
Exemplo 2: Twitter.coords.latitude = -23.514234 X USGS.lat = -23 30 23,234

Como ser identificada e tratada a incompletude de dados?

Como identificar e tratar dados conflitantes?


Exemplo: 10 pessoas feridas vs poucos feridos vs 20 feridos

Trata-se de dados conflitantes ou apenas uma evoluo do cenrio?

Como identificar e agrupar informaes correlacionadas?


Questes deste gnero precisam ser levantadas e investigadas. Suas solues devem

ser propostas ou encaminhadas, sendo flexveis e adaptveis agregao de novas fontes de


informaes que podero surgir e se popularizar futuramente.
1.5

Hiptese
Mecanismos de coleta e tratamento de informaes devem ser capazes de lidar com a

imprevisibilidade e o dinamismo caractersticos da complexidade que envolve a colaborao


em situaes de emergncia.
Alm disso, tais mecanismos devem ser flexveis de modo a atender aos requisitos
decorrentes da heterogeneidade quanto aos tipos de fontes e seus distintos conjuntos e

35

formatos de representao dos dados. Devem ainda ser capazes de se adaptar eventual
agregao de novas fontes de informaes ao sistema.
O estabelecimento de associaes entre informaes correlatas pode corroborar e
expandir o conhecimento sobre determinadas investigaes. Entretanto, tais associaes
podem tambm evidenciar conflitos, sendo necessrio criar mecanismos para detect-los e
resolv-los.
As situaes problemticas ilustradas atravs dos exemplos no final da seo anterior
esto diretamente relacionadas com atributos da qualidade da informao, como a
completude, atualidade, compatibilidade e clareza, conforme enumerados por Amaral (2003)
na seo 3.2. Desta forma, presume-se que a construo de uma abordagem de soluo que
atue na resoluo destes problemas, consequentemente implicar na melhoria da qualidade
da informao coletada.
1.6

Objetivos

1.6.1 Geral
Este trabalho tem por objetivo desenvolver uma arquitetura de coleta e tratamento de
informaes colaborativas, originadas a partir de fontes heterogneas.

A arquitetura

considera os aspectos da complexidade do ambiente de emergncia e busca o enriquecimento


da base de conhecimento contextual atual dos gestores da resposta crise.
1.6.2 Especficos
Fase de Concepo

Identificao dos aspectos da complexidade associados gerao e consumo de


informaes para apoio deciso em ambientes de emergncia;

Diagnstico das caractersticas e limitaes inerentes a distintas fontes de


informaes, considerando o nvel de estruturao, a disponibilidade de dados,
formatos de apresentao do contedo, a frequncia da gerao de contedo e o nvel
de confiabilidade;

Organizao de um vocabulrio de referncia para estabelecer a associao entre


atributos semanticamente equivalentes, entre os diferentes conjuntos e terminologias
de metadados disponibilizados por cada fonte de informao incorporada ao sistema;

36

Concepo de uma arquitetura que opera sobre a captura e tratamento de


informaes, considerando os aspectos da complexidade que atuam sobre os agentes
e processos envolvidos.

Fase de Prototipao

Elaborao de um prottipo experimental desenvolvido a partir do modelo conceitual


da arquitetura, atendendo aos seguintes requisitos:
o Elaborar um mecanismo de coleta de dados flexvel heterogeneidade das
fontes de informaes colaborativas e adaptvel agregao de novas fontes;
o Mapear atributos semanticamente equivalentes e uniformizar os formatos de
representao das distintas estruturas de dados agregadas ao sistema;
o Estabelecer associaes entre informaes correlacionadas;
o Detectar e sinalizar informaes incompletas e inconsistentes;
o Prover mecanismos de retroalimentao do sistema por meio de requisies
de

feedbacks

em

busca

de

complementariedade,

confirmao

ou

desambiguaes de informaes inconsistentes.


Fase de Experimentao

Pesquisa e aquisio de bases reais de informaes relativas a eventos de emergncia


ocorridos anteriormente;

Processamento da base de dados experimental sobre o prottipo elaborado;

Apresentao dos resultados da experimentao, verificao da efetividade dos


processos intermedirios, dos agrupamentos finais estabelecidos e da deteco e
sinalizao de eventuais conflitos;

1.7

Concluses e encaminhamento de propostas futuras.


Metodologia
A pesquisa se deflagra pela percepo de um potencial enriquecimento do

conhecimento contextual atual das equipes de comando a partir de uma vasta gama de
informaes relevantes ao contexto, hoje existentes, porm dispersas e no estruturadas,
especialmente diante de um cenrio catico, em constante transformao, onde a grande
demanda por decises pressionada por um curto espao de tempo.

37

O primeiro passo a elaborao de uma hiptese quando, a partir da identificao de


uma oportunidade de melhoria, torna-se necessrio elevar o grau de abstrao do problema a
fim de compreender holisticamente os fenmenos e identificar os elementos da
complexidade e requisitos envolvidos no ambiente da investigao.
Esta base inicial suficiente para compreender a problemtica como um todo e
iniciar um processo de generalizao e abstrao do problema e do ambiente no qual ele se
insere. A partir da so elencados os principais elementos e suas interaes, apontando cada
aspecto

da

complexidade

identificado

(adaptao,

imprevisibilidade,

dinamismo,

heterogeneidade, tecido em conjunto, feedback, impreciso).


Ao se debruar nas teorias dos sistemas complexos, investigam-se meios para lidar
com estes aspectos, uma vez que diversas correntes filosficas e sociais que abordam os
aspectos da complexidade (MORIN, 2007; MITCHELL, 2009; BARRT et al., 2009;
MARIOTTI, 2010) afirmam no ser possvel elimin-las ou control-las, mas sim
compreend-las.
Uma pesquisa referente ao estado da arte em busca de mtodos e abordagens
correlatas j consolidadas na literatura buscar abordagens que possam apoiar a resoluo
dos requisitos levantados na proposta de soluo.
Como etapa conclusiva, a abordagem de soluo ser experimentada por meio da
elaborao de um prottipo que processar um conjunto de bases de informaes
heterogneas, originadas durante uma situao real de emergncia.
Finalmente, concluses sero tecidas acerca da concepo da soluo, sua
implementao e dos resultados da experimentao prtica. Como parte de um processo
evolutivo do trabalho, sugestes de melhorias e dificuldades ora no superadas sero
documentados para fins de prosseguimento da pesquisa e aprimoramento dos resultados.
1.8

Contribuies da Tese
A tese busca contribuir com a concepo de uma arquitetura que considera os

aspectos da complexidade em ambientes de emergncia, e apoiar o enriquecimento do


conhecimento contextual atual atravs do tratamento integrado de informaes colaborativas
originadas a partir de fontes heterogneas.
Independentemente de sua procedncia, para cada informao coletada, a proposta de
soluo criar uma heurstica que quantifique o seu grau de correlao em relao a todas as

38

demais informaes anteriormente capturadas.

Desta forma ser possvel evidenciar

histrias dentro do evento emergencial monitorado, ou seja, congregar subconjuntos de


informaes que se referem a um evento comum.
Como ganho, tais agrupamentos elevam a gama de informaes (e informantes)
relativas quela histria, aumentam a possibilidade de compreender e resolver eventuais
problemas de incompletude ou incongruncia identificados dentro de um mesmo
agrupamento, alm de ampliar a compreenso do comportamento evolutivo daquela histria
ao longo do tempo.
A soluo ser flexvel adaptao de novas fontes de informaes que porventura
podero ser agregadas ao sistema.

Alm disso, dever propor mecanismos de

retroalimentao do sistema, com o objetivo de buscar complementaes a eventuais


informaes incompletas, conflitantes e/ou passveis de verificao.
1.9

Organizao do Trabalho
Este trabalho est organizado da seguinte forma:
O Captulo 2 aponta os principais fatores contribuintes para o aumento massivo do

volume de informaes disponveis para o consumo. O captulo tambm apresenta exemplos


reais de cenrios onde a gerao da informao por meio da colaborao social pode trazer
benefcios para ambas as partes envolvidas, principalmente em situaes de emergncias.
O Captulo 3 dedica-se exclusivamente apresentao de conceitos e propriedades
dos sistemas complexos, bem como as suas respectivas associaes com a colaborao
social, especialmente em ambientes perturbados por eventos de carter emergencial. O
captulo ainda promove uma discusso relacionada aos aspectos da complexidade e os
atributos da qualidade da informao quando inseridos ao contexto de emergncias.
O Captulo 4 promove um diagnstico comparativo entre diferentes tipos de fontes de
informaes colaborativas, elencando as capacidades e limitaes relativas s suas distintas
formas de estruturao, apresentao, disponibilidade e confiabilidade dos dados.
O Captulo 5 descreve o levantamento dos principais trabalhos consultados durante a
etapa de pesquisa do estado da arte. O captulo relata esforos correntes, metas alcanadas
e desafios ainda abertos em propostas com objetivos semelhantes ao desta pesquisa. A
consulta tambm busca levantar conceitos, mtodos e tcnicas abordados segundo distintos

39

autores, e que podero ser aproveitados na etapa de elaborao dos procedimentos


envolvidos na construo da arquitetura proposta por este trabalho.
O Captulo 6 apresenta a concepo da arquitetura proposta para a abordagem
soluo do problema, descrevendo detalhadamente o papel de cada um de seus elementos
constituintes. O captulo tambm tece associaes entre os elementos da arquitetura e
propriedades dos sistemas complexos.
O Captulo 7 documenta a experimentao da arquitetura de soluo proposta. A
primeira seo do captulo apresenta a plataforma experimental codificada com base na
concepo da arquitetura especificada no captulo anterior. A segunda seo descreve a
origem e a estrutura de composio das bases de dados adquiridas para a experimentao.
Na sequncia, o captulo apresenta os resultados da experimentao das bases de dados
adquiridas, sobre a plataforma experimental codificada.
Finalmente, as concluses, as dificuldades enfrentadas, os requisitos no
solucionados e as propostas de melhorias da arquitetura so apresentados no Captulo 8.
A penltima seo deste documento reserva-se ao material de referncia
bibliogrfica, consultado durante as fases de desenvolvimento desta pesquisa.
A ltima seo apresenta os apndices contendo informaes complementares
relativas ao desenvolvimento da pesquisa, e o detalhamento sobre mtodos e algoritmos
aplicados na elaborao da experimentao.

40

2 A Computao Mvel e Ubqua Promovendo a Colaborao Social


O advento de novas tecnologias de informao e comunicao, aliado
popularizao de dispositivos mveis criam oportunidades para o aumento da gerao de
informao contextual originada atravs da participao social, especialmente quando
indivduos testemunham problemas em sua comunidade.
As redes sociais cada vez mais se multiplicam e se reinventam. As interconexes
estabelecidas entre seus usurios proporcionam um alto poder de disseminao da
informao que circula por estas redes. Do ponto de vista tecnolgico e comercial, dois
fatores contribuem fundamentalmente para este crescimento:
1) A evoluo das telecomunicaes a partir da ampliao da capacidade de
trfego de dados de alta velocidade em redes de telecomunicaes sem fio (3G e
4G). Empresas de telecomunicaes investem cada vez mais em infraestrutura de
trfego de dados sem fio, por oferecer maior custo-benefcio em relao rede
cabeada. Diferentemente da rede mvel (sem fio), a rede cabeada demanda um alto
custo de manuteno, devido necessidade frequente de reposio de fios, postes e
equipamentos nas centrais telefnicas. Muitos desses circuitos so ainda analgicos
e por isso, cada vez mais difceis de serem encontrados no mercado. Alm do mais, a
tecnologia sem fio oferece portabilidade ao usurio;
2) A popularizao dos dispositivos mveis e o crescimento do desenvolvimento de
aplicaes para esta tecnologia caminham paralelamente ao investimento das
empresas de telecomunicaes. Os fabricantes de dispositivos mveis concorrem
acirradamente beneficiando usurios com a oferta de uma vasta gama de aparelhos
com distintos tamanhos, formatos, munidos de tecnologia multimdia (udio, vdeo,
imagens, sons), acesso Internet banda larga, alm de instrumentos de navegao por
receptores GPS (Global Position System). Toda esta concorrncia pelo mercado
reflete na oferta de preos cada vez mais acessveis populao, alm de promover
uma rpida evoluo neste segmento.
Segundo pesquisa realizada pela Google (GOOGLE, 2015), a difuso dos
smartphones atinge 26% da populao brasileira (aumento de 100% em relao ao ano de
2011), e esses proprietrios dependem cada vez mais de seus dispositivos. Quarenta e seis

41

por cento dos proprietrios acessam a Internet todos os dias atravs do dispositivo e setenta e
trs por cento nunca saem de casa sem ele.
A pesquisa tambm aponta que noventa e dois por cento dos usurios de smartphones
acessam as redes sociais, sendo cinquenta e oito por cento ao menos uma vez ao dia. Em
escala mundial, a adeso ainda maior, passando da faixa de cinquenta por cento da
populao de pases de primeiro mundo (vide Figura 2.1). A mdia mundial da populao
com acesso a smartphones de quarenta e cinco por cento.

Figura 2.1. Porcentagem da populao usuria de smartphones por pas. Fonte: OurMobilePlanet.com8

Segundo Filippo et al. (2011), a computao mvel e ubqua9 expandiu a gama de


servios colaborativos da Internet, trouxe novas dimenses s aplicaes tradicionais e
introduziu servios inovadores e at curiosos. Enquanto a computao mvel tem foco na
mobilidade, a computao ubqua tem foco na contnua disponibilizao de servios que so

Our Mobile Planet - http://www.ourmobileplanet.com


Segundo Weiser (1991), a Computao Ubqua a terceira era da computao: aps a era da computao de
grande porte (vrios usurios compartilham um computador) e a era dos computadores pessoais (cada usurio
usa seu prprio computador), a era da Computao Ubqua a dos dispositivos de tamanho reduzido (cada
usurio usa vrios dispositivos).
9

42

oferecidos por meio de inmeros objetos com software embarcado em equipamentos


portteis.
Na computao ubqua, estes inmeros dispositivos tm baixo custo, conectam-se
entre si por meio de redes sem fio, e esto dispersos no ambiente para prover apoio s nossas
atividades. Os dispositivos ubquos no so necessariamente mveis: a ideia que eles
tenham inteligncia e estejam disponveis em qualquer lugar e a qualquer momento que se
deseje, isto , que sejam onipresentes.
Capturar dados por meio de dispositivos mveis, transmitir, trocar informaes e se
comunicar com a equipe a distncia tornaram-se procedimentos corriqueiros e confiveis.
Dispor de mais momentos para usar a tecnologia implica em usufruir de um servio de forma
mais continuada e at mesmo continuamente.
As subsees a seguir apresentam alguns exemplos reais de cenrios onde a gerao
de informao a partir da colaborao social pode beneficiar ambas as partes envolvidas.
2.1 Colaborao nas Redes Sociais
Segundo Kamel Boulos et al. (2011) um sensor no necessariamente opera sobre a
leitura de hardwares, mas tambm atravs da leitura humana, fenmeno cunhado pelo autor
como sensoriamento social (em ingls, citizen sensing). Sheth (2009) afirma que as
plataformas de microblogging, ambientes onde usurios podem publicar e compartilhar
mensagens textuais curtas, URLs e anexar contedo multimdia so fundamentais para o
provimento do sensoriamento social.
Graas s suas aplicaes munidas de interfaces simples e objetivas, usurios de
mdias sociais como o Twitter10 e Facebook11 podem publicar contedo textual e multimdia
com rapidez e mnimo esforo atravs de seus dispositivos mveis, a partir de qualquer
localidade. Os microblogs permitem atualizaes instantneas e a gerao de informaes
relacionadas a eventos ocorridos em qualquer lugar do mundo. Atravs das interligaes e
relacionamentos entre usurios, as publicaes so rapidamente compartilhadas e propagadas
pela Internet.

10
11

Twitter - http://www.twitter.com
Facebook http://www.facebook.com

43

Em entrevista concedida revista National Geographic em novembro de 2013


(HOWARD, 2013), Patrick Meier12 - pesquisador internacionalmente reconhecido e
premiado por suas contribuies relevantes no campo do mapeamento de crises - compara
dois casos reais de cooperao que demonstram como a penetrabilidade da tecnologia e as
redes sociais influenciam na eficcia do apoio atravs da colaborao social.
Segundo Meier, durante a resposta ao terremoto no Paquisto, em setembro de 2013,
em funo da baixa penetrabilidade tecnolgica naquela sociedade, no foi registrado o
recebimento de praticamente nenhuma colaborao proveniente da cidade de Baluquisto
(capital do Paquisto) atravs das redes sociais. A baixa disponibilidade de informaes
publicadas atravs das redes sociais pela populao local dificultou a coleta e o mapeamento
de informaes teis para a resposta crise naquela ocasio.
Por outro lado, os filipinos so usurios vidos de novas tecnologias e meios de
comunicao para a interao social. Como resultado, o volume de informaes coletadas
atravs das redes sociais durante e aps o Tufo Haiyan, que atingiu as Filipinas em
novembro de 2013, foi consideravelmente grande e bastante til para a resposta crise.
Beaumont (2008) relata o caso dos ataques de terroristas em Mumbai (ndia)
ocorridos em novembro de 2008, em que cidados locais publicavam seus testemunhos em
tempo real, atravs das redes sociais Twitter e Flickr13. Estes relatos compartilhados foram
essenciais para o comando de crise e os meios de comunicao pudessem compreender e
monitorar a sensibilizao e mobilizao da populao local no enfrentamento da crise.
A Figura 2.2 representa um exemplo prtico de como cidados, aproveitando os
recursos hoje oferecidos pelos dispositivos mveis e suas aplicaes, podem colaborar em
situaes de emergncia. As redes sociais, atravs de suas interfaces amigveis e prticas
sua comunidade usuria, podem servir como interface de colaborao entre cidados e
equipes de operao e coordenao.

12
13

http://irevolution.net/bio/
Flickr - http://www.flickr.com

44

Figura 2.2. Mashup de colaborao social atravs das redes sociais para o apoio a desastres (ESRI, 2013)

Atualmente muitas informaes chegam ao conhecimento de um indivduo por meio


das redes sociais antes mesmo de serem divulgadas nos veculos oficiais de informao.
Agncias de informao j vm se adaptando a este novo paradigma de gerao de contedo
informativo, como ser mostrado na subseo 2.2.
A Figura 2.3 apresenta o caso real de um cidado que, atravs das redes sociais,
retratou e divulgou ao mundo um evento de carter emergencial apenas dez minutos aps sua
deflagrao, simplesmente aproveitando os recursos integrados em seu dispositivo mvel
(cmera, receptor GPS e 3G).

45

Figura 2.3. As redes sociais propagam informaes com rapidez: pouso de emergncia do avio da empresa US
Airways no Rio Hudson, em janeiro de 2009. Informao publicada apenas 10 minutos aps o pouso de
emergncia da aeronave. Fonte: Publicao no microblog Twitter do usurio Janis Krums14

Tal como ocorrido no caso apresentado acima, as redes sociais, munidas de interfaces
amigveis e prticas ao usurio, podem intermediar a colaborao entre cidados e equipes
envolvidas na resposta aos eventos emergenciais, e trazer ao comando da resposta uma viso
diferenciada, sob a tica do prprio cidado.
2.2 Colaborao nas Mdias Oficiais
Agncias de comunicao vm tambm se adaptando e adotando novos
procedimentos para aquisio de contedo e se beneficiando com a gerao de informao
atravs da colaborao social. Hoje, equipados com dispositivos mveis, jornalistas so
capazes de redigir e submeter notcias, enriquecidas por contedo multimdia (vdeos, fotos),
diretamente do local do evento para a redao, em tempo consideravelmente reduzido. A
tecnologia agora acessvel a qualquer cidado por um baixo custo torna-se uma importante
aliada para garantir o ineditismo de sua matria jornalstica.
Outra tendncia a respeito da gerao de informao por agncias de comunicao
o incentivo submisso de transmisses e documentaes de fatos importantes, praticamente
em tempo real, produzidos pelos prprios leitores colaboradores (HERAVI; MCGINNIS;
HERAVI et al., 2012). Neste caso, a colaborao ocorre com elevada frequncia, pois
ambas as partes envolvidas so beneficiadas:
14

http://twitpic.com/135xa

46

Agncia de comunicao: beneficiada pelo surgimento de novas pautas, economia


de tempo e recursos humanos na cobertura preliminar de matrias. A difuso de
colaboradores tambm expande a rea de cobertura da agncia. As submisses
originadas por colaboraes podem ser filtradas pelo corpo editorial do meio de
comunicao que, nos casos de maior interesse e da constatao da veracidade da
informao, pode encaminhar equipes de reportagens para uma investigao mais
detalhada acerca do fato;

Cidado: sente-se til com a prestao da informao de utilidade pblica que, em


muitos casos, busca a melhoria de sua prpria comunidade (rua, bairro) quando
denuncia irregularidades ou divulga manifestaes culturais locais. Em alguns casos,
dependendo da qualidade e importncia, pode ser at recompensado financeiramente
pela informao prestada.

Figura 2.4. a) Portal VC NO G1: aproveitamento da colaborao comunitria para a divulgao de matrias
jornalsticas. Fonte: Globo.com15; b) Portal Digital Journal: utilizao de informaes obtidas a partir da
colaborao social para a publicao de notcias16

2.3 Colaborao Social na Resposta a Desastres Naturais


Heinzelman e Waters (2010) relatam o caso de sucesso do Ushahidi17, um projeto
open-source (de cdigo fonte aberto), baseado em mapeamento colaborativo. Sua origem
ocorreu no Qunia, em 2007, quando um grupo de desenvolvedores locais criou um site18
com objetivo de recolher e mapear relatos da populao sobre atos de violncia decorrentes
da contestao do processo eleitoral do pas naquele ano.

15

Portal VC no G1 - http://g1.globo.com/vc-no-g1/
Digital Journal - http://www.digitaljournal.com/
17
Ushahidi - http://www.ushahidi.com/
18
Ushahidi Haiti - http://www.ushahidi.com/2012/01/12/haiti-and-the-power-of-crowdsourcing/
16

47

Em 2010, j consagrada e contando com o apoio de dezenas de colaboradores, a


ferramenta foi aplicada na resposta ao terremoto de magnitude 7.0 que atingiu o Haiti, em
janeiro daquele ano. O desastre resultou no colapso de 90% das edificaes na capital Porto
Prncipe (FITZGERALD, 2010), causou 317.000 mortes e feriu mais 300.000 cidados
(GRONEWOLD, 2010).
Grande parte das informaes teis s decises da equipe de resposta ao desastre se
originou a partir da populao local, enviadas por e-mail e mensagens de texto (Short
Message Service - SMS) livre de custos, graas a convnios firmados com as operadoras de
telefonia local. Na ocasio o projeto tambm j incorporava submisses provenientes das
redes sociais.
medida que a populao submetia informaes e apelos por ajuda, analistas de
informao voluntrios, situados em distintas localidades remotas (Porto Prncipe, Boston,
Quebec, frica), trabalhavam na triagem dos dados, aplicando procedimentos de coleta,
traduo, verificao da relevncia, veracidade, classificao, mapeamento e publicao.
Cabe observar que na ocasio a triagem de tratamento e organizao da informao
ainda no contava com o apoio de mtodos mais sofisticados de processamento
automatizado, devendo ser tratados e analisados um a um, o que demandava tempo e
consumo de recursos humanos. Em alguns casos, por exemplo, era necessria tambm a
colaborao de tradutores, exercida em parte pela prpria comunidade local.

No caso

especfico do Haiti, cujas lnguas nativas so o creole e o francs, cidados colaboradores se


juntaram equipe Ushahidi para apoiar a tarefa de traduo das mensagens originadas pela
populao para o ingls. As equipes de resposta das Naes Unidas (UNDAC - United
Nations Disaster Assessment & Coordination), principais consumidores da informao na
ocasio, adotam o ingls como idioma padro de comunicao durante as misses.
Parceiros colaboradores da iniciativa Ushahidi vm concentrando esforos na
elaborao de mecanismos automatizados para o processamento das mensagens
colaborativas recebidas. A meta principal a reduo da dependncia de recursos pessoais,
do tempo de triagem alcanando, consequentemente, uma maior eficincia na
disponibilizao da informao para consumo durante situaes emergncia (USHAHIDI,
2013).
Segundo Thomas McKenzie, membro da equipe de mapeamento de crise do projeto
Ushahidi/Haiti, ao final da fase de resposta ao desastre 4.636 cidados colaboraram com um

48

total de 25.186 (alcanando o pico de 2.000 mensagens em um dia) mensagens SMS, e-mails
e comunicaes atravs de redes sociais, resultando em 3.596 registros considerados
suficientemente relevantes para serem mapeados na plataforma (HEINZELMAN, J.;
WATERS, 2010).
Notificaes sobre pessoas debaixo de escombros, emergncias mdicas e
necessidades especficas, tais como alimentos, gua e abrigo foram recebidos, tratados e
mapeados quase que em tempo real por um grupo internacional de voluntrios.

Segundo

Rob Munro, membro da equipe Ushahidi/Haiti, o tempo mdio de triagem de uma


mensagem at seu tratamento e disponibilizao para as equipes de campo era de cerca de
10 minutos (HEINZELMAN, J.; WATERS, 2010).
Relatrios com informaes georreferenciadas foram disponibilizados a qualquer
pessoa com acesso Internet (Figura 2.5). Quatro dias aps o terremoto, equipes de resposta
que atuavam no pas comearam a consumir estas informaes influenciando na
determinao de como, quando e para onde direcionar seus recursos materiais e humanos.
No dia 21 de janeiro de 2010, onze dias aps o terremoto, a Secretria de Estado dos
Estados Unidos, Hillary Clinton proferiu um pronunciamento intitulado Internet
Freedom19, resumindo o impacto positivo do mapeamento produzido pela iniciativa
Ushahidi, conforme trecho traduzido e transcrito a seguir:
Na segunda-feira, uma menina de sete anos de idade e duas
mulheres foram resgatadas dos escombros de um supermercado por
uma equipe de busca e salvamento americano, aps enviarem uma
mensagem de texto pedindo ajuda.

19

http://www.state.gov/secretary/20092013clinton/rm/2010/01/135519.htm

49

Figura 2.5. Mapa de crise do projeto Ushahidi/Haiti: mapeamento categorizado sobre incidentes relevantes
submetidos pela populao haitiana aps o terremoto do Haiti (2010). Adaptado de Ushahidi20

2.4

Consideraes Complementares
Os exemplos concretos apresentados neste captulo evidenciam o quanto a

colaborao social pode contribuir para o enriquecimento da base de conhecimento


contextual atual.

Especialmente durante situaes de emergncia, a colaborao pode

resultar na economia de tempo, recursos materiais e humanos, alm de ampliar a rea de


abrangncia de cobertura em atividades de aquisio de dados ambientais.
Adicionalmente, a participao popular na construo e manuteno da base de
conhecimento considera a percepo da evoluo da emergncia e sua resposta, segundo
uma nova perspectiva, isto , sob a tica da prpria comunidade diretamente envolvida neste
cenrio.
Os mecanismos que viabilizam a gerao de dados a partir da colaborao social so
conhecidos como crowdsourcing21 ou aplicaes de sensoriamento participativo, uma
vez que aproveitam o poder das massas (ou multides) e contam com a participao do
cidado para atingir seus objetivos. Estas aplicaes tornam-se cada vez mais populares nos

20

http://community.ushahidi.com/index.php/deployments/deployment/haiti-crisis-map
Crowdsourcing De acordo com o dicionrio Merriam-Webster o termo designa a prtica de obter os
servios necessrios, ideias ou contedo solicitando contribuies de um grande grupo de pessoas e,
especialmente, da comunidade on-line ao invs de empregados ou fornecedores tradicionais.
21

50

dias de hoje, impulsionadas pela crescente acessibilidade, disponibilidade e adeso da


populao aos dispositivos mveis com acesso Internet, como os tablets e smartphones
(conforme as evidncias apresentadas no incio deste captulo).
Segundo Boulos et al. (2011), na medida em que se insere na vida diria e se torna
mais presente em todos os locais e objetos, a computao tem o potencial de viabilizar novas
formas de colaborao. Cabe a ns criarmos os novos sistemas de apoio colaborao que
se valham destas tecnologias.

51

3 Sistemas Complexos
O termo complexidade vem do latim, complexus, que significa entrelaado ou
torcido junto.

Isto pode ser interpretado da seguinte maneira: para se ter um sistema

complexo necessrio: 1) duas ou mais diferentes partes ou componentes e; 2) estes


componentes devem estar de algum modo interligados, formando uma estrutura estvel
(HEYLIGHEN, 1988). A partir destas proposies identifica-se uma dualidade bsica entre
partes que so ao mesmo tempo distintas e interconectadas.
Um sistema complexo no pode ento ser analisado ou separado em um conjunto de
elementos independentes sem ser destrudo. Em consequncia no possvel empregar
mtodos reducionistas para a sua interpretao ou entendimento.

Se um determinado

domnio complexo ele ser, por definio, resistente anlise (FILHO, 2003a).
Como praxe, a metodologia normalmente adotada no estudo de um fenmeno natural
consiste em analis-lo por etapas, dividindo-o em partes menores e investigando-se cada
uma delas isoladamente. No caso especfico de sistemas lineares, em que o desempenho do
todo a superposio dos efeitos de cada uma de suas partes formadoras, o estudo em
separado suficiente para uma avaliao global do sistema.
Entretanto, a estratgia anterior torna-se inoperante nos casos em que o
comportamento global do sistema marcadamente distinto daquele obtido considerando-se
unicamente a soma de suas partes, ou ignorando a influncia recproca de seus elementos
constituintes. Assim, em razo de seu comportamento acentuadamente sistmico, as
propriedades destes sistemas s podem ser identificadas durante o seu comportamento
coletivo. Tais sistemas so, por conseguinte, denominados complexos (FILHO, 2003b).
A conscincia da existncia de fenmenos que no podem ser reduzidos s suas
partes em separado conduziu ao holismo, que pode ser visto como uma corrente de
pensamento oposta ao reducionismo. O holismo (do grego holos que significa inteiro ou
todo) a ideia de que as propriedades de um sistema no podem ser explicadas apenas pela
soma dos seus componentes, seja se tratando de seres humanos ou outros organismos. O
sistema como um todo determina como se comportam as partes.
Segundo Ferreira (2013), o holismo expressa a teoria segundo a qual o homem um
todo indivisvel, e que no pode ser explicado pelos seus distintos componentes (fsico,

52

psicolgico ou psquico), considerados separadamente. A expresso holismo foi criada


por Jan Smuts, primeiro-ministro da frica do Sul, no seu livro de 1926, Holism and
Evolution, que a definiu como a tendncia da natureza, atravs de evoluo criativa, a de
formar qualquer todo como sendo maior do que a soma de suas partes (SMUTS, 1996).
Neste contexto, o adjetivo complexo no implica em ser complicado.

Tais

sistemas constituem-se por unidades de comportamento simples, influenciando-se


mutuamente numa rede de conexes e gerando, deste modo, o comportamento complexo
global.
Para Leite, Reinisch e Bornia (2003) um sistema complexo adaptativo considerado
um sistema composto de um grande nmero de diferentes agentes, que captam informaes
do meio ambiente e das suas prprias interaes entre os agentes. Ele cria regras a partir de
esquemas individuais e conjuntos. As regras so desenvolvidas pela identificao de
regularidades na captao das informaes. Estes esquemas so atualizados pela
aprendizagem e evoluem para estgios mais avanados.
Ainda segundo Vieira (2005) pode-se dizer que um sistema to mais complexo
quanto maior for a quantidade de informao necessria para descrev-lo. Porm, essa
uma entre muitas definies. No entanto, a complexidade no necessariamente emerge em
sistemas com muitos constituintes. Por exemplo, um gs, com bilhes de constituintes, um
sistema simples, uma vez que basta estudar uma pequena parte dele para entender o todo, o
que impossvel em sistemas complexos.
Complicado no significa ser complexo. Uma mquina sofisticada, com grande
nmero de partes, complicada, mas no complexa, pois ter comportamento previsvel. De
um avio, por exemplo, no emergir nada semelhante ao sofisticado movimento que faz
uma ave alar voo. A reunio de elementos complexos pode gerar um comportamento
simples e previsvel como, por exemplo, a Terra girando em torno do Sol.
Sistemas caticos e complexos tm um aspecto em comum: so no lineares. Mas,
no catico, a imprevisibilidade selvagem; no complexo, civilizada (VIEIRA, 2005).
Alm disso, as propriedades enumeradas a seguir podem estar presentes em sistemas
complexos to diversos quanto um ser vivo, um ecossistema ou a economia de um pas:
partes que se relacionam entre si; interao com o meio; adaptao ao meio; tratamento da
informao em vrios nveis; ordem emergente (criao espontnea de ordem a partir de
estados desordenados); propriedades coletivas emergentes (novos comportamentos causados

53

pela interao entre partes); criticalidade auto-organizada (estado crtico, na fronteira entre a
ordem e o caos, em que a mais leve perturbao pode causar uma reao em cadeia; por
exemplo, um simples floco de neve desencadeando uma avalanche); estrutura fractal
(formatos que no se tornam mais simples quando observados em escalas cada vez menores).
A Figura 3.1 ilustra a dinmica das transformaes ocorrentes em um sistema
complexo adaptativo - o meio ambiente: cidados so entidades constituintes do meio
ambiente que exercem interaes interpessoais e tambm com as demais entidades presentes
em seu meio, de modo a deflagrar eventos modificadores e causar contnuas transformaes
(evolues) no ambiente no qual esto inseridos.

Figura 3.1. Identificao de elementos e interaes de um sistema complexo adaptativo: o meio ambiente

Segundo Xavier-da-Silva e Marino (2011), todo fenmeno transformador do


ambiente pode ser representado por duas primitivas bsicas: entidade ou evento.

As

entidades so fenmenos percebidos principalmente no espao, como, por exemplo, uma


edificao ou uma pessoa. Os eventos so fenmenos percebidos principalmente no tempo,
segundo a escala cronolgica humana.

So caracterizados por um elevado grau de

dinamismo, alm de causar transformaes no ambiente onde ocorrem. Acontecimentos

54

catastrficos e sociais representam exemplos de instncias de eventos, conforme


exemplificados na Figura 3.1.
Mesmo quando em aparente equilbrio, isto , isento de perturbaes de grande
escala (por exemplo, desastres), no se pode afirmar que o ambiente em que vivemos
encontra-se em equilbrio, o que caracteriza um paradoxo, o operador dialgico22 dos
sistemas complexos (MARIOTTI, 2010).
A complexidade deste ambiente conjugada por distintos elementos (entidades e
eventos) que interagem continuamente, adaptando-se a um sistema de elevada taxa de
mudana (dinamismo) causada pelas transformaes ocorridas ao longo de cada frao
nfima de tempo, por consequncia do alto grau de impreciso e impreviso de seus
elementos constituintes.
Eventos desastrosos impactam ainda mais sobre a diversidade, intensidade e a
complexidade das interaes no ambiente, afetando diretamente o ser humano.

Neste

contexto, percebe-se um elevado grau associativo entre os elementos deste meio e as


propriedades de um sistema complexo (PALAZZO, 1999).
Ao decompor o sistema e estudar cada subparte isoladamente no possvel o
entendimento de todo o sistema e sua dinmica, visto que os princpios da auto-organizao
residem principalmente na dinmica coletiva e no supervisionada de muitos elementos
(BARRT, BARTHLEMY e VESPIGNANI, 2009).
3.1 Propriedades dos Sistemas Complexos e a Colaborao Social no Ambiente de
Emergncias
As subsees a seguir destacam algumas propriedades dos sistemas complexos e suas
respectivas associaes com o ambiente de colaborao social em situaes de emergncias.
3.1.1 Unidade Coletiva
Um sistema complexo composto por um conjunto de partes conectadas por alguma
forma de inter-relao entre as mesmas. Assim, para caracterizar um sistema necessrio
no somente conhecer as partes, mas tambm os modos de relao entre elas. Isto gera um
fluxo de informaes no trivial de se investigar, acompanhado de uma srie de
consequncias e propriedades emergentes.

22

Operador dialgico - H contradies que no podem ser resolvidas. Isso significa que existem opostos que
so ao mesmo tempo antagnicos e complementares. (MARIOTTI, 2010, p. 150).

55

As partes, conectadas por uma rede de relaes, geram conjuntamente uma unidade
coletiva comumente chamada sistema. Molcula, clula, ecossistema, cidade, colnia de
formigas, crebro, computador, ser humano, cidade podem ser considerados como um
sistema ou unidade coletiva. Cada sistema possui suas regras internas. Ao inserir um novo
elemento, este passa a estar sujeito s leis prprias desse sistema (PRADO, 2011). Um
estrangeiro, ao entrar em um pas, fica sujeito s leis da jurisdio deste pas. Uma protena,
ao ser absorvida por uma clula fica sujeita dinmica da clula e assim por diante.
Em sistemas colaborativos que apoiam a resposta a emergncias, as entidades
geradoras de informaes (equipes de campo, cidados, mdia, agncias de governo) so
partes conectadas com a comunidade consumidora (equipes de comando e controle, gestores
polticos). Todo dilogo (interao) conecta sempre um emissor com um ou mais receptores
por meio da comunicao.

No h sentido em gerar informao quando no existem

indivduos interessados no seu consumo.


No possvel compreender todo o processo analisando apenas um componente deste
conjunto, uma vez que cada elemento constituinte possui diferentes papis, conhecimentos
tcitos, seguem diferentes regras e operam segundo especficos planos de ao para que o
sistema todo possa fluir normalmente. Caso um elemento seja removido do sistema, o fluxo
da informao ser interrompido e a colaborao ser inviabilizada.
3.1.2 Propriedades Emergentes
Um sistema dito ser um Sistema Complexo quando suas propriedades no so
uma consequncia natural de seus elementos constituintes vistos isoladamente. As
propriedades emergentes de um sistema complexo decorrem em grande parte da relao nolinear entre as partes.
Segundo Simon (1962),
Sistemas Complexos so compostos de vrias partes interagindo
entre si de uma forma no simples. Nesses sistemas, o todo mais do
que a soma das partes, dado as propriedades das partes, as leis das
suas interaes, no trivial inferir as propriedades do todo.

56

Um fenmeno emergente quando surge como resultado da interao entre seus


componentes. A dinmica das partes em uma escala de relao produz uma propriedade
emergente em um nvel mais alto de escala.
De forma anloga, do relacionamento entre o dado e a informao, conclui-se que a
informao uma propriedade emergente de um dado, uma vez que representa o ganho de
conhecimento obtido pela insero de um dado em seu contexto de referncia. Por exemplo,
o valor 31 C representa apenas um registro de ocorrncia de uma temperatura em
centgrados. Entretanto, uma vez inserido em contexto pela sua identificao como
temperatura mdia de uma sala de aula durante o vero, este dado agora ganha teor
informativo. Esta insero revela a capacidade da informao no apoio deciso, por
exemplo, aumentar o resfriamento do ar-condicionado.
3.1.3 Adaptabilidade
Segundo Mitchell (1992), um sistema complexo adaptativo (em ingls, abreviado por
CAS - Complex Adaptive System) uma rede dinmica de muitos agentes (o que pode
representar clulas, espcies, indivduos, empresas, naes) que atuam em paralelo,
constantemente agindo e reagindo ao que os outros agentes esto fazendo.
O controle de um sistema complexo adaptativo tende a ser altamente disperso e
descentralizado. Caso ocorra qualquer comportamento coerente no sistema, este tem de
surgir a partir da competio e cooperao entre os prprios agentes. O comportamento
global do sistema o resultado de um grande nmero de decises tomadas, a cada momento,
por muitos agentes individuais (WALDROP, 1992).
De acordo com Holland (1986), um sistema complexo adaptativo pode funcionar (ou
continuar a existir) somente se realiza uma adaptao contnua a um ambiente que apresenta
alteraes contnuas. A capacidade de modificar o prprio comportamento de acordo com
mudanas no ambiente uma caracterstica comum em sistemas que se propem a modelar o
ambiente e seus fenmenos decorrentes.
Durante situaes de crise, comandantes das frentes de resposta precisam tomar
decises em meio a um ambiente de incertezas, instabilidade e altamente mutvel. Tais
circunstncias lhes obrigam a reavaliar continuamente o cenrio momentneo e se adaptarem
s inmeras imprevisveis transformaes ambientais, ora potencializadas pelo evento
emergencial e tambm pelos resultados das aes decorrentes de suas prprias decises.

57

A grande quantidade de agentes de comando em cada segmento de gesto da crise


(sade, transporte, segurana, resgate, etc.) constri um cenrio indutor de interaes e
contnuas alteraes de estado nos elementos do ambiente. Os comandantes dependem dos
sistemas de informao que precisam lidar com a complexidade da tecnologia, dos eventos,
das interaes, da cultura local e da tomada de deciso (COSKUN; OZCEYLAN, 2011).
3.1.4 Multi-escalas
Sistemas interagem com outros sistemas, de modo a formar sistemas mais amplos em
escalas e com propriedades emergentes. Esta sinergia ocorre em escalas progressivamente
mais amplas ou mais restritas, ou seja, como expresses de sistemas em multi-escalas. Cada
escala possui as suas prprias leis (MILLER; PAGE, 2007).
Segundo Lindel et al. (2006), a gesto da emergncia distribuda em cinco fases:
preveno, mitigao, preparao, resposta e recuperao. As aes podem ser de natureza
estratgica, ttica ou operacional. A jurisdio das atividades pode abranger diferentes
nveis hierrquicos, como o federal, estadual ou local. Os sistemas de informao apoiam as
atividades dessas fases e nveis enfrentando vrios desafios, em especial os que apoiam a
fase de resposta no nvel estratgico. Um grande volume de informaes em diferentes
nveis de detalhes coletado e avaliado para que aes sejam definidas a partir delas.
Portanto, a gesto de informaes crtica para o sucesso da resposta emergncia.
A Figura 3.2 ilustra o inter-relacionamento em diferentes escalas. Os retngulos
superiores (localizados sobre a base da pirmide invertida) representam a sequncia das fases
da emergncia; os retngulos com cantos arredondados representam os nveis de gesto, e o
tringulo invertido representa a abrangncia da jurisdio.

Figura 3.2. Organizao da gesto da emergncia em diferentes escalas

58

3.1.5 Feedback
Uma estrutura de feedback um lao causal, uma cadeia de causas e efeitos que
forma um anel. Dentre essas estruturas, a mais simples o feedback de reforo, tambm
conhecido como efeito bola-de-neve ou ciclo vicioso. A principal caracterstica do
feedback de reforo ser auto-amplificador. Quanto mais complexo um sistema (seres
vivos, por exemplo) maior o nmero de estruturas de feedback que apresenta. Tem sido
observado que sistemas que apresentam feedback tendem a desenvolver propriedades
completamente novas. Este fenmeno denomina-se emergncia e as novas propriedades
do sistema so ditas propriedades emergentes (PALAZZO, 1999).
No contexto de informao colaborativa para apoio a emergncias, os feedbacks de
reforo so mecanismos teis ao analista de informaes para requisitar aos cidados
colaboradores e agentes de campo a complementao de eventuais informaes incompletas,
atualizadas e/ou passveis de confirmao, promovendo, consequentemente, a evoluo e o
enriquecimento da base de conhecimento contextual (Figura 3.3).

Figura 3.3. Evoluo da base de conhecimento contextual atravs de ciclos de feedbacks de reforo

3.1.6 Imprevisibilidade
Segundo Mitchell (2009), possvel identificar que um ambiente complexo
formado por diversos tipos de agentes os quais interagem entre si de uma maneira no
previsvel. H um controle central moderado usando regras simples de operao que do
origem a um comportamento complexo. As informaes so trocadas de diferentes formas e
se adaptam evoluo da situao.
Conforme j observado na subseo 3.1.3, em situaes de crise, comandantes das
frentes de resposta precisam tomar decises em meio a um ambiente de tenso, incertezas e

59

altamente mutvel. Como reflexo de suas prprias decises, encontram-se continuamente


obrigados a reavaliar o cenrio momentneo e se adaptar s inmeras imprevisveis
transformaes ambientais decorrentes da evoluo da resposta emergncia.
A presena de agentes humanos eleva ainda mais o grau de imprevisibilidade de um
sistema baseado em colaborao. Por exemplo, o momento e a frequncia de recebimento de
informaes a partir da colaborao social dependem da conjugao de fatores no
determinsticos, como a disponibilidade do colaborador, sua motivao em contribuir, e at
mesmo a sua aptido momentnea para se comunicar.

preciso, portanto, propor

mecanismos alternativos capazes de melhorar a frequncia e reduzir o tempo de espera por


colaboraes em circunstncias de carncia e que demandem urgncia por novas
informaes.
3.1.7 Heterogeneidade
Muitas vezes se diz que ningum perfeito, mas uma equipe pode ser. Tambm se
diz que o todo maior que a soma das partes, ou ao menos diferente, pois o grupo uma
entidade com padres de comportamento prprios, que se desenvolve e evolui ao longo do
tempo. Uma equipe que trabalha de maneira sinrgica e coesa atinge resultados melhores do
que uma pessoa trabalhando individualmente.
Para lidar com a grande quantidade de informao e a multiplicidade de domnios, as
pessoas se tornam cada vez mais especializadas, com habilidades e conhecimentos distintos.
Resolver um problema complexo muitas vezes requer uma combinao de habilidades que
s obtida em grupo, pois o grupo apresenta mais habilidades do que uma nica pessoa
(VIVACQUA e GARCIA, 2011).
No contexto de emergncias, a diversidade de opinies emanadas de um grupo
heterogneo possibilita a anlise de demandas a partir de diferentes pontos de vista, o que
potencialmente resulta numa avaliao melhor e mais completa.

Adicionalmente, a

colaborao de um cidado local no processo de tomada de deciso poder enriquecer ainda


mais a base de conhecimento dos gestores da crise. Suas percepes e constataes in loco
permitem a avaliao da situao sob uma perspectiva distinta quela do ambiente interno do
escritrio de comando. Alm disso, seu olhar expressa os anseios e as expectativas da
comunidade local com relao evoluo da resposta crise.

60

Por outro lado, sob o ponto de vista tcnico de processamento, a informao


originada por distintos perfis de colaboradores (cidados, agentes de campo, imprensa,
sensores ambientais - Figura 3.4a) pode trazer algumas complicaes.
No que diz respeito gerao de contedo, os agentes de campo e as mdias oficiais
buscam manter um maior nvel de formalidade e estruturao em suas publicaes. J no
domnio das redes sociais (principalmente nos microblogs) e mensagens SMS, os cidados,
descomprometidos com a formalidade, tendem a publicar contedos com alto grau de
coloquialismo (conciso, grias, abreviaes). Tal estilo de escrita pode comprometer a
qualidade da informao quanto ao nvel de estruturao e, dificultar ou at inviabilizar a
efetividade da aplicao de processos automatizados de interpretao do contedo.
Com relao aos recursos para o provimento da colaborao, os distintos meios de
comunicao (Figura 3.4b) implicam no aumento da complexidade do sistema.

arquitetura de uma soluo integradora precisa lidar com a heterogeneidade das fontes,
identificando e propondo solues especficas a cada uma de suas particularidades, como: a
escassez de informao, anonimato do informante, alm dos diferentes conjuntos, estruturas
e protocolos de acesso aos dados relativos a cada meio de informao.
Alm disso, a heterogeneidade tambm se faz presente na forma da apresentao do
contedo informativo como, por exemplo, em casos da presena de multilinguismo (Figura
3.4c). Desastres de grandes propores podem demandar a ajuda internacional. Nestes
casos, o idioma nativo local pode ser diferente do idioma de comunicao adotado pelas
equipes de resposta internacional (geralmente o ingls). Heizelman e Waters (2010) relatam
desafios de multilinguismo enfrentados no tratamento da informao colaborativa durante o
apoio humanitrio ao terremoto ocorrido no Haiti, em 2010.

Figura 3.4. Distintos aspectos da heterogeneidade no contexto de informaes colaborativas em situaes de


emergncia: a) tipos de agentes geradores de informao colaborativa; b) meios de comunicao; c) idioma de
comunicao

61

As questes levantadas neste captulo abordam alguns dos requisitos que devem ser
identificados e abordados no processamento de informaes provenientes de fontes
heterogneas. Tais requisitos sero enumerados atravs de um diagnstico preliminar sobre
diferentes tipos de fontes de informaes, e suas respectivas solues sero propostas e
experimentadas no prosseguimento deste trabalho.
3.2

Complexidade e a Qualidade da Informao em Situaes de Emergncia


Diversos autores buscam meios de quantificar a qualidade da informao atravs de

diferentes conjuntos de atributos. Amaral (2003) apresenta um levantamento das dimenses


da qualidade de um dado segundo diferentes autores e os organiza num quadro que enumera
a frequncia e a coincidncia de cada atributo (por alguns autores, tambm denominada
como dimenso) de acordo com as fontes consultadas.
O Quadro 3.1 apresenta um recorte da poro superior (maiores frequncias) do
quadro organizado por Amaral no levantamento de quarenta e seis diferentes atributos da
qualidade das informaes e suas respectivas frequncias de ocorrncia dentre as dezoito
literaturas pesquisadas.
Quadro 3.1. Quadro quantitativo de referncias sobre atributos da qualidade de dados. Adaptado de Amaral
(2003)
Critrio
Acurcia
Completeza
Temporalidade
Consistncia
Confiabilidade
Facilidade de entendimento
Relevncia
Acessibilidade
Atualidade
Existncia de Metadados
Quantidade apropriada
Preciso
Importncia
Representao consistente
Usabilidade
Detalhamento adequado
Unicidade
Segurana
Conciso

1
X
X
X

2
X

X
X
X
X

X
X

3
X
X
X
X
X
X
X
X

4
X
X
X

5
X

X
X
X

X
X
X

X
X

X
X

X
X
X

7
X
X
X
X
X
X
X

X
X
X

X
X
X

X
X

X
X

X
X
X
X

6
X
X
X
X

Referncia
9 10 11 12 13 14 15 16 17 18
X X X X X X X X X
X
X
X X X X X X
X X X
X X X X
X
X X X X X
X X X
X
X X
X
X
X X
X
X
X X
X
X
X X X
X
X
X X X
X
X
X X
X X
X
X
X X
X
X X
X
X X
X
X
X
X X
8
X
X
X
X

Total
17
14
14
10
9
9
8
8
7
6
6
5
5
5
5
4
4
4
4

Singh, Park e Lee (2009) apresentam um levantamento da frequncia de ocorrncia


dos atributos temporalidade, segurana, acessibilidade, completude, acurcia, coerncia,
relevncia, validade e formato, atravs de uma anlise semntica sobre matrias jornalsticas

62

relacionadas a quatro diferentes situaes de desastres: furaco Katrina, tsunami no Oceano


ndico, ataques de onze de setembro de 2001 e ataques qumicos com a substncia Anthrax.
Medir a qualidade de uma informao em situaes de emergncia no uma tarefa
trivial. Sua determinao est condicionada ao cenrio ambiental corrente e suas constantes
variaes causadas por distintos fatores como, por exemplo, o estgio da resposta crise, o
perfil do consumidor e o nvel de urgncia.
A subseo a seguir relata a passagem de um caso real de emergncia, em que as
circunstncias e o carter de urgncia influenciaram diretamente na qualidade da informao
disposta na ocasio.
3.2.1 Relato Pessoal de uma Lio na Primeira Misso de Resposta a Emergncia
Ao longo de mais de uma dcada integrando a equipe de resposta do Centro de Apoio
Cientfico em Desastres da Universidade Federal do Paran23 (CENACID/UFPR), uma lio
aprendida durante uma atividade de campo merece meno, como forma de motivao sobre
a discusso promovida nesta seo do captulo.
A ocasio marcou minha primeira misso de campo oficial como integrante do
Centro, no ano de 2003. A misso atuou na fase de resposta a danos causados por uma
grande enchente, decorrente de um longo e intenso perodo de chuvas no municpio de
Morretes, localizado no litoral do Paran24.
Como membro da equipe de desenvolvimento de Sistemas de Informaes
Geogrficas do Laboratrio de Geoprocessamento da Universidade Federal do Rio de
Janeiro25 e recm-integrado ao Centro, fui designado a elaborar o mapeamento temtico da
regio afetada, constitudo pelo registro georreferenciado de quaisquer informaes
coletadas pela equipe durante suas atividades de campo: avaliaes de danos, necessidades
da populao afetada, determinao de reas para desocupao, reas de risco, aferies de
nvel do rio, registro histrico de pluviosidade, nvel de eroso do terreno, registros de
reunies com autoridades locais e a comunidade envolvida, etc..

23

CENACID/UFPR - http://www.cenacid.ufpr.br
Relatrio da misso disponvel em http://www.cenacid.ufpr.br/morretes1000/
25
LAGEOP/UFRJ - http:// www.lageop.ufrj.br
24

63

Durante uma incurso de campo, o coordenador da misso, professor Renato Eugenio


de Lima26 - experiente gelogo, coordenador do Centro e integrante da equipe UNDAC para
resposta a desastres naturais - requisitou um mapa que abrangesse a rea em que o grupo se
encontrava naquele momento.
Baseado no mapeamento das informaes registradas atravs das atividades de
campo, da geologia e topografia do terreno, o grupo deveria decidir sobre a interdio do
local. Em meio a condies bastante precrias proporcionadas pela localidade em que nos
encontrvamos, notifiquei ao coordenador que o mapa que dispnhamos naquele momento
era impreciso e que, para prover um material de melhor qualidade, precisava ainda ser
processado aps retornamos base de operaes, o que consumiria cerca de meio dia de
trabalho. Naquele momento, com todo seu conhecimento tcito, adquirido ao longo de
inmeras experincias pretritas, atravs de misses de resposta a desastres, o coordenador
fez sua colocao:
Eu prefiro receber uma informao 70% correta agora do que 90%
amanh ou 100% daqui a dois dias. Se eu esperar este tempo,
decises devero esperar e vidas podero ser perdidas.
Prof. Renato Eugnio de Lima Coordenador do CENACID/UFPR
Na passagem citada, no se tratava diretamente de vidas em risco.

Em outras

ocasies j vivenciadas pelo coordenador da equipe ao longo de anos de experincia na


atuao em respostas a grandes desastres, sua fala se aplicava integralmente. Contudo,
mesmo que em magnitude menor, as circunstncias tambm demandavam uma deciso
urgente a partir da interpretao dos dados de apoio que a equipe dispunha naquele instante.
Portanto, mesmo que ainda deficiente sob alguns aspectos da qualidade da
informao (como a acurcia e completude) e considerando o carter de urgncia, aquela era
a melhor informao momentnea para apoiar a deciso.
3.2.2 A Complexidade na Avaliao da Qualidade da Informao
Ao qualificar uma informao nas circunstncias da experincia relatada acima, ou
seja, considerando o contexto de emergncia, possvel perceber o comportamento tpico de

26

Curriculum Lattes do Prof. Renato Eugenio de Lima - http://lattes.cnpq.br/6541706459894064

64

um sistema complexo, bem como algumas de suas propriedades. A Unidade Coletiva, por
exemplo, exprime a necessidade de analisar a qualidade da informao de maneira que suas
dimenses (ou atributos) estejam sempre correlacionadas.

Ao analisar isoladamente as

dimenses da qualidade da informao acurcia e completude, o conjunto de


informaes disponveis no momento de necessidade de consumo era ainda incompleto e
deficiente.

Alm disso, a melhoria da preciso do mapeamento demandaria um

processamento complementar que custaria tempo e, consequentemente, postergaria a deciso


da equipe.
Entretanto, ao considerar a dimenso atualidade, a informao (o mapa) era a nica
e a mais recente que se dispunha no momento.

Mesmo que ainda deficiente de

completude e acurcia e premido por uma deciso urgente, sob o aspecto da


atualidade a informao era de boa qualidade.

Portanto, diante das condies de

momento, aquela se tornara a melhor informao momentnea para a tomada de deciso.


No apenas sensvel s circunstncias momentneas, o julgamento da qualidade de
uma informao tambm influenciado por quem ir consumi-la. Segundo Stvilia et al.
(2008), Qualidade da Informao o grau em que a informao atende s necessidades de
seus usurios.
Uma vez que pessoas diferentes usam informaes para diferentes fins,
consequentemente as informaes tidas como de alta qualidade para um determinado
usurio, pode ser determinada como de baixa qualidade para outro. A avaliao qualitativa
da qualidade depende do ponto de vista do observador e do dado que est sendo medido
(PINHO, 2001).
Por exemplo, num cenrio de um incndio de grande escala, informaes sobre as
condies meteorolgicas so mais relevantes para a equipe de bombeiros e equipes de
evacuao do que para a polcia e o servio mdico de emergncia. Isso porque a equipe de
bombeiros pode ter que usar plano de contingncia diferente para lutar contra a propagao
de fogo, enquanto a equipe de evacuao tambm necessita desta informao para
determinar o melhor caminho de evacuao em funo da mudana de direo e fora do
vento.
De forma anloga, as informaes relativas ao impacto do acidente - por exemplo, o
nmero de feridos e desabrigados - podem ser mais importantes para os servios mdicos de
emergncia, que precisam despachar recursos mdicos suficientes para o local do desastre.

65

Ao analista de informaes cabe munir a equipe de comando com informaes j


processadas e qualificadas para que o mesmo possa avaliar sua relevncia e optar por
considera-la ou no em sua deciso. Em algumas ocasies, informaes incompletas e/ou
provenientes de fontes tendenciosas, podem distorcer a realidade do cenrio, conduzir a uma
m deciso e gerar consequncias danosas.
Portanto, dispondo de ferramentas analticas adequadas, somadas ao seu
conhecimento tcito e sua viso holstica sobre a situao corrente, cabe ao comando analisar
o conjunto de informaes disponvel e optar por utiliz-las ou no em suas decises.
3.3

Consideraes Complementares
Este captulo se dedicou a uma compilao sobre a conceituao dos sistemas

complexos segundo diferentes pensadores consultados durante a pesquisa referente ao tema.


Alm disso, estabeleceu associaes entre algumas de suas propriedades e a colaborao
social no contexto de emergncias. O captulo tambm promoveu uma reflexo acerca da
complexidade de avaliar a qualidade de uma informao em meio a situaes de emergncia.
O tema ser retomado no Captulo 5, quando os elementos da arquitetura de soluo
proposta sero detalhadamente apresentados, suas associaes com as propriedades dos
sistemas complexos estabelecidas, e os impactos esperados da soluo sobre os atributos da
qualidade da informao sero tambm enumerados.

66

4 Fontes de Informaes no Apoio Emergncia: Capacidades e


Limitaes
Este captulo tem por objetivo caracterizar propriedades e limitaes de fontes de
informaes atualmente disponveis para o apoio na resposta em emergncias, segundo
aspectos essenciais para a viabilizao do seu consumo. Este diagnstico nortear a pesquisa
pelo estado da arte, em busca de abordagens que proponham encaminhamentos para a
soluo das limitaes e requisitos essenciais para apoiar a construo da soluo proposta.
O Quadro 4.1 sintetiza o levantamento realizado sobre as fontes consideradas
(colunas), segundo os seguintes aspectos (linhas):

Disponibilidade de dados: qual o conjunto de atributos disponibilizado pela fonte de


informao?

Nvel de estruturao dos dados: a informao pode ser destrinchada sob uma
estrutura padronizada?

Extrao da localizao e georreferenciamento: disponibiliza em seu conjunto de


atributos a informao precisa de localizao de onde a informao se originou?
Caso no a disponibilize em seu conjunto de dados original, existem meios
alternativos de obter a geolocalizao?

Limite de caracteres e apresentao do contedo: Quais os recursos disponveis


para apresentar a informao de forma mais clara ao consumidor? H limitao da
quantidade de caracteres para apresentar a informao?

Informao complementar: possvel agregar contedo alm do textual


informao para melhor descrev-la (vdeos, udios, fotos, outras arquivos digitais)?

Frequncia de colaborao: A informao disponibilizada em intervalos de tempo


determinsticos?

Comunicao: Qual o tipo de infraestrutura de comunicao necessrio para


transmitir a informao? Quais os riscos da comunicao ser interrompida? Quais as
alternativas para normalizar o servio no caso de uma eventual interrupo?

Confiabilidade da fonte: Qual o nvel de confiabilidade do provedor da informao


originada a partir da fonte? possvel identificar ou determinar a sua confiabilidade
atravs de modelos de reputao?

67

A graduao de cores aplicada s clulas do quadro classifica as condies de


favorabilidade para a fonte de informao apoiar a deciso em situaes de emergncias, em
funo de cada aspecto analisado. A cor verde representa as condies mais favorveis. O
amarelo e o vermelho representam condies razoveis e desfavorveis respectivamente.
Em outras palavras, quanto mais condies favorveis (coloraes verdes) uma fonte de
informao (coluna) apresentar, mais propcia ela para apoiar a deciso em situaes de
emergncias.

68

Quadro 4.1. Caracterizao de distintas fontes de informao colaborativa segundo aspectos de disponibilidade e estrutura de dados, formatao, frequncia de publicao e
confiabilidade do emissor

FONTE
ASPECTO

Disponibilidade
de
Dados
* opcional

SMS
Chamada Telefnica
Data/Hora
contato
Telefone emissor
Data/Hora envio
Nome emissor*
Telefone emissor
Local Evento
Mensagem
Formulrio
estruturado prdefinido

E-Mail

Sensor Ambiental

Data/Hora envio
E-mail emissor
Nome emissor
Assunto
Mensagem
Arquivos anexos

Data/Hora aferio
Localizao
Parmetro(s)
monitorado(s)
Valor(es)
do(s)
parmetro(s)
monitorado(s)

Alto
Alto
Para
cada
Atendente pode Baixo
Baixo
parmetro
Nvel de
cadastrar
Texto livre Texto livre
monitorado(s) h
Estruturao
informao
em
identificao de
identificao de
especificao
dos Dados
formulrios
atributos
atributos
tcnica
e
estruturados prdificultada
dificultada
protocolos para
definidos
leitura dos dados
Cidade/regio Cidade,
poucos
Cidade/regio
DDD
casos, pelo IP
Sensores
DDD
Pode
ser Pode
ser
estticos:
Extrao da
Nome
da
informado
no
informado
no
localizao
Localizao e
localidade pode
corpo
da
corpo
da
precisa e fixa
Georreferenciaser
informado
mensagem
mensagem
Sensores mveis:
mento
pelo
emissor Erros de digitao Erros de digitao
podem informar
durante
a
ou
abreviaes
ou
abreviaes
posio corrente
chamada
dificulta extrao
dificulta extrao
em cada leitura
automatizada
automatizada

Redes Sociais
Data/Hora envio
Localizao*
Apelido emissor
Mensagem
Multimdia*
URL*

Agente de Campo
Data/Hora
Nome agente
Mensagem
Formulrio
estruturado prdefinido

Alto
Baixo
Organizado
em
Texto livre
formulrios pridentificao de
estruturados
atributos
segundo
dificultada
vocabulrios de
domnio
Localizao
Localizao
precisa
precisa quando
Usurio habilita
munidos
de
Posio usurio
dispositivos GPS
pode diferir do
integrados a seus
local do evento
dispositivos
de
Extrao por Proc.
cadastro
de
Ling. Natural do
informaes (hoje
texto apresenta
comum)
baixa eficincia

69

FONTE
ASPECTO

Chamada Telefnica

Limite de
Caracteres e
Apresentao
do Contedo

No h limite de
caracteres
Receptor
pode
filtrar apenas o
que relevante
da conversa com
o emissor
Necessita atuao
humana
(atendente) para
cadastrar o relato

Informao
Complementar
(arquivos,
multimdia)

No h

Frequncia de
Colaborao

SMS

E-Mail

Sensor Ambiental

Redes Sociais

Agente de Campo

Twitter - Limite de
Espao limitado
caracteres (140
(160 caracteres)
Informao
No h limite de Informao
chars) conciso
por mensagem
precisa, objetiva,
caracteres
por
estruturada
versus qualidade
Pode segmentar a
j filtrada pelo
mensagem
Apenas valores de
da descrio
informao
em
agente de campo
Apresentao em
parmetros pr- Abreviaes: kd,
vrias mensagens
Geralmente
formato
HTML
definidos
vc, tc dificultam
Dificuldade
de
estruturada
permite uso de Estrutura
da Demais redes no
digitao
pode
segundo
recursos grficos
mensagem prtm limite de
inibir a escrita e
formulrios
avanados para
definida
caracteres
comprometer
objetivos

melhor
(protocolo para Tags auxiliam a
qualidade
da
proposta
da
apresentao
leitura)
classificao e a
informao
misso de campo
identificao do
(abreviaes)
tema abordado
SMS - Indisponvel
MMS - Fotos, Vdeos
e udios

URLs, Qualquer
arquivo digital

Multimdia
(quando sensores
audiovisuais)

URLs, Multimdia
(fotos, udios e
vdeos)

Qualquer arquivo
digital

Por
demanda
(custos e alocao
Imprevisvel
Imprevisvel
Imprevisvel
Imprevisvel
Definida
pelo
de pessoal)
Mais frequente Mais frequente Mais frequente
Mais frequente
usurio
Incurses
prximo data de
prximo data de
prximo data de
prximo data de
No
requer
definidas
de
ocorrncia
do
ocorrncia
do
ocorrncia
do
ocorrncia
do
esforo humano
acordo com a
evento
evento
evento
evento
necessidade do
Comando

70

FONTE
ASPECTO

Chamada Telefnica

SMS

Comunicao

Dependente de
Dependente de
rede
telefnica
rede
telefnica
fixa ou mvel
mvel operante
operante

Confiabilidade
da Fonte

Mdia
Expe
a
informao
do
nmero
telefnico
do
emissor
Pode retornar o
contato telefnico
para buscar mais
detalhes

Mdia
Possvel requisitar
durante
a
chamada
Annima
em
alguns casos. Ex.:
denncias

Condio para Apoiar a


Deciso em Emergncias

Desfavorvel

E-Mail
Dependente de
disponibilidade de
Internet
Geralmente opera
sobre
rede
telefnica fixa ou
mvel
Possibilidade de
operar
sobre
outras tecnologias
(satlite, rdio)
Baixa
No se conhece
nenhum detalhe
pessoal acerca do
contato
A partir do e-mail
possvel buscar
o perfil em outras
fontes da Internet
Conta pode ser
falsa/recente

Sensor Ambiental

Redes Sociais

Agente de Campo

Dependente de Dependente de
disponibilidade de
disponibilidade de
Internet
Internet
Independe
de
Geralmente opera Geralmente opera
infraestrutura de
sobre
rede
sobre
rede
rede
de
telefnica fixa ou
telefnica fixa ou
telefonia/Internet
mvel
mvel
Comunicao por
Possibilidade de Possibilidade de
rdio/pessoal
operar
sobre
operar
sobre
(alcance limitado)
outras tecnologias
outras tecnologias
(satlite, rdio)
(satlite, rdio)
Baixa
Alta
Perfil pode ajudar
Equipamento
a verificar sua
calibrado
reputao: tempo
Seus
dados
na rede, posts,
representam
rede
de
leituras
relacionamento,
instantneas
e
localidade, etc.
precisas
do
Perfil pode ser
ambiente
falso/recente

Razovel

Alta
Agentes oficiais
Pressupe-se alto
grau
de
confiabilidade
Sujeitos a erros
humanos: escrita,
leitura,
inexperincia,
fadiga

Favorvel

71

4.1 Disponibilidade de Dados


Informaes originadas a partir de chamadas telefnicas podem ser extradas atravs
de um dilogo estabelecido entre o atendente (quem recebe e cadastra a informao) e o
colaborador e instantaneamente cadastradas atravs de formulrios previamente estruturados.
Informaes como a localidade e detalhes acerca da ocorrncia do evento, nome e contato de
retorno do informante (caso deseje divulgar) e quaisquer outros dados relevantes tambm
podem ser registrados, de acordo com o interesse do receptor (atendente) e a disponibilidade
de informaes por parte do colaborador.
Basicamente data e hora do contato, nmero de telefone do emissor e a mensagem
compem um conjunto reduzido de dados disponibilizados por mensagens SMS. Apesar da
limitao quanto disponibilidade de dados, o carter de anonimato e a ubiquidade de
servio tornam o SMS um meio de comunicao bastante popular e confivel para o
provimento de informao colaborativa em eventos de crise (HEINZELMAN, J.; WATERS,
2010; CARAGEA et al., 2011; MUNRO, 2013).
E-mails e redes sociais oferecem uma gama maior de dados estruturados. Por
exemplo, assunto, palavras-chave, URLs, arquivos digitais anexados, contedo multimdia e,
no caso das redes sociais, at mesmo o posicionamento preciso do local de origem da
informao.
Com relao a informaes de contato do emissor, enquanto o e-mail disponibiliza
seu endereo de correio eletrnico, as redes sociais disponibilizam seu nome de usurio
(username) e nmero de registro na plataforma, alm de links que permitem a navegao e a
busca por outros detalhes eventualmente disponveis em seu perfil de usurio (cidade natal,
idade, formao acadmica, frequncia de atividade na rede, interesses, publicaes recentes,
crculos de amizade).

Todavia, geralmente nas redes sociais, o compartilhamento de

informaes pessoais mais especficas acerca de um usurio necessita de sua autorizao


prvia ou do cumprimento de pr-requisitos, como, por exemplo, fazer parte de seu crculo
de amizade.

72
Ainda com relao ao conjunto de dados disponibilizados por mensagens atravs das
redes sociais, as tags27, eventualmente inseridas pelo autor da publicao, representam
palavras-chave que podem auxiliar na classificao com relao ao assunto tratado no corpo
da mensagem e/ou contedo multimdia.
Nos e-mails, a interpretao do campo assunto - preenchido pelo emissor com a
finalidade de representar um indicativo sobre o tema tratado na mensagem - pode apontar
mais facilmente a classificao temtica da mensagem recebida.
Os dispositivos de sensoriamento remoto basicamente disponibilizam a data, hora e
o valor do(s) parmetro(s) monitorado(s), informao suficiente para o propsito de sua
atividade. Em se tratando de sensores estticos, a informao da localizao espacial pode
ser registrada no momento de sua instalao no ambiente monitorado. Para sensores de
posicionamento dinmico, sua posio corrente poder ser obtida em tempo real, a cada nova
leitura de dados.
Agentes de campo podem disponibilizar dados de acordo com a necessidade da
aquisio. Com relao aos colaboradores oficialmente envolvidos na resposta emergncia
(equipes de campo), suas atividades de coleta de dados so demandadas de acordo com as
necessidades da equipe de comando. Sendo assim, alm das informaes pessoais do agente,
data e hora da coleta, o conjunto de dados disponveis varia em funo do setor de sua
atividade de resposta (sade, segurana, infraestrutura, logstica, etc.).

Podem ser

considerados suficientemente completos, uma vez que so organizados atravs de


formulrios estruturados, pr-estabelecidos pelas partes interessadas no consumo da
informao.
4.2

Nvel de Estruturao dos Dados


Os SMSs, e-mails e redes sociais constituem fontes de informao com baixo nvel

de estruturao de dados. Nestes canais de comunicao, a informao publicada em


campos de mensagens de texto livre.
As tags adicionadas s mensagens de redes sociais podem apoiar o processo de
classificao temtica nestas fontes de informao.

27

Mesmo assim, as tags tambm

Tags corresponde a um conjunto de palavras-chave atribudas por usurios, a contedos publicados na web
(textos, imagens, vdeos, etc.). A atribuio de tags cria estruturas classificatrias que aumentam o
desempenho dos mecanismos automatizados de busca e recuperao (VOSS, 2007).

73
representam campos livres, no estruturados e podem apresentar qualquer tipo de contedo,
sem um padro de escrita definido e at mesmo com erros de ortografia.
Existem hoje propostas de estruturao de contedo em microblogs atravs da
anotao semntica, como o Semantic MicroBlogging (SMOB)28 (PASSANT et al., 2010).
Entretanto, para viabilizar a ideia necessrio que usurios publiquem atravs de uma
interface personalizada, que possibilite a anotao semntica do contedo medida que vo
digitando o texto de sua publicao. Alm disso, requer o domnio e a promoo de uma
campanha pela adeso de uma nova ferramenta, esbarrando na resistncia diante da
praticidade e agilidade oferecida pelas aplicaes originais das redes sociais mais populares.
Sensores ambientais apresentam alto nvel de estruturao de dados. Os dados
registrados por estes dispositivos representam leituras do ambiente segundo parmetros
previamente definidos por seus proprietrios. Uma vez calibrados, os valores registrados
estaro sempre dentro de um intervalo conhecido pelo consumidor do dado. Por exemplo,
para sensores de temperatura de um ambiente externo, o sensor registrar sempre valores
referentes temperatura corrente do ambiente monitorado, segundo a escala definida durante
a calibrao (graus Celsius, Farenheit, Kelvin ou uma escala arbitrria).
Agentes de campo tambm podem trabalhar com alto nvel de estruturao de dados,
atravs do preenchimento de formulrios contendo campos previamente estruturados pelo
consumidor da informao (MARINO et al., 2012). Desta maneira todos os agentes oficiais
espalhados em atividades de campos trabalham de forma estruturada e padronizada (Figura
4.1), facilitando a triagem dos dados capturados, atendendo objetivamente s necessidades
das equipes de gesto da informao e, consequentemente, aumentando a efetividade da
colaborao.

28

Semantic MicroBlogging (SMOB) - https://github.com/smob

74

Figura 4.1. (a) Avaliaes de deslizamentos por equipes de campo em Terespolis RJ; (b) Plataforma de
coleta e envio remoto de dados estruturados em formulrios eletrnicos atravs dispositivos mveis (MARINO
et al., 2012)

4.3

Extrao da Localizao e Georreferenciamento


A extrao da localidade geogrfica de forma automatizada conta hoje com artifcios

que permitem a identificao de coordenadas geogrficas a partir de endereos, nomes de


localidades e at mesmo atravs do endereo IP (Internet Protocol)29 da estao de trabalho
do usurio.

Alm disso, dispositivos mveis comumente j integram receptores GPS

capazes de determinar a localizao corrente do usurio com exatido mtrica. Outro ponto
positivo que o sistema GPS autnomo, ou seja, independe da disponibilidade de sinal de
telefonia mvel para operar normalmente.
No caso de contatos telefnicos, a extrao automatizada da localizao da origem
da chamada, apesar de tecnicamente possvel, no pode ser publicada por motivos bvios de
preservao da privacidade do informante. Uma consulta na base de clientes das operadoras
telefnicas possibilita a identificao do endereo de instalao de cada terminal fixo. Por
meio da aplicao de ferramentas de geocodificao30 possvel converter o endereo de
porta do assinante em suas respectivas coordenadas geogrficas, com razovel preciso.
No caso das chamadas provenientes de dispositivos celulares, a operadora pode
determinar o posicionamento corrente do assinante atravs de tcnicas de triangulao da

29

http://www.iplocation.net/
Geocodificao o processo de converso de endereos (como "1600 Amphitheatre Parkway, Mountain
View, CA") em coordenadas geogrficas (como latitude 37.423021 e longitude -122.083739. Fonte: Google
Maps API - https://developers.google.com/maps/documentation/geocoding/?hl=pt-br#Geocoding
30

75
intensidade do sinal emitido pelo dispositivo mvel e recebido pelas estaes rdio-base
(ENEH JOY NNENNA, 2012).
Todavia, apesar da determinao da localidade de origem de um contato telefnico
ser tecnicamente possvel, existem questes de privacidade que devem ser respeitadas. A
privacidade do informante deve ser preservada de acordo com seu desejo e, sendo assim, sua
localizao pode ser divulgada apenas sob seu consentimento.

No entanto, desde que

utilizada apenas internamente, isto , somente para fins de processamento da validao e


verificao da confiabilidade da origem da informao, a privacidade do informante poder
ainda ser mantida.
Cabe observar que muitas vezes a localidade da origem da ligao pode no ser a
mesma localidade da informao a qual o colaborador se refere, principalmente nos casos em
que o contato originado a partir de um terminal telefnico fixo. Um indivduo que presta
uma informao colaborativa a partir de um terminal telefnico pode, por exemplo, estar
realizando a chamada em sua residncia e comunicando sobre um evento ocorrido a
quilmetros de distncia daquele local (situao ilustrada na Figura 4.3).
Por outro lado, novamente sob a perspectiva da preservao da confidencialidade do
emissor, neste caso a divulgao da localidade do evento objeto da informao no
comprometer a privacidade do informante. A localidade objeto da informao pode ser
obtida atravs da aplicao de ferramentas de geocodificao de endereos (disponibilizadas
atravs de servios como o Google Geocoding API31, Microsoft Bing32 e Yahoo! BOSS
Geo33) sobre o nome da localidade de ocorrncia do evento informado durante o contato
telefnico.
No caso das redes sociais, considerando que em grande parte dos casos, seu acesso
ocorra por meio dos dispositivos mveis (que comumente dispem de receptores GPS
integrados), coordenadas geogrficas de posicionamento corrente do emissor tambm podem
ser instantaneamente aferidas e registradas no conjunto de atributos da informao, conforme
ilustrado na Figura 4.2.

31

Google Geocoding API - https://developers.google.com/maps/documentation/geocoding/?hl=pt-br


Microsoft Bing - http://msdn.microsoft.com/en-us/library/ff701714.aspx
33
Yahoo! BOSS Geo - http://developer.yahoo.com/boss/geo/docs/location-parameters.html
32

76

Figura 4.2. Atributos de uma publicao da rede social Twitter: destaque da informao das coordenadas
geogrficas do local corrente do emissor no momento da publicao

No entanto, por medidas de respeito privacidade do usurio, o posicionamento


geogrfico do emissor publicado somente quando habilitado pelo mesmo. Por outro lado,
no caso de informaes colaborativas no contexto de emergncias, o cidado, consciente da
importncia da informao da localizao geogrfica, tende naturalmente a habilitar o
registro de seu posicionamento corrente ao publicar uma informao de carter colaborativo,
diretamente do local o qual sua informao se refere.
Assim como nos contatos provenientes de chamadas telefnicas, importante
tambm alertar para os casos em que o emissor possa estar publicando informaes acerca de
um fato ocorrido em localidade distinta daquela em que ele se encontra no momento da
publicao.

Ao receber uma informao atravs dos canais de colaborao social,

importante perceber que duas posies geogrficas distintas podem estar associadas a esta
mensagem: 1) a localidade do usurio no momento da publicao da mensagem; 2) e a
localidade do evento ao qual o emissor se refere em sua publicao.
Em condies ideais estas duas posies se equivalem, ou seja, quando o emissor
publica a informao diretamente da localidade do evento ao qual o mesmo se refere. Porm,
h ocasies em que a localidade de origem da publicao no coincide com a localidade a
qual a informao se refere.

Neste segundo caso, assumir o valor das coordenadas de

localizao contidas no conjunto de dados da mensagem resultar num equvoco de


georreferenciamento.
De acordo com Rogstadius et al. (2013), embora hoje a publicao das coordenadas
de posicionamento corrente do usurio (ao denominada geotagging) esteja disponvel nas

77
redes sociais mais populares, no microblog Twitter apenas 1% das publicaes
disponibilizam a informao da geolocalizao do usurio. Alm disso, para esta pequena
parcela, esta informao sempre se refere posio do usurio no momento de sua
publicao, muitas vezes diferente da localidade a qual a mensagem se refere (aquela que de
fato importa para a emergncia).
Os casos exemplificados a seguir ilustram circunstncias que ocasionam tal fato:

O informante pode estar se referindo a um evento j ocorrido e de fato testemunhado


por ele em determinado momento passado. Sendo assim, provavelmente ele pode j
haver se deslocado e afastado da localidade da ocorrncia do evento e publicado seu
relato, at mesmo ilustrado com fotos do local, alguns minutos ou horas aps seu
testemunho ocular (situao ilustrada na Figura 4.3). Neste caso, mesmo que a
publicao da geolocalizao do usurio esteja habilitada e, portanto, presente no
conjunto de dados da informao capturada pelo sistema de coleta, este dado no se
refere localidade real da ocorrncia relatada;

So tambm bastante comuns os casos em que cidados publicam informaes com


um carter mais crtico ou simplesmente para compartilhar uma informao de grande
impacto, recebidas atravs de outras fontes como noticirios ou at testemunhos de
pessoas diretamente do local. Contudo, estes cidados podem estar localizados em
outras cidades e at outros pases, bem distantes do local real do evento referido.

Figura 4.3. Diferena entre a localizao geogrfica corrente do informante e o evento ao qual ele se refere em
uma informao colaborativa publicada atravs de uma rede social

78
A rede social Facebook oferece uma interface simples e objetiva para que o usurio
atribua uma localidade geogrfica a sua publicao. Neste caso, diferentemente do microblog
Twitter, a informao da localidade adquirida no conjunto de dados da publicao se refere
exatamente ao objeto do assunto, conforme pode ser verificado no exemplo ilustrado pela
Figura 4.4.

Figura 4.4. Insero da informao da localidade do evento relatado em uma publicao na rede social
Facebook34

Especificamente no caso do microblog Twitter, os 140 caracteres e o alto grau de


coloquialismo caracterstico deste meio de comunicao impactam na reduo da efetividade
de tcnicas automatizadas de extrao de entidades nomeadas atravs dos algoritmos
baseados em processamento de linguagem natural como uma alternativa para a determinao
da localidade geogrfica referente publicao (SPRING et al., 2013).
A determinao da posio corrente de agentes de campo tambm trivial quando
estes trabalham munidos de receptores GPS.

Neste caso, diferentemente do problema

colocado com relao s redes sociais, o equvoco gerado pela diferena entre a localidade
da publicao e a localidade do evento descrito no dever ocorrer, uma vez que os agentes
devem ser instrudos a coletar as coordenadas no momento em que esto analisando e
coletando informao no local de interesse.
Para contatos originados por e-mail, ferramentas gratuitas disponveis na web
viabilizam a identificao da localizao do emissor a partir do IP registrado no cabealho da
mensagem.

34

Contudo, sua determinao, na maioria dos casos, pode ser equivocada,

https://www.facebook.com/about/location

79
conforme o exemplo a seguir. Uma mensagem enviada por um usurio localizado no Brasil,
atravs do navegador web, a partir de uma conta do provedor Gmail35, agrega no cabealho
da mensagem o IP dos servidores da empresa Google, em San Jos Califrnia EUA. A
Figura 4.5 apresenta o resultado do exemplo citado.

Neste caso, portanto, somente a

aplicao de mtodos de processamento de linguagem natural para a extrao de entidades


nomeadas sobre o contedo da mensagem resta como alternativa para a obteno da
localidade geogrfica de forma automatizada.

Figura 4.5. Teste de localizao do emissor do e-mail a partir do IP do cabealho da mensagem na ferramenta
WolframAlpha36

No caso dos sensores a determinao da geolocalizao trivial. Para sensores


estticos, a informao origina-se sempre de uma localidade fixa, cuja posio conhecida
no momento da instalao do dispositivo no ambiente. Para sensores de operao mvel
(monitoramento de viaturas em tempo real, por exemplo), receptores GPS podem ser
integrados e sua posio enviada em tempo real, juntamente com os demais dados de
monitoramento.

35
36

Servio de e-mail Google Gmail - http://www.gmail.com


WolframAlpha - http://www.labnol.org/internet/find-location-from-ip-address/21094/

80
4.4

Limite de Caracteres e Apresentao do Contedo


Informaes provenientes de contatos telefnicos no apresentam restries com

relao limitao de contedo. Atravs do dilogo estabelecido na chamada, o atendente


pode filtrar e cadastrar na base de informaes apenas o que relevante da conversa com o
colaborador, estruturada atravs de formulrios de cadastro pr-estabelecidos pela
coordenao da operao.
A rede social Twitter conhecida como um microblog. Esta denominao se d pelo
fato de seus usurios postarem mensagens com o limite mximo de 140 caracteres, o que
pode prejudicar a qualidade da informao prestada. Usurios buscam superar esta limitao
imposta pelo microblog criando abreviaes de grafias (por exemplo, vc, kd, tc, pq),
utilizando forma de comunicao paralingusticas (como por exemplo o uso de emoticons,
letras maisculas ou repetio de caracteres para expressar suas emoes) e sendo concisos
em suas publicaes. Tal fato pode induzi-los a suprimir detalhes talvez importantes e que
poderiam ser acrescentados em sua colaborao, porm inibidos pela limitao imposta pela
plataforma.
Criado antes da popularizao dos smartphones, o Twitter j visionava a ubiquidade,
num mundo em que seus usurios pudessem publicar o que estavam pensando ou
testemunhando, de qualquer lugar, a qualquer hora. Na poca, utilizou ento o recurso do
SMS - ora disponvel em qualquer aparelho de telefonia celular - como meio de transmisso
das publicaes de seus usurios. Isto explica sua limitao inicial quanto quantidade de
caracteres naquela poca.
Hoje, mesmo com a popularizao dos smartphones e das redes de dados, e no mais
sujeito limitao tecnolgica caracterstica do servio SMS, a restrio de 140 caracteres
por publicao permanece imposta aos seus usurios. Tal limitao se justifica apenas como
uma estratgia dos reguladores da plataforma: caracteriz-la como um canal de publicaes
curtas e, consequentemente, de rpida leitura e livre de poluies visuais causadas por
contedos muito extensos. A estratgia tem dado certo. O Twitter hoje uma das maiores
redes sociais do mundo, alm de no competir diretamente com diversas outras redes, como
o Facebook, justamente devido a esta caracterstica, o que lhe prov originalidade.
Alguns usurios costumam complementar suas publicaes com a indicao de URLs
para textos complementares, como um artifcio de prover uma informao mais completa,
principalmente em microblogs, como o Twitter, em que esto limitados pela quantidade de

81
caracteres. A partir de anlises sobre o comportamento dos usurios da rede social Twitter
durante distintos eventos emergenciais ocorridos nos Estados Unidos, Hughes e Palen (2009)
verificaram em suas amostras que 50% das mensagens verificadas continham URLs com a
funo de complementar a informao. Diante desta constatao as pesquisadoras concluem
que as emergncias apresentam altas demandas por informaes que no podem ser
expressas por apenas 140 caracteres.
Mesmo quando no limitados quantidade de caracteres nas inmeras demais redes
sociais, seus usurios so envolvidos por um ambiente de conciso e informalidade. Por isso
tendem naturalmente a escrever de modo coloquial e sem riqueza de detalhes, o que acaba
empobrecendo e comprometendo a qualidade informao. Por um lado, existe um ganho em
termos de rapidez e atualizao da informao. Por outro, a informao deficiente no que
diz respeito a sua clareza, estruturao e completude.
A mesma ateno deve ser tomada com relao s mensagens oriundas do servio
SMS, que limita ao usurio apenas em 160 caracteres.

Alguns dispositivos buscam

contornar esta limitao disponibilizando ao usurio um espao para digitao da mensagem


com tamanho livre. Apesar da limitao por mensagem ainda existir (isto uma definio
de protocolo da tecnologia), o que o aparelho faz segmentar a mensagem em conjuntos de
160 caracteres, e envi-las sequencialmente ao destinatrio.
Portanto, para estas fontes de informao e todas as demais caracterizadas pelo baixo
nvel de estruturao da informao, a exemplo do e-mail, campanhas e apelos populao
atravs das prprias fontes de informaes colaborativas devem ser promovidas pelo
comando, com o objetivo de incentivar a publicao da informao colaborativa pelo
cidado de forma mais clara, completa, objetiva, evitando coloquialismos e abreviaes,
como uma tentativa de obter um contedo de melhor qualidade para o processamento e
possivelmente mais til para a deciso.
No caso das colaboraes originadas por mensagens de e-mail, alm de no existir
limite de caracteres para a composio da mensagem, a possibilidade da formatao do
contedo em HTML (HyperText Markup Language) oferece ao emissor recursos grficos de
formatao avanados (tabelas, grficos, imagens, formatao de texto, construo de
formulrios), possibilitando a apresentao da informao de maneira mais clara, detalhada e
estruturada ao receptor.

82
No que tange os meios de comunicao caracterizados pelo baixo nvel de
estruturao, elevado grau de coloquialismo e alta frequncia de paralinguismos (como o email, SMS e as redes sociais), a aplicao de mtodos de anlise de sentimentos pode apoiar
a compreenso do humor e emoo do emissor em sua publicao.

No cenrio de

emergncia, a compreenso da emoo pode apontar nveis de urgncia de um apelo por


ajuda, alm de medir o grau de satisfao ou insatisfao de uma comunidade. Atualmente,
diversas linhas de pesquisa atuam na anlise de sentimentos sobre distintas formas de
apresentao do contedo (GO et al., 2009; PASSONNEAU, 2011; MAZUMDAR et al.,
2013).
Com relao aos sensores ambientais e agentes de campo, a limitao de contedo
no se aplica. Em ambos os casos, conforme descrito na seo 4.2, os dados so plenamente
estruturados, apresentados em formatos previamente definidos e intervalos de valores
esperados pelo consumidor.
4.5

Informao Complementar (Arquivos e Contedo Multimdia)


Com exceo da telefonia fixa, todas as demais fontes de informaes levantadas

nesta pesquisa dispem de recursos para o envio de informaes complementares, como


arquivos digitais, fotos, gravaes sonoras e vdeos, recursos estes que podero enriquecer a
qualidade e atestar a validade da informao prestada.
Como alternativa ao SMS, mensagens MMS (Multimedia Messaging Service)
permitem a incluso de imagens s mensagens, promovendo o enriquecimento da qualidade
da informao prestada.
4.6

Frequncia de Colaborao
Segundo Gouveia, Cristina e Fonseca (2008), o nvel de comprometimento voluntrio

imprevisvel. De acordo com a publicao, o princpio NIMBY (em portugus, no em


meu quintal) representa uma das barreiras comprometedoras da participao do cidado. Os
autores concluem que o comprometimento da sociedade com a colaborao maior quanto
maior for o grau de perturbao da normalidade de sua comunidade e/ou seus entes mais
prximos.
A anlise de dados oriundos de atividades de colaborao em situaes de crises
pretritas levou Heinzelman e Waters (2010) a conclurem que a quantidade de informao

83
colaborativa proporcional data da deflagrao da crise, sendo mais efetiva especialmente
nas duas primeiras semanas.
No caso dos sensores ambientais, a frequncia de atualizao pode ser configurada
remotamente pelo consumidor da informao. Outra vantagem que o monitoramento
dispensa a ao humana, e consequentemente, reduzindo a margem de erro das aferies,
dispensando gastos com treinamento, mobilizao pessoal e polticas de incentivo e
recompensa ao trabalho realizado, alm de estender sua capacidade a monitorar locais
inabitveis, como reas de altitudes ou temperaturas extremas e alta radioatividade.
Com relao aos agentes oficiais de campo, a frequncia de colaborao regulada
de acordo com a necessidade da equipe de comando. Porm, neste caso, diferentemente dos
sensores ambientais, demanda esforos humanos, dispndio de tempo e dinheiro em
treinamentos e deslocamento de equipe, alm da atuao ser restringida sua capacidade de
acessibilidade. Por outro lado, o raciocnio humano prov ao agente a capacidade de realizar
tarefas mais complexas do que os sensores, sendo estes ltimos, ideais para monitoramentos
repetitivos, de longa durao e em locais de difcil acesso.
4.7

Comunicao
Conforme abordado na motivao de trabalho (subseo 1.3), diante de cenrios de

emergncias de grande magnitude, vias de acesso, redes de abastecimento de gua e luz e


meios de comunicao so comumente interrompidos em decorrncia de efeitos dos eventos
danosos, como a queda de rvores, ocorrncia de exploses, enchentes, desmoronamentos,
etc.
Justamente quando a disponibilidade desta infraestrutura vital para a efetividade da
resposta situao de emergncia, comumente encontra-se limitada ou interrompida. O
rpido reestabelecimento destes servios primordiais para a sociedade deve ser priorizado, de
modo que a comunidade no sofra ainda mais com as consequncias de sua interrupo e as
atividades de resposta no sejam prejudicadas.
Para os grandes desastres naturais em que a equipe UNDAC (United Nations
Disaster Assessment & Coordination) atua, o escritrio das Naes Unidas divide sua equipe
em onze subgrupos denominados clusters37 (dispostos na Figura 1.1), responsveis pela

37

What are UN clusters? - http://business.un.org/en/documents/249

84
reestruturao e manuteno emergencial dos servios primordiais sociedade: logstica,
nutrio, abrigos de emergncia, gerenciamento e coordenao de campo, sade, proteo,
agricultura, telecomunicao, recuperao rpida, educao e gua e saneamento (OCHA,
2012).
Especificamente no grupo das telecomunicaes, a UNDAC conta com parceiros
como a Organizao No Governamental francesa Telecoms sans Frontires (TSF)38. A
Organizao mobiliza recursos materiais e humanos para o estabelecimento e a manuteno
de uma rede comunicao provisria no local, at que a normalidade seja reestabelecida.
Em um caso real, durante a fase de recuperao aos deslizamentos na regio serrana
do Rio de Janeiro, em 2011, a companhia concessionria de telefonia fixa e mvel local
distribuiu cartes SIM (Subscriber Identity Module) para aparelhos celulares e habilitou
todos os terminais de utilizao pblica da regio (populares orelhes) a realizarem
chamadas gratuitas para terminais fixos e celulares daquela mesma companhia, enquanto a
condio de normalidade no fosse reestabelecida. A iniciativa facilitou a comunicao
entre a populao envolvida no desastre, que buscava notcias sobre a localizao e as
condies de seus entes prximos.
Logicamente que uma soluo embasada na colaborao atravs de meios de
comunicao necessita do pleno funcionamento destes servios para que o trfego dos dados
seja possvel. Mesmo assim, verifica-se que, dada importncia das comunicaes para a
sociedade e as equipes de reposta crise, mesmo quando os danos causados sobre a rede so
de grande magnitude, muitos esforos so dedicados ao gil reestabelecimento e sua
manuteno durante a fase de resposta.
4.8

Confiabilidade da Fonte
Quando a colaborao se origina a partir de um contato telefnico, o carter de

anonimato reservado ao emissor pode comprometer a fidedignidade da informao prestada.


O mesmo ocorre com relao confiabilidade de informaes oriundas de mensagens SMS.
Visando respeitar sua privacidade e considerando a impossibilidade de consulta base de
clientes da operadora telefnica, no possvel identificar detalhes acerca do emissor da
informao.

38

Tlcoms Sans Frontires (TSF) - www.tsfi.org/

85
Contudo, exemplos de casos como o Disque-Denncia (2014) e Munro (2013)
demonstram que iniciativas de prestao de informaes a partir de contatos telefnicos
(considerando tambm as mensagens SMS) evidenciam um alto grau de confiabilidade. A
iniciativa de um cidado expor seu nmero de telefone, algo pessoal, indica uma atitude
deliberada de cooperao atravs da prestao de uma informao verdadeira. Portanto,
mesmo isento de uma investigao mais minuciosa sobre a origem e reputao do
informante, pode-se sugerir um razovel grau de confiabilidade pela informao prestada
quando originada a partir de um destes dois meios de comunicao.
Com relao s redes sociais, o perfil descritivo do usurio pode ser til para a
anlise de sua reputao, como dados sobre a sua localidade de origem, data de cadastro na
plataforma, quantidade de publicaes, rede de relacionamentos, histrico de atividades e
interaes com outros usurios da rede.
Assumindo que os procedimentos de instalao e calibragem de sensores ambientais
ocorram de forma adequada, sua confiabilidade considerada alta, por tratar-se de
dispositivos automatizados que realizam leituras do ambiente com elevado grau de preciso
e margem de erro controlada.
Agentes de campo so colaboradores oficialmente treinados e exclusivamente
dedicados. Para estes profissionais pressupe-se elevado grau de confiabilidade com relao
credibilidade dos dados por estes coletados. Contudo, tais indivduos ainda esto sujeitos a
eventuais erros de interpretao inerentes ao envolvimento do fator humano, como a fadiga,
inexperincia, erros de escrita ou leitura, alm de imprecises resultantes da subjetividade de
suas anlises qualitativas.
4.9

Consideraes Complementares
Este captulo apresentou um diagnstico sobre as caractersticas e limitaes

inerentes s distintas fontes de informaes analisadas, segundo aspectos relevantes para a


coleta e tratamento de informaes que podem apoiar a resposta durante situaes de
emergncia.
O captulo a seguir documentar a pesquisa do Estado da Arte realizada com o
objetivo de buscar encaminhamentos aos requisitos levantados neste captulo, de modo a
apoiar a concepo da arquitetura de soluo.

86

5 Trabalhos Relacionados
Cada vez mais grupos e fruns vm trabalhando e promovendo discusses
sistemticas acerca da importncia dos sistemas colaborativos para apoio a emergncias e
como a evoluo tecnolgica pode contribuir para a interao e a explorao da participao
social nas polticas pblicas.
Alguns exemplos destas iniciativas so: CSCWD39 - Conference on Computer
Supported Cooperative Work in Design, CRIWG40 - Conference on Collaboration and
Technology, CSCW41 - Computer-Supported Cooperative Work, SMILE42 - Workshop on
Social Media and Linked Data for Emergency Response, ISCRAM43 - International
Conference on Information Systems for Crisis Response and Management.
Com base nestas iniciativas, este captulo relata os produtos da pesquisa na literatura
sobre o estado da arte, em busca de abordagens que promovam a investigao e solues
relativas s demandas e os desafios envolvidos na captura e no tratamento de informaes
para o apoio deciso no contexto de emergncias.
5.1 Quadro Sntese da Pesquisa ao Estado da Arte
O Quadro 5.1 apresenta o conjunto de referncias bibliogrficas mais relevantes,
levantado atravs da pesquisa relativa ao estado da arte, relacionando-as com os tipos de
fontes de informaes examinados. O quadro tambm aponta quais aspectos relacionados ao
tratamento da informao gerada em situaes de emergncia (apresentados no Captulo 4)
foram abordados por cada autor.

39

CSCWD - http://www.cscwd.org/
CRIWG - http://www.criwg.org/
41
CSCW - http://cscw.acm.org/
42
SMILE - http://linkedscience.org/events/smile2014/
43
ISCRAM - http://www.iscramlive.org/
40

87

Quadro 5.1. Fontes de informao e aspectos relacionados ao tratamento da informao colaborativa abordados pelas principais referncias de apoio consultadas

Referncia
SOS (2008)
DISQUE-DENNCIA (2014)

Fontes de Informao
Contato
Telefone

SMS

X
X

X
X

E-mail

Redes
Sociais

HEINZELMAN e WATERS
(2010)

BOULOS et al. (2011)

X
X
X
X
X

PUROHIT et al. (2013)


TSUR, LITTMAN e
RAPPOPORT (2013)

Classificao

X
X
X

HOWARD (2013)
FININ et al. (2010)
TANG et al. (2011)
CORDEIRO et al. (2011)

Frequncia
Colaborao

Confiabilidade

X
X

X
X

X
X

X
X

X
X
X
X

X
X
X
X

Interoperabi
lidade

X
X
X
X

X
X

X
X

CHARIKAR (2002)
AGGARWAL e ZHAI (2012)

Agrupamento

BOMAN et al. (2014)

ROGSTADIUS et al. (2013)

Traduo

HUGHES e PALEN (2009)

CAMERON et al. (2012)

Geolocalizao

MARINO, NASCIMENTO e
BORGES (2012)

CARAGEA et al. (2011)

Aspectos Relacionados ao Tratamento de Informao Colaborativa

Agente Estruturao
Sensor
Campo
de Dados

X
X
X
X

X
X
X

X
X
X

X
X
X
X

88
O Quadro 5.1 evidencia um maior volume de abordagens que atuam sobre as redes
sociais frente s demais fontes de informaes.

Este desequilbrio justificado por

tendncias atuais e outros fatores j abordados no Captulo 2. Do outro lado, os meios de


comunicao mais tradicionais como o contato telefnico, e-mail e SMS vm perdendo
espao nas abordagens mais recentes. Mesmo assim no podemos deixar de consider-las.
A propsito, o que este desequilbrio justamente evidencia a ausncia de propostas
flexveis e integradoras no estado da arte.

As solues verificadas so restritas e

especializadas em operar apenas sobre fontes de informaes especficas. A proposta de


contribuio deste trabalho promover a captura e o tratamento de maneira integrada entre
fontes heterogneas, independentemente de seus protocolos de comunicao e estruturao
de dados. Ao combinar suas especificidades e buscar solues aos requisitos conjuntamente
levantados, possvel criar uma soluo mais robusta, flexvel, completa e adaptvel a
futuras novas agregaes.
5.2 Escopo, Desafios, Resultados e Concluses das Obras Pesquisadas
Os pargrafos a seguir descrevem o escopo, os principais desafios, os resultados e as
contribuies relevantes alcanadas em cada obra consultada, apresentadas de acordo com a
ordenao da relao disposta no Quadro 5.1.
O relatrio do servio sueco de atendimento a emergncias SOS (2008) documenta o
caso bem sucedido da agncia no pronto atendimento de emergncias populao do pas.
Seu atendimento se d predominantemente atravs de chamadas telefnicas e mensagens
SMS, alternativa criada especialmente para servir aos cidados com deficincia auditiva e/ou
de fala. O centro de atendimento distribudo em agncias de atendimento regionais, alm
de dispor de conexo direta com os servios de atendimento local de bombeiros, polcia,
resgate, ambulncias.
O relatrio menciona o fato positivo da tendncia migratria dos contatos telefnicos
partirem cada vez menos de terminais fixos, dando lugar s chamadas originadas por
dispositivos celulares, o que trouxe maior agilidade e rapidez nos acionamentos de chamadas
de emergncia, e, consequentemente, ocasionou uma reduo significativa no tempo de
resposta. Por outro lado, tal fato implicou no considervel aumento do nmero de alarmes
falsos.

89
A agncia aponta alguns fatos que contriburam positivamente para a reduo do
tempo de resposta a um chamado:
1) Desenvolvimento da capacidade de localizar a origem de cada chamada mvel. No
ano de 2007, uma parceria com operadoras de telecomunicaes possibilitou a
determinao da posio geogrfica de qualquer chamada mvel dentro do pas.
Quando uma chamada telefnica celular atendida pela central (o que representa
70% das origens dos contatos), um servio automtico imediatamente solicita uma
requisio a todas as operadoras locais, informando o nmero do terminal mvel
como parmetro.

Em seguida, a operadora do nmero chamado responde

requisio, informando seu par de coordenadas de localizao corrente e a margem


de erro da aferio.
2) Investimento em um sistema de comunicao autnomo (via rdio) entre a agncia e
os servios de atendimento emergenciais locais, para onde so despachadas as ordens
de atendimentos.
3) Reduo do nmero de chamadas falsas em 50% (desde o ano 2000), principalmente
devido promoo de campanhas publicitrias de informao dirigidas a crianas e
jovens. Mesmo assim o nmero de chamadas falsas ainda muito elevado, o que
resulta em desperdcio de tempo e recursos humanos.
A publicao tambm relata a dificuldade de identificar a localizao geogrfica de
chamadas via satlite e provenientes de telefonia IP, cada vez mais comuns, o que
impossibilita o encaminhamento da chamada central regional de atendimento mais
prxima.

Nestes casos, as chamadas so encaminhadas agncia central do servio,

especializada neste tipo de atendimento.


Outro aspecto crtico enfrentado pela agncia com relao grande quantidade de
ligaes recebidas durante eventos crticos, como grandes tempestades, enchentes,
queimadas, dentre outros fenmenos desastrosos de grande magnitude.

O nmero de

ligaes costuma exceder capacidade operacional de atendimento, o que reflete


diretamente no aumento do tempo de resposta (filas de espera em chamadas). Para isso, a
agncia atua junto administrao pblica e companhias de seguro em campanhas de
conscientizao do pblico para realizar chamadas apenas em situaes de real emergncia,
alm do incentivo criao de programas de planos de contingncia e orientao ao cidado

90
em situaes de emergncias. Internamente a agncia introduziu um nmero nacional de
informao para filtrar e aliviar a presso sobre chamadas no emergenciais ao servio 112.
Uma iniciativa bem sucedida de colaborao vigente no Brasil o DisqueDenncia44, um servio voltado para denncia atravs de contatos telefnicos, a partir da
informao prestada pelo cidado. Com respeito premiao por colaboraes efetivas, a
eficincia do Disque Denncia impulsionada por polticas de recompensas a informaes
que comprovadamente resultem no sucesso do objeto de investigao.
Ao longo de 17 anos de existncia foram 1,8 milhes de denncias atravs do canal.
O recorde dirio registrado pelo servio desde sua criao foi de 1.136 denncias em apenas
um dia, em 26 de novembro de 2011, quando as foras policiais ocupavam a comunidade do
Complexo do Alemo, na cidade do Rio de Janeiro (DISQUE-DENNCIA, 2014).
Marino, Nascimento e Borges (2012) apresentam um estudo de caso aplicado a
avaliaes de riscos iminentes e danos causados por deslizamentos de terra, decorrentes de
um longo e intenso perodo de chuvas ocorridas na regio serrana do estado do Rio de
Janeiro, em janeiro de 2011. O trabalho apresenta a plataforma computacional Vigilncia e
Controle - Vicon/SAGA45, um Sistema de Informao Geogrfica (SIG) que apoia a coleta
e o gerenciamento de informaes em respostas a emergncias.
A plataforma viabiliza o registro de dados gerados durante vistorias de campo atravs
do preenchimento de formulrios estruturados, personalizados para diferentes classes de
informao (exemplo: avaliao de deslizamento de terra, pessoa resgatada, estrada
bloqueada). Para cada registro possvel tambm anexar imagens, vdeos e qualquer outro
arquivo digital, conforme ilustrado na Figura 5.1.

44
45

Disque Denncia - http://www.disquedenuncia.org.br


Vicon/SAGA - http://www.viconsaga.com.br/

91

Figura 5.1. Plataforma Vicon/SAGA: mdulo autnomo de entrada de dados por meio de dispositivos mveis
(MARINO et al., 2012)

Os dados so armazenados na memria interna do dispositivo mvel e, quando


disponvel a conexo com a Internet, podem ser submetidos e armazenados no banco de
dados na web. Desta forma, os dados estaro disponveis em tempo real para a avaliao dos
coordenadores remotos, onde quer que estejam. Com esta proposta, o tempo entre a coleta
do dado in loco, a anlise e a deciso do gestor da situao consideravelmente reduzido.
O mdulo analtico da plataforma Vicon/SAGA opera atravs de navegadores e
prov ferramentas para a entrada e visualizao dos dados coligidos pelas equipes de campo.
Possibilita tambm a criao de consultas seletivas, gerao de relatrios, exportao de
mapas e anlises espaciais.
Hughes e Palen (2009) examinam o comportamento de usurios da rede social
Twitter durante quatro eventos distintos, conforme indicados na Figura 5.2.

92

Figura 5.2. Linha do tempo referente ao perodo de coleta de mensagens e ocorrncia dos eventos monitorados
por Hugues e Palen. Adaptado de Hugues e Palen (2009)

A pesquisa busca comparar o comportamento da atividade do microblog entre os dias


normais e dias em que os eventos monitorados ocorreram, segmentando os usurios mais
ativos atravs do nmero de publicaes dirias e analisando o comportamento de novos
usurios, isto , aqueles cuja inscrio na rede social tenha ocorrido durante o perodo de
ocorrncia dos eventos monitorados.
Dentre suas principais metas, a pesquisa tambm analisa a distribuio geogrfica
dos usurios em torno do foco do problema, seus comportamentos segmentados por grupos
(indivduo, organizao, jornalista, militante, etc.), alm de promover uma anlise sobre a
caracterizao do contedo existente nas publicaes, como a presena de arquivos
multimdia, URLs, quantidade de respostas e compartilhamentos realizados.
Como resultado, a investigao verifica que, especialmente em situaes de carter
emergencial, alguns usurios atuam como intermediadores de informaes, ou seja,
aqueles que coletam informaes vlidas a partir de vrias fontes e repassam para ajudar as
vtimas e os gestores da crise.
No que tange o contedo das publicaes analisadas, constatou-se que durante
eventos de emergncia, em mdia 50% das publicaes contm links URL, enquanto durante
as convenes (eventos no emergenciais), os links URL ocorreram em 40% das
publicaes, o que levou a concluir que as emergncias demandam um nvel de
detalhamento de informao que no pode simplesmente ser expressa por 140 caracteres.
Com relao ao volume de informao gerado, os autores concluem que o nmero de
publicaes coletadas para cada evento corresponde ao seu tamanho e impacto sobre a

93
sociedade. A quantidade de tweets coletados para os eventos dos furaces foi
consideravelmente maior do que as publicaes relativas s convenes. A espacializao
das publicaes coletadas aponta um significativo aumento do volume de publicaes dentro
das regies diretamente atingidas pelos furaces, enquanto as convenes proporcionaram
um impacto mais focalizado no entorno das cidades que sediaram tais eventos.
Heinzelman e Waters (2010) relatam alguns benefcios e desafios resultantes do uso
da plataforma Ushahidi (introduzida na subseo 2.3) na fase de resposta ao terremoto
ocorrido no Haiti, em janeiro de 2010. A iniciativa propiciou a cooperao entre haitianos e
as organizaes envolvidas na resposta da emergncia, culminando no envolvimento dos
cidados locais no processo de deciso.
Segundo o relatrio, os desafios mais significativos ocorreram na verificao e
triagem do grande volume de mensagens colaborativas e solicitaes de ajuda recebidas
pelos canais de colaborao estabelecidos com a populao afetada pelo desastre.

traduo do idioma local para o ingls, o georreferenciamento, classificao e verificao da


autenticidade constituam as etapas da cadeia de processamento da informao (Figura 5.3).
Na ocasio, tais procedimentos eram realizados manualmente pela equipe de
colaboradores. O tempo mdio entre o recebimento, o processamento e a entrega de um
relatrio processado para as equipes de campo era de dez minutos.

94

Figura 5.3. Workflow da plataforma Ushahidi. Adaptado de Heinzelman e Waters (2010)

O autor afirma que, diante de situaes catastrficas, a recuperao dos meios de


telecomunicaes tomada como prioridade. Segundo o relatrio, apesar de setenta por
cento das torres de telefonia celular terem sofrido danos decorrentes do desastre em Porto
Prncipe (capital do Haiti, epicentro do terremoto), as mesmas foram rapidamente reparadas
e a comunicao mvel normalizada imediatamente. Os telefones mveis foram os meios
mais diretos de comunicao para os haitianos durante a crise e representaram um salvavidas para muitos sobreviventes.
As mensagens SMS propiciam a discrio a informantes que desejam colaborar e
preservar a confidencialidade de sua identidade. Isto explica o fato deste ter sido o canal
mais frequente de recebimento de relatos sobre violncia naquela ocasio. Alm disso, o
canal uma alternativa de comunicao para aqueles que no possuem smartphones e
pacotes de dados contratados, bastante comum no caso do Haiti, devido ao predomnio da
sua populao de baixa renda.
Outro benefcio proporcionado pela utilizao deste meio de comunicao que, ao
receber uma mensagem incompleta, a equipe de processamento dispunha de um canal de

95
retorno para solicitar diretamente ao informante uma eventual complementao ou
confirmao da informao, simplesmente respondendo ao SMS recebido.

Durante a

resposta ao desastre, graas a acordos firmados com as empresas de telefonia mvel local,
mensagens SMS enviadas ao nmero de atendimento Ushahidi eram gratuitas.
Como identificar rapidamente informaes imprecisas, tendenciosas ou incompletas?
Estes so alguns desafios perseguidos pela equipe Ushahidi em busca de um processamento
mais rpido e eficiente. A partir da experincia adquirida e motivados pela melhoria da
eficincia da colaborao social durante respostas a emergncias, sua equipe de
colaboradores prope algumas medidas como:
1) Criao de redes de informantes de confiana: relatrios podem ser
automaticamente processados, quando recebidos a partir de uma fonte confivel
(como o caso das equipes de campo). Informaes provenientes da colaborao
social podem ser comparadas com informaes confiveis (fontes oficiais e relatrios
j validados).
2) Treinamento de voluntrios: treinamento de grupos de voluntrios comunitrios
para a gerao de informaes completas e acuradas durante situaes de crises, alm
de atuarem como verificadores, demandando pelas equipes de comando. A exemplo
dos agentes das equipes de campo, esses cidados podem atuar como validadores de
informaes, aumentando desta maneira a rede de informantes confiveis.
Os desafios relatados e as medidas propostas pelos autores so pertinentes ao
conjunto de requisitos envolvidos na problemtica desta pesquisa. Reforam ainda mais a
necessidade da criao de mecanismos de feedbacks que viabilizem a comunicao de
retorno para fins de distribuio de demandas e confirmaes aos colaboradores (oficiais e
no oficiais).
Os mecanismos de identificao e agrupamento por similaridade tambm so
fundamentais para o aumento da completude, uma vez que pode congregar diferentes
pedaos de informao sobre uma mesma histria. Os agrupamentos podem tambm apoiar
a validao de cada nova informao colaborativa, ao compar-la com informaes
correlatas j validadas e/ou provenientes das redes de informantes de confiana.
Alm disso, necessrio sinalizar a provenincia e o estgio de validao de cada
informao durante seu processamento, de maneira que o sistema disponha das melhores

96
condies para comparar e determinar autonomamente seu grau de confiabilidade. Um
sistema de reputao tambm pode ser estabelecido e atualizado a cada nova colaborao
recebida a fim de identificar os informantes e as fontes mais confiveis e ativas, como os
intermediadores de informaes caracterizados por Hughes e Palen (2009).

Tais

indivduos podero ser eventualmente recompensados por informaes valiosas (conforme


sugerido na seo 4.6) e at recrutados futuramente como voluntrios para o treinamento em
respostas futuras.
Boulos et al. (2011) denominam A Wikificao dos Sistemas de Informaes
Geogrficos o fenmeno no qual usurios publicam, partilham e disseminam seus
conhecimentos, muitas vezes enriquecidos por contedos multimdia, notas e modelos 3D.
Os autores tambm apontam benefcios do crowdsourcing para a sociedade e cunham
expresses cidados como sensores, sensoriamento participativo, ilustradas atravs de
exemplos como:

A utilizao de dispositivos de navegao por GPS, conectados Internet, que


partilham as condies de trfego em cada trecho coberto pelo motorista;

Como amostras de udio gravadas e enviadas atravs de smartphones de pedestres


fomentam a criao de um mapa instantneo de poluio sonora do ambiente;

O monitoramento em tempo real da qualidade do ar de cidades atravs de uma rede


de sensores ambientais embarcados nas bicicletas de cidados.
Com relao colaborao atravs das redes sociais, os autores alertam sobre a alta

quantidade de rudos existentes no contedo publicado, causados pela desinformao e


preconceito de seus usurios, que podem ser ainda mais amplificados pela natureza viral
das mdias sociais. Como medida atenuadora, a obra cita a plataforma de cdigo aberto
SwiftRiver46 como uma proposta eficaz para a filtragem do contedo til nestes meios.
A reputao e confiana da fonte tambm so temas abordados pelos autores. Em
situaes emergenciais de grande magnitude, um evento pode ser to grande e to remoto de
modo que a avaliao por agentes oficiais seja invivel dentro de um tempo hbil. Nesses
casos, a avaliao executada por colaboradores pode ser satisfatoriamente til. Entretanto,
igualmente importante conhecer o perfil destes colaboradores.

46

SwiftRiver - http://ushahidi.com/products/swiftriver-platform

Trata-se de uma fonte

97
confivel? Existe algum conhecimento prvio capaz de apontar o quo til e confivel seja a
informao proveniente deste colaborador?
Sob o aspecto da confiabilidade do emissor, o estudo sugere um esquema de
formao de reputao dinmica em funo da evoluo do evento e das colaboraes
recebidas. A cada tipo de classe de colaborador atribuda uma pontuao de reputao
inicial, que evolui e se transforma ao longo do tempo, com base em suas interaes e nos
novos contedos recebidos e avaliados pelos gestores de informaes. Enquanto agentes
oficiais podem inicialmente receber a mais alta pontuao de reputao, os cidados
colaboradores devem construir e aumentar seus ndices de reputao medida que geram
novas contribuies (informaes ou execuo de tarefas de apoio) relevantes ao comando
da resposta.
Sob os aspectos positivos do aproveitamento da colaborao social, os autores
defendem que a informao compartilhada demonstra ser:

Mais oportuna, pois as circunstncias envolvem uma presso ao cidado por


ajudar seus iguais, principalmente quando seus entes mais prximos so
diretamente afetados pela crise;

Mais completa, porque h transparncia na comunicao, principalmente quando


meios de preservao da confidencialidade so proporcionados e garantidos ao
cidado;

De maior qualidade, em termos de sensibilidade, pelo fato da populao local


conhecer bem e partilhar o espao, problemas e costumes de sua prpria
comunidade;

De maior qualidade, em termos de especificidade. Uma vez no local, o cidado


pode validar rapidamente, verificar a informao e descartar falso-positivos
anteriores.

A obra caracteriza elementos essenciais para a construo de tecnologias que utilizam


o apoio dos cidados no sensoriamento do ambiente. So eles:

Horizontal: permitindo aos cidados compartilhar informaes uns com os


outros;

98

Vertical: permitindo aos cidados compartilhar informaes com salas de


situao e centros de controle da operao;

Semiestruturado: flexvel de maneira que um cidado possa livre e facilmente


relatar o que julgue relevante, isto , no restrito a modelos excessivamente
estruturados;

Aberto: de modo que a comunidade se d conta que pode agregar informaes e


promover discusses valiosas, criando uma poltica de meritocracia para
recompens-los. Alm disso, importante fomentar seu crescimento atravs da
divulgao de campanhas de apelo e incentivo populao;

Geolocalizada: uma vez que cidados locais possuem alta autoridade de


conhecimentos sobre o que est prximo a eles. A criao de meios de identificlos e alcan-los essencial para a contextualizao, interpretao e verificao
da confiabilidade das informaes referentes ao local;

Acessvel: o que significa que o processo tambm pode trabalhar com at mesmo
o tipo mais simples de telefone celular, por exemplo, com o uso de mensagens de
texto SMS (GEOSMS, 2013).

Por um lado, a popularizao dos dispositivos de sensoriamento ambiental, cada vez


mais portteis, facilmente configurveis, e menos custosos, expande as potencialidades e
oportunidades de aplicaes. Por outro, surge o desafio em gerir e consumir seus dados de
forma eficaz, devido heterogeneidade dos componentes e protocolos embarcados nos
hardwares de diferentes marcas e modelos dos dispositivos de sensoriamento.
Neste cenrio, Boman et al. (2014) investigam iniciativas que buscam elevar o grau
de integrao entre os mundos fsico e virtual. Dentre alguns exemplos de iniciativas
elencadas pelos autores, a plataforma Xively47 disponibiliza uma API (Application
Programming Interface) de funes padronizadas que viabiliza o acesso em tempo real a
dados originados por milhes de sensores remotos espalhados pelo mundo.

Estas

plataformas podem ser aproveitadas na arquitetura proposta neste trabalho como meios
prticos para a coleta de dados originados a partir de sensores ambientais.

47

Xively - https://xively.com/

99
Caragea et al. (2011) avaliam distintos mtodos de classificao automtica sobre um
conjunto de dados constitudo por mensagens SMS e publicaes atravs da rede social
Twitter, obtido a partir da plataforma Ushahidi durante o apoio ao terremoto do Haiti, em
2010. O experimento teste parte da construo de mecanismos automatizados para o
acoplamento na plataforma desenvolvida pelo grupo de pesquisa, denominada EMERSE 48 Enhanced Messaging for the Emergency Response Sector (arquitetura apresentada na
Figura 5.4-a).

Figura 5.4. (a) Arquitetura da plataforma EMERSE; (b) Mdulo de entrada de dados para iPhone. Adaptado de
Caragea et al. (2011)

Complementarmente, um aplicativo disponvel para dispositivos mveis foi projetado


para apoiar os profissionais humanitrios na coleta de informaes durante uma crise (Figura
5.4-b). Em caso de impossibilidade de acesso Internet, o aplicativo armazena os dados
registrados no prprio dispositivo at que o acesso esteja disponvel para o envio. A
aplicao aproveita ainda o recurso do receptor GPS integrado aos dispositivos para
georreferenciar automaticamente cada novo registro gravado.
No segmento de coleta de dados da plataforma, um processo extrator captura
publicaes na rede social Twitter segundo palavras-chave especficas, pr-estabelecidas
pelo gerente de informaes, bem como as publicaes originadas de usurios especficos.
Alm disso, a plataforma conta com processos de traduo automtica atravs do uso da API
(Application Programming Interface) disponibilizada pelo servio de traduo Google
Translate49.
A capacidade de classificar automaticamente tais mensagens, somada ao
direcionamento gil das informaes relevantes diretamente ao pessoal adequado so
essenciais para aumentar a eficincia no atendimento s necessidades mais urgentes e

48
49

EMERSE - http://emerse.ist.psu.edu/
Google Translate - https://developers.google.com/translate/

100
compreender melhor a situao de emergncia. No entanto, a classificao automtica ainda
constitui o aspecto mais desafiador plataforma EMERSE. Apesar da classificao de
mensagens de texto poder ser realizada com pouco esforo por um ser humano, ainda
constitui uma difcil tarefa para computadores.
Frente a este desafio motivador, a equipe fez uso da base de dados Ushahidi/Haiti,
que inclui cerca de 3.500 relatos, dos quais metade foi originada atravs de mensagens SMS.
Na ocasio da resposta ao desastre, em 2010, cada um desses relatos foi manualmente
classificado pela equipe de colaboradores de acordo com sua demanda especfica, por
exemplo, emergncia mdica, edificao colapsada, requisio de abrigo, etc..
Para fins de avaliao de desempenho da classificao, quatro diferentes mtodos
classificatrios automticos foram experimentados: Bag of Words (MCCALLUM; NIGAM,
1998), Feature Abstraction (SILVESCU et al., 2009), Feature Selection (KIRA; RENDELL,
1992) e Latent Dirichlet Allocation (LDA) (BLEI et al., 2003). Os resultados demonstram
que o mtodo Feature Abstraction superou significativamente outros mtodos enquanto a
eficcia de classificadores baseados em Support Vector Machine (SVM) variou
significativamente dependendo da categoria a ser codificada.
Cameron et al. (2012) descrevem esforos correntes em parceira com o governo
australiano para detectar, avaliar, organizar e compartilhar mensagens coletadas a partir do
microblog Twitter que possam ser de interesse para a coordenao de crise. A plataforma,
denominada ESA-AWTM (acrnimo para Emergency Situation Awareness Automated
Web Text Mining), permite que mensagens relevantes publicadas pela populao atravs das
redes sociais possam ser identificadas e aproveitadas para agregar conhecimento a partir de
diferentes vises da transcorrncia de um incidente de carter emergencial.
Os principais objetivos da plataforma ESA-AWTM so: o fornecimento de
evidncias de atividades indicadoras da ocorrncia de incidentes; a notificao quase em
tempo real de incidentes ocorridos; relatos em primeira mo acerca dos impactos causados
por estes incidentes; e o monitoramento do grau de envolvimento e da evoluo do
comportamento da comunidade a um aviso de emergncia.
A plataforma vem sendo experimentada pelo escritrio de coordenao de crises
australiano durante casos reais de emergncia, a fim de verificar e aperfeioar sua
efetividade no apoio deciso. Alguns aspectos da plataforma apresentada pelos autores se

101
assemelham a elementos constituintes da arquitetura proposta neste trabalho, merecendo,
portanto uma anlise mais detalhada acerca dos mesmos. So eles:

Classificao:

um

mdulo

classificador

automtico

relacionadas classe danos em infraestrutura.

identifica

publicaes

O algoritmo Support Vector

Machines (SCHLKOPF et al., 2000) obteve o melhor resultado dentre os mtodos


classificadores automatizados experimentados.

Os testes foram aplicados sobre

tweets coletados durante um terremoto ocorrido no pas, em fevereiro 2011. Os


esforos correntes dos autores se do em adaptar o mtodo para classificar outros
tipos de desastres naturais, tais como incndios florestais, ciclones e inundaes.

Georreferenciamento: para os casos em que os tweets no contenham a informao


das coordenadas de geolocalizao, uma tentativa de georreferenciamento
procedida com base na localizao do perfil do usurio. Entretanto, a exemplo das
demais abordagens anteriores, verifica-se novamente um equvoco sobre a medida
adotada para o georreferenciamento das informaes recebidas. Como j discutido
na seo 4.3, a localizao da informao no necessariamente deve ser a mesma de
emissor no momento da publicao. Procedimentos comparativos e corretivos foram
previstos e propostos na arquitetura deste trabalho, conforme detalhados na subseo
6.2.2.4.

Agrupamento de mensagens: atravs de observaes sobre a dinmica do ciclo de


vida das informaes relativas a eventos emergenciais, verifica-se que, durante um
incidente em curso, novas demandas podem emergir, se fundir com outras j
existentes, depois se dissociar de seu grupo e, finalmente se extinguir, quando no
mais teis no estgio corrente. A partir desta abordagem, os autores propem o
desenvolvimento de um novo algoritmo de agrupamento incremental e dinmico,
capaz de condensar ou mesclar grupos de mensagens com contedo semelhante,
dividir grupos com contedos distintos e desfazer um agrupamento, uma vez que
tenha se tornado desinteressante.

Contudo, o detalhamento sobre as tcnicas

aplicadas no apresentado na obra. Os autores apenas registram que a construo e


avaliao deste algoritmo tema de um trabalho ainda em curso.

102
Rogstadius et al. (2013) apresentam a plataforma CrisisTracker50, um sistema online
que captura e agrupa relatos coletados do microblog Twitter durante eventos de grande
escala. A plataforma rastreia automaticamente mensagens atravs de conjuntos de palavraschave e constri histrias atravs do agrupamento dos tweets relacionados com base na sua
semelhana lexical com as demais publicaes do grupo.
A publicao tambm apresenta resultados da implantao de um experimento piloto
acerca do monitoramento da guerra civil sria, ao longo de oito dias, durante o ms de
setembro de 2013. Na ocasio, o experimento processou, em mdia, 446.000 tweets por dia,
agrupando-os em histrias atravs da combinao de processadores automatizados com
reviso colaborativa (humana) atravs de crowdsourcing.
Conforme os problemas de extrao da geolocalizao j abordados na seo 4.3, o
experimento piloto apresenta uma notvel dificuldade em extrair a geolocalizao de
mensagens originadas pelo Twitter. Uma anlise sobre o conjunto de dados experimental
constata que apenas 1% das publicaes apresenta a informao da localidade geogrfica.
Alm disso, dado ao fato da informao da geolocalizao estar relacionada posio
corrente do usurio no momento da publicao, mesmo quando disponvel tal informao
dever ser investigada. Caso seja detectada sua distino em relao localidade a qual a
informao se refere, esta dever, portanto, ser descartada.
Apesar dos graduais avanos no desenvolvimento de tcnicas de classificao e
estruturao automatizada de contedo textual, os resultados de experimentaes sobre
textos de pequeno comprimento (tpicos das redes sociais) mostram ser significativamente
inferiores e deficientes do que quando aplicados sobre artigos de notcias e publicaes
melhor formadas e com maior extenso.
Segundo Rogstadius e Kostakos (2011), a computao humana baseada na
colaborao (em ingls, crowd-sourced human computation) uma tcnica na qual um
processo computacional desempenha a sua funo por externalizao de determinadas etapas
para os seres humanos. Tais tarefas so realizadas muitas vezes a partir da colaborao das
multides, onde o processamento pode ser distribudo entre um grupo de pessoas.
A tcnica prtica para lidar com problemas computacionais que so facilmente
resolvidos por seres humanos, mas ainda de alto custo e baixo desempenho para os

50

CrisisTracker - http://ufn.virtues.fi/crisistracker/

103
computadores, como a classificao de imagens (AHN, VON; DABBISH, 2004), a gesto do
conhecimento (KUZNETSOV, 2006), e resoluo de problemas de negcios (VUKOVIC,
2009).
O

desempenho

das

multides

depende

em

grande

parte de incentivos

(ROGSTADIUS et al., 2000), tais como financeiros (KAUFMANN; VEIT, 2011), jogos e
entretenimentos (AHN, VON; DABBISH, 2004; COOPER et al., 2010) e apelos pelo bemestar social (KUZNETSOV, 2006). Voluntrios motivados tm se mostrado mais propensos
do que as multides pagas para produzir resultados de alta qualidade (ROGSTADIUS et al.,
2000). A plataforma Micromappers (HOWARD, 2013) um recente exemplo concreto
desta bem sucedida soluo hbrida, baseada na combinao homem-mquina.
Purohit et al. (2013) propem mtodos de aprendizagem de mquina51 para
automaticamente identificar e associar as necessidades (demandas) e ofertas (material) de
recursos de emergncia publicados atravs das mdias sociais, de modo a acelerar e
aperfeioar sua distribuio durante os esforos de recuperao. Os mtodos ainda levam
em conta a priorizao das necessidades em funo da localizao geogrfica das partes
envolvidas, disponibilidade de recursos, premncia das necessidades e da credibilidade da
informao. Um cenrio motivacional para a soluo ilustrado atravs da Figura 5.5.

51

Aprendizado de mquina um subcampo da inteligncia artificial dedicado ao desenvolvimento de


algoritmos e tcnicas que permitam ao computador aprender, isto , aperfeioar seu desempenho em alguma
tarefa. Por exemplo, um sistema de aprendizagem de mquina poderia ser treinado em mensagens de e-mail
para aprender a distinguir entre mensagens spam e no-spam. Depois de aprender, ento ele pode ser usado
para classificar novas mensagens (BARANAUSKAS e MONARD, 2003).

104

Figura 5.5. Cenrio exemplo para coordenao das ofertas e necessidades atravs das mdias sociais. Adaptado
de Purohit et al. (2013)

Desta forma, por exemplo, uma solicitao expressa atravs da mensagem estamos
coordenando uma unidade de roupas e alimentos para as famlias afetadas pelo tornado em
Oklahoma. Se voc quiser fazer uma doao, entre em contato conosco pode ser associada
com uma oferta manifestada atravs mensagem tenho diversas roupas que gostaria de doar
para as vtimas do tornado em Oklahoma. Algum sabe onde/como posso proceder?.
No entanto, conforme j abordado na seo 4.4, o contedo publicado atravs das
redes sociais, e-mails e mensagens SMS apresenta baixo nvel de estruturao de dados, o
que dificulta ainda mais a determinao da relevncia e confiabilidade da informao. Tratase um ambiente caracterizado por informalidades e repleto de informaes incompletas,
ambguas e ainda envolvido por tons de sarcasmos, opinies, anedotas e boatos.
No caso do microblog Twitter, por exemplo, seu limite de 140 caracteres pode ser
visto como um fator positivo, uma vez que incentiva a conciso. Por outro lado, pode
tambm prejudicar a qualidade da informao, pois reduz o contexto que pode ser explorado
por algoritmos baseados no processamento de linguagem natural. Alm disso, o volume de
mensagens durante uma crise bastante elevado, o que implica numa sobrecarga de
processamento e no aumento da complexidade em tarefas de identificao e extrao de
contedo til sobre mensagens irrelevantes e fora de contexto.

105
A abordagem se baseia na estratgia de converter automaticamente textos simples em
registros semi-estruturados52, conforme o exemplo apresentado no Quadro 5.2. A estrutura
flexvel de modo a permitir a anotao de outros metadados relevantes eventualmente
presentes nas mensagens processadas, como hora, local e autor.
Quadro 5.2. Exemplo de mensagens apresentadas em seu texto original (no estruturado) e sua representao
estruturada, gerada automaticamente. Adaptado de Purohit et al. (2013)

Solicitao/
Oferta

Tipo
Recurso

Texto Original
(no estruturado)

Representao Estruturada
{RESOURCE-TYPE={class=Money,

{Digite REDCROSS
para 90999 para doar

Solicitao

Dinheiro

U$ 10 para ajudar
pessoas furaco
Sandy. #SandyHelp}
{Algum sabe sobre
como se voluntariar

Oferta

Voluntrio

para oportunidade
para trabalho
voluntrio para o

confidence=0.9},
IS-REQUEST={class=Yes,
confidence=0.95}, IS-OFFER={class=No,
confidence=0.9},
TEXT=Digite...#SandyHelp}
{RESOURCE-TYPE={class=Volunteer,
confidence=0.99},
IS-REQUEST={class=No, confidence=0.98},
IS-OFFER={class=Yes, confidence=1},
TEXT=Algum...Sandy?}

furaco Sandy?}

O processo de converso primeiramente analisa cada mensagem atravs do


processamento de linguagem natural. Em seguida aplica classificadores supervisionados a
fim de identificar as solicitaes das ofertas de recursos.
Observa-se na abordagem adotada, que as classes no so mutuamente exclusivas, o
que significa que uma mesma mensagem pode, por exemplo, apresentar uma solicitao e
tambm uma oferta de recursos.
Aps a classificao, o passo final o estabelecimento de associaes entre
solicitaes e ofertas, atravs de mtodos de matchmaking desenvolvidos e aplicados em
sites de namoro e adaptados a partir da abordagem de Diaz, Metzler e Amer-Yahia (2010).

52

Um registro semi-estruturado um item de dados que no segue um modelo de dados formal (estrutura),
como o utilizado por um banco de dados relacional, mas inclui marcadores para separar distintos elementos
semnticos (PUROHIT et al., 2013).

106
Experimentaes avaliativas apontam uma eficincia de correspondncia de 72% em relao
a outros mtodos de pesquisa tradicionais comparados.
Tsur, Littman e Rapporort (2013) apresentam um algoritmo preciso e eficiente para o
agrupamento de publicaes do microblog Twitter. O mtodo de agrupamento dividido em
duas etapas distintas: 1) agrupamento sequencial de dados anotados por usurios atravs das
hashtags; 2) agrupamento online de um fluxo de tweets. A partir dos agrupamentos mais
estveis alcanados graas semi-classificao atravs das hashtags, os conjuntos
alcanados na primeira etapa se prestam para o agrupamento online de um fluxo de
mensagens, contendo ou no hashtags.

Os resultados da experimentao e anlise

comparativa com outras abordagens de classificao demonstram que o algoritmo


apresentado preciso e eficiente e pode ser facilmente utilizado para o agrupamento em
mensagens de larga escala.
Charikar (2002) prope um algoritmo de agrupamento de mensagens utilizando a
distncia de Hamming53. A distncia de Hamming entre duas sequncias de caracteres de
mesmo comprimento o nmero de posies nas quais elas diferem entre si. Vista de outra
forma, ela corresponde ao menor nmero de substituies necessrias para transformar uma
sequncia na outra, ou o nmero de erros que transformaram uma na outra. Por exemplo, a
distncia de Hamming entre os termos elabore e melhore quatro.
No caso das mensagens colaborativas, logicamente que a comparao envolve
sequncias de tamanhos distintos. Portanto, para que a comparao seja possvel, o autor
prope uma adaptao do mtodo atravs da quebra das sequncias em conjuntos de
palavras, alm de convert-las em nmeros binrios atravs da aplicao de funes de
hashing. O algoritmo adaptado conhecido como Simhash54 e tem sido aplicado e
experimentado por Science (2013) em seus esforos mais recentes na elaborao de
processos automatizados para o tratamento das informaes colaborativas obtidas atravs da
plataforma Ushahidi.
Aggarwal e Zhai (2012) promovem uma discusso acerca de avanos recentes no
contexto das redes sociais e dos dados ligados, alm de apresentarem alguns dos principais
mtodos e suas respectivas vantagens para o agrupamento de documentos. Os autores

53
54

Distncia de Hamming - http://people.revoledu.com/kardi/tutorial/Similarity/HammingDistance.html


Algoritmo Simhash - http://matpalm.com/resemblance/simhash/

107
tambm destacam que o agrupamento de mensagens por similaridade pode alcanar
melhores resultados quando palavras irrelevantes ao contexto so previamente identificadas
e suprimidas. Por exemplo, termos comuns tais como a, no podem ser muito teis para
melhorar a qualidade de agrupamento. Alm disso, a ponderao de palavras-chave como
nomes de pessoas e locais tambm podem refletir positivamente sobre os resultados do
agrupamento.
Mtodos como Feature Selection Methods operam sobre a seleo de um
subconjunto de elementos mais relevantes da informao. O pressuposto central que
algumas informaes contm muitos elementos redundantes ou irrelevantes que no
fornecem contedo til, acarretando apenas em rudo e aumento do custo de processamento.
Portanto, essencial selecionar tais caractersticas de forma eficaz de modo que estas
palavras ruidosas sejam identificadas e removidas antes da aplicao dos mtodos de
comparao e agrupamento.
Howard (2013) relata os esforos do grupo chefiado por Patrick Meier - pesquisador
renomado no campo de Mapeamento de Crises (em ingls, Crisis Mapping) no
desenvolvimento e experimentao de ferramentas voltadas ao apoio do trabalho
humanitrio aps o desastre causado pelo Tufo Haiyan, em novembro de 2013 nas
Filipinas. Meier e sua equipe aproveitam o poder de gerao de informaes das mdias
sociais para melhorar a velocidade e a eficcia dos esforos de socorro.
A plataforma Micromappers55, ilustrada na Figura 5.6, conta com a colaborao
social atravs da Internet para rapidamente classificar publicaes e fotos coletadas atravs
do monitoramento do microblog Twitter. Voluntrios de todo o mundo podem classificar os
tweets capturados, segundo uma das seguintes classes (definidas por solicitao da UNDAC
para apoiar sua misso de resposta): no relevante, pedidos de ajuda, danos de
infraestrutura, pessoas desalojadas, texto no em ingls, relevante, outros.

55

Micromappers - http://www.micromappers.com/

108

Figura 5.6. Plataforma MicroMappers: interface colaborativa para anlise e classificao das mensagens e
imagens capturadas do microblog Twitter

O processo totalmente online, e qualquer indivduo conectado Internet pode


colaborar, sem nenhum treinamento ou experincia prvia requerida. Aps a etapa de
classificao, o conjunto refinado de mensagens mais relevantes segue para o estgio de
mapeamento, tambm executado por usurios colaboradores.
Na sequncia, a reviso da colaborao verificada e atestada pela equipe de
analistas de informao da plataforma e, finalmente, o conjunto de informaes relevantes
triadas encaminhado diretamente s equipes oficiais de reposta emergncia. As etapas de
tratamento da informao da plataforma se assemelham ao workflow da plataforma Ushahidi
(Figura 5.3), tambm construda com grande parcela de contribuio de Meier.
Agncias de ajuda humanitria podem visualizar os registros atravs de mapas,
atualizados em tempo real, de acordo com a chegada de novos contedos triados pelos
colaboradores, e utilizar as informaes para apoiar o planejamento de seus esforos de
socorro.
Segundo Meier, estes mapas dinmicos so como ter seu prprio helicptero, uma
vez que fornecem uma viso panormica como se desenrolam os acontecimentos no tempo e
no espao. O ganho deste tipo de conhecimento, proveniente diretamente das zonas de crise
um divisor de guas. Essas tecnologias no existiam h apenas alguns anos atrs.
(HOWARD, 2013).
Ainda com relao validao quanto relevncia do contedo capturado, a
plataforma dispe de mecanismos internos de controle de qualidade, o que significa que cada
tweet e imagem devem ser classificados por pelo menos trs voluntrios diferentes. Assim,

109
somente quando trs voluntrios distintos classificarem a mensagem analisada da mesma
forma que esses dados seguiro para a prxima etapa de tratamento.
Em segundo lugar, uma fora-tarefa de voluntrios da Rede Humanitria Digital (em
ingls, Digital Humanitarian Network56) analisa os resultados em um segundo nvel de
controle de qualidade para garantir a preciso e relevncia das mensagens.
Adicionalmente, para iniciar a colaborao necessrio criar um breve cadastro na
plataforma. Desta forma possvel calcular a reputao de cada usurio, alm de estabelecer
um ranking de apontamento dos maiores e mais efetivos colaboradores.
Finin et al. (2010) descrevem a experincia com o uso das plataformas MTurk57
(Amazon Mechanical Turk) e CrowdFlower58 no auxlio anotao de entidades nomeadas
extradas de publicaes do microblog Twitter. Trata-se de servios de crowdsourcing,
especializados na distribuio de tarefas pequenas e repetitivas, a serem executadas
remotamente por colaboradores espalhados pelo mundo.
A plataforma CrowdFlower, por exemplo, permite aos usurios cadastrar tarefas e
distribu-las aos colaboradores espalhados pelo mundo, preservando a qualidade do resultado
do trabalho executado a partir de mecanismos de verificao de assertividade e estratgias de
premiao por produtividade e efetividade. Colaboradores cadastrados na plataforma podem
consultar a base de trabalhos disponveis e ingressar nas atividades de colaborao que mais
lhes interessarem.
Para cada trabalho disponvel, o sistema aloca automaticamente um conjunto de
tarefas para os colaboradores.

Durante as atividades, o colaborador submetido

aleatoriamente e despercebidamente a testes peridicos que comparam o resultado de uma


tarefa-teste com o resultado correto (esperado), previamente processado. Tal medida busca a
manuteno atualizada da reputao e confiabilidade de cada colaborador envolvido no
trabalho.
Enquanto o colaborador mantiver seu grau de assertividade e reputao compatvel
com os limites estabelecidos pelos gestores da atividade, o mesmo permanece habilitado a
prosseguir suas tarefas. Caso um colaborador apresente resultados de baixa qualidade, todo

56

Digital Humanitarian Network - http://digitalhumanitarians.com/


MTurk - https://www.mturk.com/
58
CrowdFlower - http://crowdflower.com
57

110
o produto de suas atividades executadas poder ser descartado e, ele ainda poder ser
removido do trabalho. A plataforma tambm permite que colaboradores com histrico de
reputao continuamente positiva possam atuar como moderadores, isto , supervisores das
atividades desempenhadas por outros colaboradores no trabalho.
Tang et al. (2011) defendem que a colaborao pode ser mais efetiva quando envolve
polticas de premiaes. Esta foi a estratgia adotada pela equipe do Massachusetts Institute
of Technology (MIT), da Universidade de Stanford, nos Estados Unidos, vencedora do
concurso, Red Balloon Challenge59.
A competio organizada pela DARPA buscou examinar o papel da Internet e das
redes sociais como meios de propagao da informao e colaborao em massa diante de
cenrios que envolvam extensas reas geogrficas. Alm disso, a competio procurou
explorar a criatividade da montagem de aes prticas para solucionar problemas de ampla
escala em reduzido espao de tempo (cenrio este que nos remete s situaes de
emergncias).
Dez equipes participaram do desafio, com a meta de localizar dez bales vermelhos
espalhados em diferentes localidades do territrio norte-americano (sempre prximos a
locais habitados e rodovias) e notificar DARPA no menor tempo possvel. As redes
sociais foram usadas como ferramentas de intercomunicao e tambm para recrutar pessoas
que pudessem prover informaes teis para a busca dos bales.
A equipe vencedora adotou uma tcnica semelhante ao marketing em multinvel 60
para recrutar participantes. O dinheiro do prmio foi distribudo de forma proporcional,
contemplando desde o colaborador que avistou o balo (que receberia a maior poro do
prmio), reduzindo metade para cada nvel superior de informante que propagava a
informao, at chegar equipe MIT, conforme ilustrado na Figura 5.7.
Como o valor do prmio para a equipe vencedora seria de quarenta mil dlares, foi
estipulado o oramento de quatro mil dlares de recompensa por balo. Sendo assim, o
informante seria recompensado com dois mil dlares e, para cada informante subsequente, a
metade do valor da recompensa recebido pelo informante anterior, desta maneira, garantindo
que o oramento por balo no fosse excedido.

59
60

Red Balloon Challenge - http://www.hsdl.org/?view&did=17522


Marketing Multinvel - http://exame.abril.com.br/topicos/marketing-multinivel

111

Figura 5.7. Estratgia da equipe vencedora do desafio Red Ballon Challenge: poltica de recompensa baseada
em marketing multinvel para recrutar participantes

A estratgia de propagar a premiao trouxe dois grandes benefcios:


1) Participantes eram incentivados a recrutar novos colaboradores. Novos participantes
no foram encarados como competidores dos demais, mas sim parceiros
cooperadores.
2) At mesmo pessoas localizadas fora do territrio norte-americano motivaram-se a
participar da busca, simplesmente passando adiante informaes referentes possvel
localizao do balo. Mesmo no tendo condies de localiz-los pessoalmente,
estas pessoas compreendiam que se fizessem parte da rede de propagao de uma
informao que culminasse na descoberta de um balo, seriam recompensadas.
A estratgia adotada pela equipe vencedora resultou no crescimento da equipe em
cinco mil colaboradores.
Como resultado apreendeu-se que os times precisaram lidar com informaes falsas e
boatos intencionais criados pela equipe concorrentes. Parte do propsito do desafio proposto
pela promotora do evento era forar seus participantes a desenvolver a capacidade de
discernir informaes verdadeiramente teis de rudos potenciais atravs da elaborao de
estratgias de validao, como:

Mltiplos envios (originados a partir de diferentes pessoas) relatando a presena do


balo na mesma localidade aumentam a probabilidade daquela informao ser de fato
verdadeira.

Envio de fotos com a pessoa e o balo para comprovar a veracidade. Na ocasio da


competio, fotos verdadeiras retratavam um funcionrio segurando uma faixa da
DARPA. O detalhe no foi avisado aos colaboradores para facilitar a eliminao de
fotos montagens.

112
Com relao ao compartilhamento da informao, a iniciativa de dados abertos
interligados (LOD - Linked Open Data) permite a interconexo de dados, utilizando padres
no contexto da abordagem de web semntica.

Em condies ideais, as agncias

governamentais compartilham seus dados pblicos, permitindo assim o consumo atravs de


mecanismos automatizados pelos interessados, sejam outras agncias do governo ou prprios
cidados. Esforos destinados a vincular dados do governo esto crescendo em vrios pases
ao redor do mundo61 62.
Neste sentido, Cordeiro et al. (2011) propem um esquema de coleta de dados
disponveis a partir de rgos do governo, tais como departamentos de transporte, sade,
obras, que podem suprir as necessidades de informao durante uma operao de resposta de
emergncia. Alm de informaes pblicas de rgos do governo, o esquema tambm inclui
o tratamento e integrao de dados de colaborao voluntria, ou seja, dados provenientes de
cidados e meios de comunicao pblicos, envolvidos nas situaes de emergncia.

61
62

UK Government Data - http://data.gov.uk/


Open Election Data Project - http://openelectiondata.org/

113

6 Descrio da Arquitetura de Soluo


O diagrama da Figura 6.1 apresenta a arquitetura de soluo proposta e identifica
seus

elementos

constituintes, agrupados nas

camadas

de usurio, aplicao

armazenamento, e tambm segmentados quanto ao ambiente no qual se inserem: interno ou


externo arquitetura.

Figura 6.1. Arquitetura para coleta e tratamento de informaes colaborativas no apoio deciso em ambientes
de emergncia

A camada de usurio constituda, no ambiente externo, pelos agentes


colaboradores, representados pelos cidados, que submetem informaes relacionadas ao
evento emergencial. Os agentes de campo apoiam oficialmente o comando da crise na
avaliao e recuperao dos danos para a retomada ao estado de normalidade.
O ambiente interno da camada de usurio da arquitetura constitudo pelos cidados
voluntrios, que atuam como revisores na fase [RCOL] Reviso Colaborativa, em
atividades de processamento colaborativo das informaes capturadas e tratadas no sistema.
Ainda no ambiente interno, a equipe de comando e controle formada pelo analista da
informao, cuja responsabilidade monitorar as atividades dos revisores, alm de avaliar e
selecionar as informaes processadas que j apresentem condies satisfatrias para serem
encaminhadas ao apoio do comando da crise.

114
O ambiente externo da camada de aplicao composto pelos meios de
comunicao que atuam como canais de comunicao para a colaborao social, como as
redes sociais, mensagens de SMS, e-mails, contatos telefnicos, dentre outros que
eventualmente podero ser integrados ao sistema.
Nesta mesma camada, representando as fontes oficiais de informao colaborativa,
encontram-se as aplicaes destinadas ao cadastro e submisso de informaes coletadas
pelas equipes de campo durante suas incurses, alm dos sensores de monitoramento
ambiental, disponibilizados e gerenciados pelas equipes de resposta.
No ambiente interno da camada de aplicao encontram-se os componentes das fases
de coleta e processamento da informao colaborativa: [COMU] Comunicao, [PREP] PrProcessamento, [HIST] Histrias e [CONF] Conflitos. Seus papis desempenhados dentro
da arquitetura sero detalhados nas sees seguintes deste captulo.
A camada de armazenamento constituda, no ambiente externo, por repositrios
de dados externos, como os bancos de dados das redes sociais e outras bases das quais a
arquitetura poder extrair informaes, estruturadas de acordo com suas respectivas fontes
de origem.
O ambiente interno da camada de armazenamento composto por dois repositrios: o
repositrio de coleta e processamento armazena as publicaes coletadas pela plataforma,
alm de registrar os resultados dos processos de tratamento da informao, ocorridos na
camada de aplicao; o vocabulrio de referncia congrega termos selecionados a partir de
vocabulrios populares, teis para a identificao e associao dos atributos semanticamente
comuns, entre as distintas fontes de informaes do sistema.
Cada termo do vocabulrio de referncia tambm est associado a um termo
correspondente extrado de vocabulrios de ontologias de domnio em Linked Open Data.
Este mapeamento viabilizar o processo de anotao semntica para fins de
compartilhamento da informao tratada.
A Figura 6.2 apresenta um workflow que ilustra a sequncia de um ciclo de
processamento da informao colaborativa dentro da arquitetura proposta, representando as
interaes entre os agentes e os processos envolvidos na gerao, coleta e tratamento da
informao em um cenrio de emergncias.

115
As setas em formato de curva no sentido horrio que sobrepem os diagramas na
Figura 6.1 e na Figura 6.2 orientam o ciclo de processamento da informao no sistema.
Um ciclo de processamento representa o percurso total da informao, desde o momento
em que ela foi gerada, passando pelas fases de [COL] Coleta, [PREP] Pr-processamento,
[HIST] Agrupamento de Histrias, [CONF] Deteco de Conflitos, at a deciso final do
analista de informaes por descart-la, encaminhar ao comando superior ou buscar
complementaes atravs da requisio de feedback [FED].

116

Figura 6.2. Workflow: agentes, processos e interaes envolvidas no ciclo operacional de gerao, coleta e
tratamento da informao colaborativa no contexto de emergncias

As subsees a seguir descrevem detalhadamente os elementos da arquitetura e suas


interaes sistmicas representadas no workflow acima. O ciclo se inicia quando um agente

117
colaborador publica uma informao por meio de uma das fontes de informaes disponveis
para coleta.

Em seguida, a informao submetida a uma sequncia de processos

especializados, ordenados e agrupados em fases63.


No estgio final do ciclo de processamento, a avaliao do analista de informao
julgar se a informao processada encontra-se suficientemente consistente e completa para
finalmente ser disponibilizada ao consumo pelo comando da resposta. Caso contrrio,
aproveitando os mesmos recursos de gerao de informao colaborativa, a informao
conflitante ou incompleta poder ser submetida a um processo de retroalimentao do
sistema (feedback) em busca de complementaes e/ou solues de conflitos detectados.
6.1 Ambiente Externo
As subsees a seguir caracterizam os agentes e os meios de comunicao
disponveis para o provimento de informao a partir da colaborao.
6.1.1 Agentes Colaboradores
Como se pode observar no workflow da Figura 6.2, a informao colaborativa pode
ser gerada a partir das seguintes situaes:

Por iniciativa do cidado, ao testemunhar um fato relevante (de acordo com o seu
ponto de vista) relacionado ao evento emergencial, o cidado decide relatar seu
testemunho atravs de um canal de comunicao.

Por demanda do comando da resposta, requisitando o cumprimento de tarefas


especficas a sua equipe de agentes de campo.

As tarefas possuem distintas

finalidades, como a busca de novas informaes atravs de avaliaes por


especialistas, ou a requisio de confirmaes ou complementaes sobre um
determinado evento ou localidade de interesse.

Tarefas que no demandem

conhecimento ou treinamento especfico podem eventualmente contar com o apoio


voluntrio do prprio cidado. Os exemplos abaixo apresentam cenrios nos quais o
comando pode explorar o conhecimento popular local para fins de obteno de
informaes bsicas.

63

Segundo Santos e Schwabe (2004, p.7), fase um agrupamento de processos de software fortemente
relacionados conduzidos em algum tipo de ordem.

118
O escritrio de comando solicita aos voluntrios que confirmem o nmero de

casas destrudas na Avenida Presidente Vargas.


o Qual o nome e telefone de contato do lder comunitrio do bairro Caleme?
o Necessitamos de imagens do deslizamento ocorrido na Rua Joaquim Cruz,
Campo Grande.
o Necessitamos de voluntrios para verificar o nvel do Rio Itaja. Instrues do
procedimento seguem em anexo a esta mensagem.
Assim, quando requisitado pelo comando, o despacho deve ser encaminhado
diretamente a sua equipe de agentes de campo.
Eventualmente cidados tambm podem ser requisitados a colaborar atravs dos
meios de contato disponveis ao comando (redes sociais, e-mail, telefone, etc.). No segundo
caso, cidados colaboradores mais prximos ao local do evento em questo podero
contribuir publicando suas constataes in loco e at mesmo enriquec-las com contedo
multimdia.
Qualquer contedo gerado a partir da resposta a esta requisio ser ento submetido
a um novo ciclo de processamento no sistema. Cada nova entrada incrementar a base de
conhecimento, poder ajudar a solucionar eventuais conflitos detectados e, por fim apoiar a
deciso do comando da resposta crise.
6.1.2 Fontes de Informao Colaborativa
Para as contribuies recebidas atravs de chamadas telefnicas, uma central de
atendimento dever dispor atendentes treinados para filtrar e cadastrar toda informao
relevante adquirida atravs do dilogo estabelecido com o colaborador, a exemplo do que j
praticado nas centrais de atendimento de emergncia espalhadas pelo mundo, como o
caso do SOS Alarm (2008). As informaes organizadas segundo formulrios previamente
estruturados pelo comando podem ser extradas diretamente de suas bases dados,
exclusivamente acessveis ao comando.
Para as colaboraes recebidas atravs de mensagens SMS, um nmero telefnico
exclusivo do escritrio de comando da resposta receber as mensagens relacionadas ao
evento emergencial, a exemplo da estratgia adotada pela iniciativa Mission 4636, durante
as atividades de resposta ao terremoto do Haiti (MUNRO, 2013).

119
As redes sociais disponibilizam interfaces amigveis, objetivas e so altamente
eficientes quanto disseminao da informao, devido aos seus mecanismos prticos de
compartilhamento e as interligaes existentes entre seus usurios.

Tais caractersticas

propiciam as condies favorveis para o provimento gil da informao colaborativa


durante situaes de emergncia (REUTER et al., 2011; R. SABRA JAFARZADEH, 2011;
CHOWDHURY et al., 2013; SPRING et al., 2013; PUROHIT et al., 2013; OLTEANU et
al., 2014).

Outro aspecto positivo o fato dos provedores destes servios comumente

disponibilizarem mecanismos prticos para a extrao automatizada dos dados armazenados


em seus repositrios (a ser detalhado na subseo 6.2.1.1).
Equipes de campo alimentam bases de dados por meio de aplicaes que operam em
seus dispositivos mveis. O preenchimento de formulrios exclusivamente modelados para
o domnio de emergncia estabelece a padronizao de formatos e estrutura de dados entre
os profissionais de campo e o escritrio de comando. Marino et al. (2012) apresentam uma
plataforma que opera com este propsito.
O comando da resposta crise poder aproveitar sensores de monitoramento
ambiental disponibilizados por terceiros (desde que habilitados ao acesso pblico) ou
providenciar a instalao de dispositivos de sensoriamento, de acordo com seus interesses
especficos de monitoramento. Assim, leituras instantneas e contnuas do ambiente podero
ser realizadas como, por exemplo, o acompanhamento do nvel de um rio, volume de chuva
em determinados perodos e imagens ao vivo de locais de risco. Atravs de mdulos GPRS
integrados, as leituras realizadas pelos sensores ambientais podem ser transmitidas em tempo
real a repositrios de dados na web e, assim, imediatamente consultados atravs de servios
web (em ingls, web services), conforme abordado por Boman et al. (2014).
6.2

Ambiente Interno
As subsees a seguir descrevem as fases operacionais e seus processos constituintes,

no ambiente interno da arquitetura de soluo.


6.2.1

[COMU] Fase de Comunicao


A fase de comunicao intermedia a entrada e sada das informaes entre os dois

ambientes do sistema. As subsees seguintes descrevem o papel dos dois processos que
viabilizam o fluxo da informao do ambiente externo para o ambiente interno, e vice-versa.

120
6.2.1.1

[COL] Coletar Publicaes


Como etapa inicial do ciclo de processamento, agentes colaboradores geram

informaes relativas ao evento, armazenadas dispersamente em distintos tipos de


repositrios na Internet.

Por exemplo, toda informao publicada nas redes sociais

armazenada em seus servidores prprios que, apesar de dispersos geograficamente,


comumente encontram-se acessveis para consulta por meio de servios web.
Hoje, as mais populares redes sociais j disponibilizam APIs (vide o Quadro 6.1) que
possibilitam a qualquer desenvolvedor elaborar mtodos de consultas automatizadas aos seus
repositrios de dados. Por uma medida de padronizao e simplificao comunidade
desenvolvedora, as redes sociais mais populares vm adotando o mesmo protocolo de acesso
s suas bases de dados, atravs de requisies baseadas na simplicidade da arquitetura REST
proposta por Fielding (2000).
Quadro 6.1. Fontes de informaes e suas respectivas referncias documentao API

Fonte Informao

Referncia da Documentao API

Facebook

http://developers.facebook.com/docs/reference/api/

YouTube

https://developers.google.com/youtube/

Flickr
Instagram

http://www.flickr.com/services/api/
http://instagram.com/developer/

Twitter

https://dev.twitter.com/docs/api/1/get/search

Xively

https://xively.com/dev/docs/api/quick_reference/

Vicon

http://www.viconsaga.com.br/help/?s=api

A uniformidade no padro de protocolos de acesso e extrao de informao reduz a


complexidade da agregao de novas fontes de informaes ao sistema. Basta apenas
consultar a documentao de acesso base de dados, desenvolver o mtodo de extrao da
nova fonte e integr-lo ao sistema.
Para que a captura dos dados seja praticamente em tempo real, o processo [COL]
Coletar Publicaes executado com frequncia programada, a ser definida pelo

121
administrador do sistema, com base na dinmica de atualizao especfica de cada fonte de
informao. A cada nova interao de coleta, o processo consulta o repositrio de dados da
fonte de informao e extrai somente as publicaes mais recentes, ou seja, aquelas que
possuam data de criao posterior data da ltima coleta realizada.
Filtragens por meio de palavras-chave relacionadas ao evento emergencial podem ser
aplicadas s consultas com a finalidade de reduzir e tornar o conjunto retornado mais
refinado e livre de contedo intil. Tal medida tambm implica na reduo do tempo de
resposta s consultas das bases de dados externas e do processamento interno da arquitetura.
Todo contedo extrado das fontes de informaes colaborativas condensado e
encaminhado para a prxima etapa, dando incio fase de pr-processamento da publicao.
6.2.1.2

[FED] Requisitar Feedback


Ainda na fase de comunicao, o processo [FED] Requisitar Feedback

constitudo por procedimentos que viabilizam a comunicao com o ambiente externo, a


partir do ambiente interno. Cada fonte de informao colaborativa pode disponibilizar um
procedimento de publicao.

Para requisitar um feedback, so necessrios apenas o

identificador nico do contato naquela fonte e o texto da mensagem a ser publicada na


requisio.

Convm observar que determinadas fontes de informaes podem no

disponibilizar mecanismos para o estabelecimento do contato de retorno.


O atributo identificador do contato a chave que identifica exclusivamente o emissor
em cada uma das fontes de informao. Este identificador est presente no conjunto de
dados de cada informao extrada no processo [COL] Coletar Publicaes. Por exemplo,
nas redes sociais cada usurio est associado a um identificador nico, geralmente
representado por uma sequncia numrica extensa64.

Para chamadas telefnicas e

mensagens SMS este identificador equivale ao prprio nmero do terminal telefnico.


No vocabulrio de referncia organizado para estabelecer associaes entre atributos
provenientes das diferentes fontes informaes (processo detalhado na subseo 6.2.2.1), o
atributo de identificao nica do emissor ser associado ao termo Post.Who.From.strID.
Desta maneira o comando da reposta pode estabelecer um contato de retorno com os

64

Onde encontrar o meu Facebook User ID - http://dicasprafacebook.blogspot.ie/2013/02/onde-encontrar-omeu-facebook-user-id.html

122
cidados colaboradores e seus agentes de campo a fim de demandar tarefas e requisitar
informaes de feedbacks.
Os mecanismos de feedbacks fecham um ciclo no sistema, denominado ciclo de
maturao da informao (ilustrado na Figura 6.11), onde cada nova interao pode
promover a evoluo da base de conhecimento atravs da prpria colaborao social.
Uma requisio de feedback apresenta os seguintes parmetros:
1. O qu?
1.1. Nulo: quando uma informao nova requisitada. Trata-se apenas uma campanha
em busca de uma nova informao acerca de um local, uma pessoa ou um evento
especfico. Neste caso, seu retorno entrar no sistema como uma nova publicao e
percorrer normalmente as etapas o ciclo de processamento;
1.2. Publicao: quando a requisio est relacionada a uma publicao especfica do
repositrio de coleta e processamento, em busca de complementariedade ou da
resoluo de conflitos.
2. Para quem?
2.1. Nulo: para todos (broadcast);
2.2. {Usurios}: para um determinado grupo de informantes, em funo da proximidade
geogrfica, grau de confiabilidade da fonte, frequncia de colaborao.

Um

encaminhamento seletivo pode aumentar as chances de requisitar a quem de fato


possa rapidamente retornar requisio, preservando a atualidade da informao.
3. Por quanto tempo? Um temporizador de validade para a requisio pode ser definido,
bem como aes a serem tomadas aps o esgotamento do prazo:
3.1. Notificar o analista de informaes;
3.2. Requisitar um novo feedback a outro grupo de destinatrios;
3.3. Descartar a publicao geradora da requisio.
Publicaes relativas a retornos de feedback possuem alta prioridade de tratamento
no sistema. Seu escalonamento pode ocorrer em funo da urgncia e/ou do tempo no
sistema, a fim de preservar ao mximo o grau de atualidade da informao.

123
Os retornos buscam respostas quantitativas e objetivas para que o processamento
automatizado do resultado obtenha o melhor desempenho possvel e dispense a necessidade
do encaminhamento para o processamento supervisionado (manual), o que elevar o tempo
de tratamento da mensagem e, consequentemente, depreciar seu grau de atualidade.
Os casos a seguir ilustram exemplos de requisies objetivas de feedback:
[Requisio 1234] Informe NUMERICAMENTE quantas pessoas esto
desalojadas no seu bairro? Para N pessoas, responda conforme o seguinte exemplo:
[1234] N
[Requisio 5678] - Est chovendo no Caleme? Para SIM, responda conforme o
seguinte exemplo: [5678] SIM
6.2.2 [PREP] Fase de Pr-Processamento
Cada publicao coletada submetida a uma sequncia semi-automatizada de
processos de associaes, converses, seleo de atributos quantitativos e classificao. As
subsees a seguir descrevem o papel de cada processo envolvido nesta fase operacional da
arquitetura.
6.2.2.1

[AAV] Associar Atributos ao Vocabulrio


Cada fonte de informao dispe de uma estruturao de dados especfica, bem como

terminologia prpria para descrever seu contedo.

Desta forma, foi elaborado um

vocabulrio de referncia (apresentado na Figura 6.3 e detalhado no Apndice C) que


congrega o conjunto bsico de atributos necessrios para o tratamento da informao pela
arquitetura.

124

Figura 6.3. Vocabulrio de referncia para associao de atributos equivalentes e anotao semntica de
publicaes coletadas

O termo Post.strPrimaryKey, por exemplo, identifica o atributo referente ao


identificador nico (conhecido como chave-primria na terminologia de banco de dados)
da mensagem em cada fonte de informao. Na fonte de informao ilustrada na Figura 7.3,
este

atributo

representado

527527879572459520.

pelo

campo

key,

que

assume

valores

como

A chave-primria permite a identificao inequvoca da

publicao em sua fonte de origem, alm de evitar que o processo [COL] Coletar
Publicaes capture contedo duplicadamente.
O vocabulrio de referncia congregar termos responsveis por identificar e associar
atributos semanticamente equivalentes, provenientes das distintas fontes de informaes
presentes no sistema. Alm disso, o vocabulrio serve como referncia no processo de
anotao semntica para fins de compartilhamento segundo o modelo aberto e interopervel

125
Linked Open Data, aproveitando termos selecionados de vocabulrios de domnio populares,
como o SIOC65, MOAC66, DBpedia67, WGS8468, DCMI69.
Uma vez definidas (de forma manual, no momento da incluso da nova fonte na
arquitetura) as associaes entre o vocabulrio de referncia e o conjunto de atributos da
fonte de informaes, o processo [AAV] Associar Atributos ao Vocabulrio mapear
automaticamente cada atributo da informao coletada com o seu respectivo termo
equivalente do vocabulrio de referncia.
Estas associaes permitiro a interligao das distintas fontes agregadas ao sistema,
atravs dos atributos semanticamente equivalentes, conforme ilustrado na Figura 6.4. Alm
disso, o mapeamento proporciona a organizao dos dados sob uma estrutura uniforme,
facilitando sua identificao nas etapas subsequentes do tratamento.

Figura 6.4. Processo [AAV] Associar Atributos ao Vocabulrio: os atributos das informaes coletadas a
partir de diferentes fontes so mapeados e associados com base no vocabulrio de referncia

6.2.2.2

[VTF] Verificar e Tratar Feedback


Um retorno de feedback deve conter um identificador especfico de modo que, aps a

coleta, possa ser identificado, associado a sua respectiva requisio originadora e,


65

http://www.sioc-project.org/
http://observedchange.com/moac/ns/
67
http://dbpedia.org/
68
http://www.w3.org/2003/01/geo/
69
http://dublincore.org/
66

126
encaminhado ao devido tratamento. Desta forma, ao retornar um feedback, o colaborador
dever ser instrudo a inserir o identificador no corpo da mensagem. O exemplo a seguir
ilustra uma situao de requisio e retorno de feedback devidamente identificados:
REQUSIO: Requisio 1234 - Prezado Colaborador, o comando precisa saber a
quantidade atualizada de desabrigados no bairro Caleme. Para N desabrigados, responda
conforme o seguinte exemplo: [1234] N.
RETORNO: [1234] 10
Conforme representado no workflow da Figura 6.2, caso se trate de um feedback de
complementao ou de inconsistncia, o valor retornado ser extrado e, ento considerado
em uma nova rodada de verificao na fase de processamento [CONF] Conflitos
(encaminhamento representado pelo conector (1) no workflow).
As requisies de feedbacks buscam retornar respostas quantitativas e objetivas para
que o processamento automatizado do resultado obtenha o melhor desempenho possvel.
Porm, considerando as ocasies em que as respostas so geradas por seres humanos, em
alguns casos o processamento poder extrair um valor invlido ou inesperado.
Diante de um eventual insucesso na tentativa de extrao automatizada, a resposta
poder ser encaminhada fase de [RCOL] Reviso Colaborativa (encaminhamento
representado pelo conector (2) no workflow), para o processamento supervisionado por
colaboradores, a exemplo de abordagens apresentadas no Captulo 5 (FININ et al., 2010;
HEINZELMAN, J.; WATERS, 2010; ROGSTADIUS; KOSTAKOS, 2011; HOWARD,
2013).
De forma alternativa ou complementar, uma nova requisio de feedback tambm
pode ser enviada a um novo grupo de usurios, em funo da proximidade e/ou nvel de
confiabilidade da fonte de informao. Por exemplo, uma nova requisio para os agentes
de campo mais prximos da localidade de interesse.
6.2.2.3

[CFD] Compatibilizar Formato de Data


A incompatibilidade de formatos representa um obstculo tpico de integrao de

dados. Hoje, diversas abordagens e ferramentas do tipo ETL (Extract, Transform, Load) j
se especializam no tratamento de problemas desta natureza (CORDEIRO, 2015).

127
Todavia, ao propor uma arquitetura de soluo flexvel ao elevado grau de
heterogeneidade caracterstico do ambiente de emergncias, a compatibilizao de dados
indispensvel para a construo de procedimentos de tratamento generalistas, isto , no
comprometidos com as especificidades dos distintos meios de gerao de informao.
Para resolver este requisito de integrao, aps o processo [AAV] Associar
Atributos ao Vocabulrio identificar o atributo correspondente data de gerao da
informao (associado ao termo Post.When.dtPosted do vocabulrio de referncia), o
processo [CFD] Compatibilizar Formato de Data interpreta a data de publicao,
convertendo-a segundo o padro adotado pelo sistema.
A especificao prvia do administrador sobre o formato padro de data apresentado
pela fonte de informao originadora auxilia o autmato na tarefa de interpretao da ordem
sequencial dos valores dia, ms, ano, hora, minuto e segundo, dentro do
atributo temporal processado. Os exemplos retratados no Quadro 6.2 ilustram valores de
entradas e resultados deste processamento:
Quadro 6.2. Exemplo de entradas e resultados do processamento de publicaes no processo [CFD]
Compatibilizar Formato de Data

Fonte
Info

Atributo Data
P.When.dtPosted

Valor Original
do Atributo

Resultado de [CFD]
YYYY-MM-DD
HH:MM:SS

time

2010-03-28T07:16:17.510Z

2010-03-28 07:16:30

created_time

2014-10-29T16:49:11+0000

2014-10-29 16:49:11

date_received

1/16/10 20:46

2010-01-16 20:46:00

datetaken

2010-03-04 04:03:01

2010-03-04 04:03:01

created_on

22/01/2010 14:35

2010-01-22 14:35:00

No caso do insucesso da tentativa de compatibilizao automtica do formato de


data, a publicao ser sinalizada e encaminhada para o processamento colaborativo
supervisionado [MCFD] Compatibilizar Formato de Data Manualmente, na fase [RCOL]
Reviso Colaborativa (representado no workflow pelo conector (3)).
6.2.2.4

[CFC] Compatibilizar Formato de Coordenadas


De forma anloga ao tratamento executado pelo processo [CFD] Compatibilizar

Formato de Data, este processo buscar, em primeiro nvel, compatibilizar automaticamente

128
o formato dos atributos referentes s coordenadas de localizao da publicao, associados
aos termos Post.Where.dblLatitude e Post.Where.dblLongitude do vocabulrio de referncia.
Em caso de insucesso na compatibilizao de formatos ou mesmo da inexistncia de
valores associados aos atributos (como o caso das mensagens SMS), o processamento ser
encaminhado para um segundo nvel de tratamento, onde mtodos de linguagem natural
buscam extrair o nome da localidade geogrfica dentro do corpo do texto da publicao
(associado ao termo Post.What.strMessage) e geocodific-lo70 a fim de obter as coordenadas
geogrficas relativas ao local objeto da informao processada.
No caso de novo insucesso aps o tratamento em segundo nvel, a falha ser
sinalizada e a mensagem encaminhada para o georreferenciamento por meio do
processamento

colaborativo

supervisionado

[MGEO]

Geolocalizao

Manual

(encaminhamento representado pelo conector (4) no workflow).


6.2.2.5

[VID] Verificar Idioma


Como pr-requisito para a execuo do processo [CLA] Classificar (descrito na

subseo a seguir), necessrio que o contedo informativo esteja disponvel no idioma


previamente definido para o evento (ingls, por exemplo).
A propsito, segundo o levantamento realizado por Amaral (2003), a clareza um
atributo fundamental para o julgamento da qualidade de uma informao. Deste modo, a
adoo de um idioma padro tambm essencial para que os consumidores das informaes
possam compreend-las claramente.
Algumas fontes (ex.: redes sociais, mensagens de e-mail) podem informar o idioma
da publicao em seu conjunto original de atributos. Neste caso, o atributo indicador do
idioma da mensagem dever ser associado ao termo Post.What.strLanguage do vocabulrio
de referncia. Para os demais casos (ex.: SMS) necessrio submeter o contedo textual a
mtodos automticos para identificao do idioma da publicao.
Tcnicas de processamento de linguagem natural apresentam resultados satisfatrios
para a deteco de idiomas nativos em textos. Algumas ferramentas populares so Google
Translate71, Microsoft Translator72, AlchemyAPI73. Todavia, os servios automatizados hoje

70

Geocodificao o processo de converter endereos (por exemplo, Av. Presidente Vargas, 20, Centro, Rio
de Janeiro) em coordenadas geogrficas (por exemplo, latitude 21,423021 e longitude -43,083739).
71
Google Translate API - https://developers.google.com/translate/

129
disponveis ainda no apresentam boa efetividade na traduo completa de contedos que
apresentam elevado grau de coloquialismo (abreviaes, elementos de paralinguagem, erros
de gramtica), como o caso caracterstico da colaborao popular em situaes de
emergncias, conforme abordado na seo 4.4.
No workflow projetado para a arquitetura, aps detectar automaticamente o idioma da
publicao, basta compar-lo com o idioma oficial adotado pela equipe de resposta. Em
caso de compatibilidade do idioma, a publicao poder seguir para a prxima etapa de
tratamento. Caso contrrio, para evitar o descarte prematuro de informaes potencialmente
teis, seguir as abordagens propostas por Heinzelman, e Waters (2010) e Munro (2013). Os
autores sugerem o encaminhamento de publicaes em outros idiomas para a traduo por
colaboradores especializados, como voluntrios locais ou quaisquer outros indivduos
conhecedores do idioma local. Assim, a publicao seguir para o processo [MTRA]
Traduo Manual da fase de reviso colaborativa (representado no workflow pelo conector
(5)).
6.2.2.6

[CLA] Classificar
A exemplo das dimenses tempo (quando) e espao (onde), a dimenso taxonmica

(o qu) tambm essencial para a identificao de similaridades entre publicaes, segundo


a heurstica elaborada e aplicada na fase de agrupamento em histrias [HIST].
Assim, para a composio da dimenso taxonmica de uma publicao, o processo
classificatrio [CLA] varrer todo o seu contedo textual em busca de correspondncias de
palavras-chave cadastradas para categorias pr-definidas pelo administrador da plataforma.
Por exemplo, sade, segurana, logstica, nutrio, etc..
Para aumentar o desempenho do processo, o classificador tambm analisa expresses
regulares construdas a partir de combinaes de palavras-chave com operadores lgicos.
Por exemplo, a partir da expresso road&(block|collapse), definida para a classe
Collapsed Structures, o classificador atribuir tal classe para todas as ocorrncias
conjuntas dos termos road e block ou road e collapse dentro do contedo textual
analisado. Convm observar que a ordem de ocorrncia dos termos no influencia no

72
73

Microsoft Translator API - http://msdn.microsoft.com/en-us/library/dd576287.aspx


AlchemyAPI - http://www.alchemyapi.com/

130
resultado da varredura sobre a publicao. Desta forma, basta que ambos os termos ocorram
conjuntamente, em qualquer posio no texto analisado para que seja associado classe.
O classificador tambm verifica a ocorrncia das palavras-chave em subpartes dos
termos constituintes do contedo textual varrido. Desta forma, a utilizao de radicais de
palavras (procedimento conhecido como stemming74) como palavras-chave pode produzir
um resultado classificatrio mais efetivo. Por exemplo, ao se deparar com a ocorrncia do
termo roads durante a varredura do contedo textual da publicao, o classificador
atribuir a classe Collapsed Structures, uma vez que o termo roads contm a palavrachave cadastrada road.
6.2.3 [HIST] Histrias
Os procedimentos aplicados at este estgio assumem um papel fundamental na
adequao dos dados requeridos para o processamento das etapas subsequentes. Por esta
razo foram congregados em uma fase operacional denominada pr-processamento.
Deste ponto em diante, as estratgias adotadas para o estabelecimento de correlaes,
identificao e tratamento de conflitos dentro de grupos de informaes correlatas,
constituem o cerne da contribuio deste trabalho.
6.2.3.1

[EPC] Encontrar Publicaes Correlatas


Este processo busca estabelecer associaes entre a publicao corrente e as demais

j tratadas e armazenadas no repositrio de coleta e processamento. Evidentemente que a


automatizao desta etapa indispensvel, uma vez que seria invivel calcular e comparar
milhares de mensagens entre si, manualmente.
A heurstica adotada realiza comparaes em pares (vide ilustrao da Figura 6.5)
entre publicaes de um conjunto caracterizado pelo elevado grau de heterogeneidade
estrutural. Para isso, cria um ndice comparativo que conjuga trs atributos bsicos de uma
informao: espao (onde), tempo (quando) e taxonomia (o qu) (HART, 1996). A este
ndice ser atribudo o nome de ndice de Correlao (Cm,n).

74

Stemming - http://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html

131

Figura 6.5. ndice de Correlao: comparao pareada entre publicaes armazenadas no repositrio de coleta e
processamento e a publicao ingressante no processo [EPC] Encontrar Publicaes Correlatas

A sequncia desta subseo apresenta a composio elaborada para a determinao


do ndice de Correlao.
Cespm,n - ndice de Correlao Espacial (Onde): presume-se que quanto menor for a
distncia geogrfica entre duas publicaes, maior a probabilidade de ambas se referirem a
uma mesma histria. Esta proposio pode ser expressa atravs da seguinte equao:
{

Onde:

distncia euclidiana, em metros, entre as publicaes m e n.

distncia mxima (pr-estabelecida a critrio do analista), em metros,


para correlacionar duas publicaes.

Pode-se verificar atravs do Grfico 6.1 que, ao expressar o ndice de Correlao


Espacial simplesmente em funo da razo inversa da distncia euclidiana entre as
publicaes

comparadas, sua distribuio

assume um comportamento

no-linear

(representada no grfico pela linha amarela). Neste caso, o ndice decresce rapidamente para
distncias euclidianas pequenas, enquanto que, para distncias maiores, o ndice se aproxima
lentamente do valor zero.
Por outro lado, a formulao expressa atravs da equao acima apresenta uma
distribuio inversamente proporcional distncia (representada no grfico pela linha de
verde), com comportamento linear e, portanto, em conformidade com a proposio que a
define (o grau de correlao entre duas publicaes inversamente proporcional
distncia entre elas).

132

Grfico 6.1. Comportamento da distribuio do ndice de Correlao Espacial (C esp) segundo diferentes
formulaes

O parmetro dMAX estipula o limite mximo da distncia euclidiana entre duas


publicaes para que o clculo do ndice seja executado.

Caso a distncia entre as

publicaes exceda o valor dMAX, ser assumido que ambas encontram-se demasiadamente
distantes e, portanto, o ndice de Correlao Espacial ser igual a zero.
Alm de atuar como um balizador de proporcionalidade para solucionar o problema
representado no Grfico 6.1, o parmetro dMAX tambm cumpre funo de aumentar a
eficincia do sistema, uma vez que evita processar e correlacionar publicaes
demasiadamente distantes.
Ctempm,n - ndice de Correlao Temporal (Quando): de forma anloga ao ndice de
Correlao Espacial, presume-se que quanto menor for o intervalo de tempo entre duas
publicaes, maior a probabilidade de ambas se referirem a uma mesma histria. Esta
proposio pode ser expressa atravs da seguinte equao:
{

Onde:

intervalo de tempo, em segundos, entre as publicaes m e n.


intervalo de tempo mximo (pr-estabelecido a critrio do analista), em
segundos, para correlacionar duas publicaes.

133

Ctaxm,n ndice de Correlao Taxonmica (O Qu): presume-se que quanto maior a


quantidade de classes comuns entre duas publicaes, maior a probabilidade de ambas se
referirem a uma mesma histria. Esta proposio pode ser expressa atravs da seguinte
equao:
(
(

)
)

Onde:

conjunto de classes atribudas publicao m.

Cm,n - ndice de Correlao: Determinado em funo da conjugao entre espao, tempo e


taxonomia, conforme a equao a seguir:
[

]
[

Onde:

] valor binrio (0 ou 1) que especifica se ambas as publicaes m e n

retratam um evento.

O parmetro [EVENTm,n] condiciona a contribuio da dimenso temporal para o


clculo da correlao em funo da natureza dos fenmenos retratados nas publicaes. De
acordo com Xavier-da-Silva e Marino (2011), as entidades diferenciam-se dos eventos
essencialmente em virtude de seus distintos intervalos de ocorrncia no tempo, segundo a
escala cronolgica humana. Enquanto os eventos descrevem as transformaes do ambiente
ocorridas em intervalos de tempo relativamente curtos, as entidades registram os fenmenos
ambientais que se transformam lentamente e, de forma imperceptvel observao
momentnea de um indivduo.
Por exemplo, conforme representado na Figura 6.6, a validade da informao acerca
da existncia de um hospital (entidade) perdura enquanto o mesmo realizar atendimentos.

134
Desta maneira, no correto atribuir apenas um momento especfico e pontual no tempo
para representar existncia do hospital no ambiente. Por outro lado, a temporalidade da
informao referente a uma solicitao de ajuda para um cidado ferido (evento) perdura
apenas durante o intervalo de tempo (alguns minutos ou horas) entre a data do evento
causador de seu ferimento e o momento em que ele fora socorrido.

Figura 6.6. Representao ilustrativa dos distintos perodos de validade temporal para informaes relativas a
eventos e entidades

Portanto, para os casos em que ao menos uma das publicaes comparadas represente
a instncia de uma entidade (condio para que o parmetro [EVENTm,n] seja igual a zero), a
dimenso temporal ser desconsidera e, a equao ser balanceada de modo a quantificar o
correlao equitativamente, apenas em funo das componentes espacial e taxonmica das
informaes comparadas (50% de contribuio para cada dimenso).
De acordo com a formulao proposta, mesmo para os casos em que a informao
apresente deficincia em alguma das trs dimenses, o ndice de Correlao no ser
integralmente anulado.

A carncia de um atributo (dimenso) apenas penalizar

parcialmente o resultado final do clculo. Neste caso, a carncia de qualquer um dos


atributos penaliza igualmente o ndice de Correlao em 33,33%.
Por exemplo, para uma publicao que no apresente a informao de localizao
espacial (atributo espao), o clculo da Correlao Espacial (Cesp) entre tal publicao e
quaisquer outras ser igual a zero. Contudo, esta publicao ainda poder ser agrupada com
outras publicaes, caso os clculos parciais para os demais atributos (temporal e
taxonmico) obtenham valores suficientes para elevar o ndice Correlao ao limite mnimo
(

estipulado para a agregao, no processo [AGR] Agrupar em Histrias.

135
6.2.3.2

[AGR] Agrupar em Histrias


Para cada publicao Pm ingressante no sistema, ser formada a sua respectiva

histria75 Hm. Para a histria Hm, a publicao Pm denominada Publicao Raiz, uma vez
que o processo compara o clculo do ndice de Correlao, um a um, entre esta publicao e
todas as demais j armazenadas no sistema. Um ndice de Correlao Mnimo (

),

previamente estipulado, regula se cada publicao Pn avaliada ser ou no includa na


histria Hm.
A relao de equivalncia Cm,n = Cn,m determina uma relao binria simtrica76 entre
as histrias Hm e Hn.

Isto significa que, caso Pm seja agregada histria Hn,

consequentemente a publicao Pn tambm ser agregada historia Hm. Matematicamente,


esta relao pode ser expressa da seguinte forma:

Este processo evidenciar novas associaes entre publicaes (ora desconhecidas),


alm de quantificar a intensidade destes relacionamentos. Para o compartilhamento da
informao tratada, um vocabulrio especializado (apresentado no Apndice D) foi
elaborado para anotar e quantificar estas relaes atravs do padro RDF, conforme
exemplificado na Figura 6.7.

75

Por conveno terminolgica neste trabalho, ser assumido que uma Histria corresponde ao agrupamento
de publicaes com elevado grau de correlao entre si.
76
Uma relao binria simtrica se a relao de a com b implica na relao de b com a (REISSWITZ, 2009).

136

Figura 6.7. Anotao semntica da publicao tratada segundo o padro RDF: informao sobre os atributos
temporal, espacial e taxonmico e suas correlaes com outras publicaes armazenadas no repositrio de
coleta e processamento

6.2.4 [CONF] Conflitos


6.2.4.1

[ICO] Identificar Conflitos em Histria


O processo sinaliza conflitos ocorrentes entre atributos comuns, dentro de um

conjunto de publicaes que constituem uma histria. Desta maneira, como requisito de
processamento, necessrio identificar preliminarmente a ocorrncia dos atributos
quantitativos em cada publicao coletada.
A identificao dos atributos quantitativos realizada por colaboradores na etapa
representada pelo processo [MIAQ] Identificar Atributos Quantitativos, na fase [RCOL]
Reviso Colaborativa do workflow. Logicamente que procedimentos mais sofisticados,
baseados no processamento de linguagem natural podero substituir este processo, para fins
de elevao da autonomia do sistema.

137
A Figura 6.8 ilustra um cenrio exemplo da ocorrncia de conflitos de incongruncia
de valores entre atributos comuns dentro de uma histria.

Figura 6.8. Exemplo de atributos conflitantes entre publicaes que constituem uma histria

6.2.4.2

[RCO] Resolver Conflito


Apesar da possibilidade de elaborar mecanismos automatizados para a deciso de

conflitos de forma autnoma, optou-se por uma abordagem de tomada de deciso semiautomatizada, ou seja, supervisionada por humanos.
A deciso por adotar uma abordagem simplista para a soluo de conflitos deu-se
fundamentalmente por motivos de priorizao em concentrar o tempo disponvel nesta
pesquisa para dedicar-se mais cuidadosamente nos mtodos de grupamento (descritos na
subseo 6.2.3), que constituem o cerne da contribuio e inovao da arquitetura de soluo
proposta. Contudo, alternativas de resoluo automtica de conflitos sero sugeridas no
captulo de concluses, como propostas de continuidade e aprimoramento desta pesquisa.
Ao identificar um conflito de atributos, o analista de informaes ser acionado.
Conforme a situao ilustrada na Figura 6.10, uma interface objetiva lhe prover recursos
visuais e indicadores relacionados s publicaes, fontes e colaboradores envolvidos no
conflito, de modo a apoiar o encaminhamento do problema sinalizado.

138

Figura 6.9. Analista de informaes analisa o conflito e decide pelo encaminhamento da situao

6.2.5 [RCOL] Reviso Colaborativa


Todos os processos constituintes desta fase operacional buscam complementar e
apoiar a fase de pr-processamento nos casos em que a adoo de mtodos automatizados
seja invivel e/ou demande alto custo de processamento. Apresentam-se tambm como uma
alternativa de encaminhamento para as ocasies onde os mecanismos automatizados da
arquitetura no foram capazes de gerar o resultado esperado.
Conforme levantado na pesquisa do estado da arte no Captulo 5, diversas iniciativas
e estudos de caso abordam a distribuio de atividades a colabores (FININ et al., 2010;
MUNRO, 2013), formas de incentivo colaborao (TANG et al., 2011), medidas
verificadoras e reguladoras da qualidade das atividades colaborativas, como tcnicas de
mltiplos encaminhamentos (HOWARD, 2013; SPRING et al., 2013) e a formao e anlise
da reputao de colaboradores (HEINZELMAN, J.; WATERS, 2010).
Portanto, esta fase operacional representa para a arquitetura conceitual, um
encaminhamento alternativo que apela para a colaborao social, e aproveita a capacidade do
raciocnio humano para apoiar a resoluo dos casos de insucesso e/ou inviabilidade de
aplicao do processamento automatizado.
6.2.6 Estrutura de Armazenamento e Recuperao
Diante de uma proposta do enriquecimento da base de conhecimento contextual
atual, a maior parcela de informaes absorvidas pelo sistema ocorre durante a fase de
resposta da emergncia, ou seja, dentro de aproximadamente at quatro semanas aps sua
deflagrao (ANNUNZIATA; OCKWELL, 2008).

Com base nos casos de apoio a

emergncias atravs da colaborao social, o projeto Ushahidi aponta que a ordem de


grandeza do volume de informaes gerado nessas ocasies de fato no demanda estruturas
de armazenamento de grande porte (HEINZELMAN, J.; WATERS, 2010).

139
Portanto, em termos de volume de dados e escalabilidade, acredita-se que a adoo
de uma estrutura de bancos de dados relacional seja suficientemente capaz de armazenar e
recuperar os dados coletados e tratados nesta arquitetura.
6.3

Aspectos da Complexidade Relacionados Arquitetura


Esta seo estabelece associaes entre propriedades dos sistemas complexos e

elementos da arquitetura.

O final da seo apresenta um quadro sintico que organiza

definies de propriedades da complexidade, segundo pensadores desta rea de


conhecimento, e suas respectivas associaes com os elementos da arquitetura e o cenrio de
emergncias.
6.3.1 Propriedades Emergentes e Feedbacks
Num ambiente colaborativo para o apoio da resposta emergncia, a informao
tratada pela arquitetura para apoiar a deciso da equipe de comando uma propriedade
emergente resultante da conjugao dos conhecimentos pessoal anterior (experincia dos
profissionais diretamente envolvidos na resposta), formal anterior (dados de agncias e
secretarias de governo) e contextual atual (originado pelos cidados, equipes de campo e
sensores de monitoramento ambiental). Neste caso o todo, isto , o ganho de conhecimento
para a tomada de deciso, maior que a soma das informaes que a geraram, conforme
ilustrado na Figura 6.10.

Figura 6.10. O Conhecimento Combinado que apoia as Equipes de Deciso uma propriedade emergente da
conjugao dos Conhecimentos Pessoal Anterior, Formal Anterior e Contextual Atual. Adaptado de Diniz et al.
(2005)

possvel tambm identificar propriedades emergentes resultantes de cada nova


iterao do ciclo de maturao da informao (Figura 6.11). Os mecanismos de feedbacks
geram novas requisies s fontes de informao em busca da complementao ou resoluo

140
de inconsistncias na informao anteriormente capturada. Em resposta s requisies,
novas colaboraes so prestadas, processadas e avaliadas, promovendo o enriquecimento da
base de conhecimento contextual.

Figura 6.11. Feedbacks propiciam o enriquecimento e a evoluo da base de conhecimento a cada novo ciclo
de maturao da informao.

6.3.1.1 Organicidade Funcional e Multiescalaridade


Segundo Prado (2011), em um sistema complexo cada subsistema possui um
processamento interno de informaes (ou processamento algortmico), de modo a ocorrer
uma relao funcional entre os subsistemas. Pode-se ento considerar que um sistema
complexo um conjunto de partes ou subsistemas com processamentos internos singulares,
conectadas entre si, formando uma unidade coletiva com uma dinmica prpria e
propriedades emergentes.
Na arquitetura proposta, os diferentes estgios de tratamento submetem a informao
a procedimentos de associaes, agrupamentos, estabelece mecanismos para identificar e
solucionar casos de escassez e conflitos de informao, dentre outros.

O papel

desempenhado por cada processo no sistema resultado da agregao de um conjunto de


subprocessos.

De forma anloga, numa escala inferior, cada subprocesso pode ser

decomposto em um conjunto de subprocessos e/ou operaes atmicas, e assim


recursivamente, at que o sistema seja indecomponvel.
Entretanto, apesar de modulares, estes processos so inter-relacionados e
funcionalmente dependentes.

Determinados processos podem interagir e depender do

resultado de um ou mais outros processos componentes do sistema. Desta forma, somente


aps a concluso dos processos predecessores que ele poder completar sua operao.
Estas caractersticas de interrelao e multiescalaridade caracterizam o comportamento de
organicidade funcional, tpico de uma unidade sistmica complexa (Figura 6.12).

141

Figura 6.12. Organicidade Funcional: conjunto de subsistemas com processamentos internos singulares,
conectados entre si, formando uma unidade coletiva

6.3.1.2 Adaptabilidade e Heterogeneidade


A modelagem da arquitetura deve ser suficientemente adaptvel de modo a sustentar
a capacidade de integrar fontes de informaes heterogneas: SMS, e-mail, redes sociais,
sensores ambientais, agentes de campo, entre outras que futuramente podero vir a surgir e
se popularizar.
Alm disso, preciso adaptar os diferentes formatos de representao de dados para a
integrao de atributos correlatos entre as diferentes fontes de informaes, conforme os
exemplos ilustrados no Quadro 6.2.
6.3.1.3 Multi-escalas
Na arquitetura apresentada na Figura 6.1, em menor escala, os processos envolvidos
na coleta e tratamento da informao colaborativa provocam interaes sistemticas entre
geradores (os colaboradores) e analistas (gestores de informao) de contedo, para formar a
base de conhecimento contextual atual. Por sua vez, em maior escala, o conhecimento
contextual atual se combina com os demais tipos de conhecimentos para gerar o
conhecimento combinado, conforme ilustrado na Figura 6.13.

142

Figura 6.13. Multiescalaridade: coleta e tratamento de informao colaborativa para a construo da base de
conhecimento contextual atual. Numa escala mais ampla, combinao de diferentes tipos de conhecimentos
para a formao do conhecimento combinado

143
Quadro 6.3. Definies das propriedades dos Sistemas Complexos e suas respectivas associaes com os elementos da arquitetura de soluo e o ambiente de emergncia

Propriedade

Definio

Contextualizao com a Arquitetura e o Ambiente de Emergncia

Propriedades
emergentes

Sistemas Complexos so compostos de vrias partes


interagindo entre si de uma forma no simples.
Nesses sistemas, o todo mais do que a soma das
partes, dado as propriedades das partes, as leis das
suas interaes, no trivial inferir as propriedades
do todo. Um fenmeno emergente quando surge
como resultado da interao entre seus componentes
(SIMON, 1962).

A informao utilizada pelas equipes de comando para tomada de


deciso uma propriedade emergente da conjugao dos
conhecimentos pessoal anterior (experincia dos profissionais
diretamente envolvidos na resposta), formal anterior (dados de
agncias e secretarias de governo) e contextual corrente (originado
pelos cidados e equipes de campo). Neste caso o todo, isto , o
ganho de conhecimento que apoia a deciso, maior que a soma das
informaes que a geraram (Figura 6.10).

Organicidade
Funcional

Cada subsistema possui um processamento interno de


informaes (ou processamento algortmico), de
modo a ocorrer uma relao funcional entre os
subsistemas. Um Sistema Complexo um conjunto
de partes ou subsistemas com processamentos
internos singulares, conectadas entre si, formando
uma unidade coletiva com uma dinmica prpria e
propriedades emergentes (MARIOTTI, 2010).

Os diferentes estgios de tratamento submetem a informao a


procedimentos de associaes, agrupamentos, identificao da
provenincia, mecanismos de lidar com a escassez e conflitos de
informao, dentre outros. Cada processo opera com um foco
diferente, executando diferentes algoritmos. Apesar de modulares, os
processos so inter-relacionados e dependentes funcionalmente.
Determinados processos podem interagir e depender do resultado de
um ou mais outros processos componentes do sistema. Desta forma,
somente aps a concluso dos processos predecessores que ele
poder completar sua operao.

Adaptabilidade

Um sistema complexo adaptativo pode funcionar (ou


continuar a existir) somente se realiza uma adaptao
contnua a um ambiente que apresenta alteraes
contnuas (HOLLAND, 1999).

Diante de situaes emergenciais os comandantes das agncias de


emergncia precisam tomar decises em um ambiente complexo e
incerto, obrigando-os a se adaptar continuamente s transformaes
ambientais imprevisveis, alm dos efeitos resultantes de suas
decises.
A modelagem da arquitetura deve ser adaptvel suficientemente de
modo a sustentar a capacidade de incorporar distintas formas de
entrada de informaes: SMS, e-mail, redes sociais, sensores
ambientais, agentes de campo, entre outras que futuramente podero
ser agregadas ao sistema.

144
preciso adaptar os diferentes formatos de representao de dados
para a integrao de atributos correlatos entre as diferentes fontes de
informaes.
Exemplo: Facebook.created_time = 2014-1029T16:49:11+0000 versus Flickr.datetaken = 2014-10-29 16:49:11.
Heterogeneidade

A complexidade um tecido de constituintes


heterogneos inseparavelmente associados: ela
coloca o paradoxo do uno e do mltiplo (MORIN,
2007).

Diversidade de fontes de informaes envolvidas no processo de


captura: sensores, agentes de campo, redes sociais, SMS, e-mail, etc.
As fontes de informaes apresentam distintos formatos de
apresentao de um mesmo dado.
A diversidade de opinies num grupo heterogneo possibilita a
anlise de questes sob distintos pontos de vista, o que
potencialmente resulta numa avaliao melhor e mais completa.
Diferentes padres de escritas e formalidade: agentes de campo e as
mdias oficiais buscam manter um maior nvel de formalidade e
estruturao em suas publicaes. No mbito das redes sociais
(principalmente nos microblogs) e mensagens SMS, cidados tendem
a publicar com alto grau de coloquialismo (conciso, grias,
abreviaes), o pode comprometer a qualidade da informao, alm
de reduzir a efetividade da aplicao de processos automatizados de
extrao de contedo.
Multilinguismo: desastres de grandes propores podem demandar a
ajuda internacional. Nestes casos, o idioma nativo local pode ser
diferente do idioma de comunicao adotado pelas equipes de
resposta internacional (HEINZELMAN, J.; WATERS, 2010).

Multi-escalas

Sistemas interagindo com outros sistemas, de modo a


formar sistemas mais amplos em escalas e com
propriedades emergentes. Tal processo ocorre em
escalas progressivamente mais amplas ou mais
restritas, ou seja, ocorrem expresses de sistemas em
multi-escalas. Cada escala possui as suas prprias

Gesto da emergncia organizada em diferentes escalas (Figura 3.2)


Em menor escala, os processos envolvidos na coleta e tratamento da
informao colaborativa provocam interaes sistemticas entre
geradores (os colaboradores) e analistas (gestores de informao) de
contedo, para formar a base de conhecimento contextual atual. Em
maior escala, o conhecimento contextual atual se combina com os

145

Feedback

Imprevisibilidade

Unidade
Coletiva

leis (MILLER, 2007).

demais tipos de conhecimentos para gerar o Conhecimento


Combinado (Figura 6.13).

Uma estrutura de feedback um lao causal, uma


cadeia de causas e efeitos que forma um anel. Dentre
essas estruturas, a mais simples o feedback de
reforo, tambm conhecido como efeito bola-de-neve
ou ciclo vicioso. A principal caracterstica do
feedback de reforo ser auto-amplificador
(PALAZZO, 1999).

A fase de tratamento dos dados depende do feedback da comunidade


colaboradora e equipes de campo para proporcionar o
amadurecimento da informao quando constatadas por avaliadores
como incompletas ou incongruentes.

O ambiente complexo formado por diversos tipos


de agentes os quais interagem entre si de uma
maneira no previsvel. H um controle central
moderado usando regras simples de operao que do
origem
a
um
comportamento
complexo
(MITCHELL, 2009).

necessrio o uso de fontes externas de informao igualmente


dinmicas, com estruturas adaptveis e mecanismos para lidar com a
imprevisibilidade, impreciso e facilitar a integrao com as bases do
ambiente interno.

Um Sistema Complexo composto por um conjunto


de partes conectadas por alguma forma de interrelao entre as mesmas. necessrio no somente
conhecer as partes, mas tambm os modos de relao
entre elas. As partes, conectadas por uma rede de
relaes, geram conjuntamente uma Unidade
Coletiva comumente chamada Sistema (PRADO,
2011).

Agentes geradores (equipes de campo, cidados, mdia, sensores,


agncias de governo) so partes conectadas com a comunidade
consumidora (equipes de comando e controle, gestores polticos) por
meio da informao.

Quando julgado necessrio, a informao ser submetida a uma nova


iterao, passando por um processo de retroalimentao (feedback) e,
possivelmente promover a evoluo da base de conhecimento.

O fator humano, neste caso, aumenta ainda mais o grau de


imprevisibilidade do sistema. Suas decises e aes, em algumas
situaes, podem ser guiadas por pontos de vistas pessoais e at
mesmo influenciadas por fatores emocionais.

No possvel compreender todo o processo analisando apenas um


componente deste conjunto, uma vez que cada elemento constituinte
possui diferentes papis (prestao da informao, atuao na
resposta, anlise da situao, deciso), seguem diferentes regras e
operam segundo especficos planos de ao. A interao entre estes
elementos essencial ao fluxo do sistema.

146

7 Aplicao Experimental
Este captulo documenta as etapas de desenvolvimento e experimentao do
prottipo construdo com base na arquitetura de soluo proposta no Captulo 6. A primeira
seo do captulo descreve os recursos utilizados para a codificao, e apresenta produtos do
desenvolvimento atravs de interfaces e suas respectivas funes no prottipo. A segunda
seo do captulo caracteriza a origem e o tipo de contedo que constitui cada uma das bases
adquiridas para a experimentao. Na sequncia, o captulo apresenta os resultados da
experimentao conduzida sobre as bases de dados adquiridas.
7.1 Prottipo Experimental da Arquitetura
A plataforma SocialCol77 (acrnimo para Social Collaboration) um prottipo
desenvolvido para fins de experimentao da arquitetura de soluo proposta nesta pesquisa.
A etapa de codificao utilizou os recursos da linguagem de programao PHP78 (Personal
Home Page) e sua estrutura nativa de gerenciamento de banco de dados MySQL79. Alm de
tratar-se de uma ferramenta livre (freewares) e bastante popular atualmente, verificou-se
previamente que o recurso seria suficientemente capaz de atender aos requisitos demandados
pelos processos da arquitetura.
A plataforma SocialCol, j carregada com as bases de dados utilizadas na
experimentao desta pesquisa, est disponvel para consulta atravs do endereo
http://www.greco.ppgi.ufrj.br/socialcol.
As subsees a seguir apresentam algumas interfaces e funcionalidades extradas da
plataforma.
7.1.1 Interface para o Gerenciamento de Fontes de Informaes
A Figura 7.1 apresenta a interface de gerenciamento de fontes de informaes
elaborada para o prottipo experimental da arquitetura.

77

Plataforma Experimental SocialCol http://www.greco.ppgi.ufrj.br/socialcol


PHP uma linguagem de programao de ampla utilizao, interpretada, que especialmente interessante
para desenvolvimento para a Web e pode ser mesclada dentro do cdigo HTML. A sintaxe da linguagem
lembra C, Java e Perl, e fcil de aprender. O objetivo principal da linguagem permitir a desenvolvedores
escreverem
pginas
que
sero
geradas
dinamicamente
rapidamente.
Fonte:
http://php.net/manual/pt_BR/preface.php
79
MySQL - https://www.mysql.com/
78

147

Figura 7.1. Interface de gerenciamento de fontes de informaes da plataforma experimental SocialCol. Fonte:
Plataforma SocialCol.

A agregao de uma fonte de informao no sistema requer o carregamento de sua


respectiva biblioteca de funes (script) que dever codificar os seguintes procedimentos de
comunicao:

[COL] Coletar Publicaes: coleta a partir da consulta ao repositrio de dados da


fonte de informao colaborativa.
$strFromDateTime,

A funo getMessages($strKeywords,

$strToDateTime,

$dblLatitude,

$dblLongitude,

$dblRadiusKm) {return <results>} deve ser codificada na biblioteca para habilitar


a coleta. O parmetro strKeywords restringe os resultados da busca a palavras-chave
especficas.

O parmetro strFromDateTime (opcional) restringe o conjunto de

publicaes, retornado somente a registros criados a partir da data estabelecida em tal


parmetro.

Os parmetros dblLatitude, dblLongitude, dblRadiusKm (opcionais)

limitam os resultados da busca

um raio de proximidade de uma determinada

localidade. A restrio espacial poder eliminar publicaes originadas fora dos


domnios geogrficos da regio de ocorrncia do evento analisado;

[FED] Requisitar Feedback: estabelece o contato de retorno com o usurio de uma


fonte de informao colaborativa. Dado ao fato de algumas fontes de informaes

148
no disponibilizarem mecanismos para o estabelecimento do contato de retorno com
o emissor, a implementao da funo postMessage($idUser, $strMessage) {} no
obrigatria na biblioteca.

Contudo, as requisies de feedback sero somente

possveis para aquelas fontes que viabilizarem a comunicao de retorno atravs


desta funo na biblioteca.
As especificaes detalhadas para a elaborao de bibliotecas de comunicao das
fontes de informaes colaborativas esto descritas no Apndice A deste documento.
O Apndice B apresenta o cdigo na linguagem de programao PHP referente ao
script elaborado para a coleta de contedo obtido a partir da rede social Facebook. O script
tambm codifica procedimentos para o envio de mensagens (necessrias s requisies de
feedback no processo [FED]) a um determinado usurio da rede social.
Ao submeter o script, um diagnstico automaticamente executado com a finalidade
de verificar se os procedimentos de coleta e publicao encontram-se ou no presentes e
operantes. A coluna Get | Post na Figura 7.1 indica a disponibilidade (ou no) destes
procedimentos para cada fonte de informao cadastrada na plataforma.
A Figura 7.2 apresenta a interface para a configurao dos parmetros de uma fonte
de informao na plataforma experimental SocialCol.

Figura 7.2. Parmetros de configurao de uma fonte de informao e resultado do diagnstico executado sobre
o script de coleta e publicao carregado na plataforma experimental SocialCol. Fonte: Plataforma SocialCol.

149
Os parmetros de configurao definidos pelo administrador atravs do
gerenciamento das fontes de informaes cadastradas na plataforma so:

Fenmeno Retratado: especifica o tipo de fenmeno (evento ou entidade)


retratado nas informaes originadas pela fonte, segundo a classificao definida por
Xavier-da-Silva e Marino (2011), introduzida no Captulo 3. Conforme abordado na
subseo 6.2.3.1, a validade temporal de uma informao est condicionada ao tipo
de fenmeno que ela se refere e, consequentemente, a correlao temporal no
processo [EPC] Encontrar Publicaes Correlatas ser determinada em funo
deste atributo classificatrio.

Nvel de Confiana: valor inteiro que representa o nvel de confiabilidade da fonte.


Para fontes oficiais, por exemplo, pode ser atribudo o valor mximo do nvel de
confiana. Conforme a situao ilustrada na Figura 6.9, esta hierarquizao permite
que o analista da informao, no processo [RCO] Resolver Conflito:
o Tome decises ponderadas pelo nvel de confiabilidade da fonte;
o Priorize a requisio de feedbacks em funo do nvel de confiabilidade da
fonte de informao.

Formato Data de Entrada: formato no qual a fonte de informao representa os


atributos temporais. Uma vez que cada fonte adota um padro particular para a
representao de data e hora, o processo de pr-processamento [CFD]
Compatibilizar Formato de Data tomar por base este padro sequencial, de modo a
interpretar corretamente os atributos descritores de data e, desta forma, efetuar a
converso para um formato nico no sistema (conforme ilustrado no Quadro 6.2).

Frequncia de Coleta: As distintas limitaes e finalidades das fontes de


informaes produzem contedos em diferentes formatos, volumes e intervalos de
tempo. Por exemplo, as redes sociais geram um volume intenso de contedo atravs
de seus milhes de usurios ao redor do mundo continuamente conectados.

contedo gerado por um simples usurio imprevisvel, uma vez que pode ocorrer a
qualquer momento.

Alm disso, pode ser influenciado por fatores pessoais ou

circunstanciais, como seu humor, ocasies especiais, disponibilidade de conexo, etc.


Por outro lado, o volume de dados e a frequncia de gerao de um sensor remoto
so controlveis e determinsticos. J para os agentes de campo, a gerao de

150
informao ocorre de acordo com a demanda do comando. Desta forma, o parmetro
Frequncia de Coleta possibilita que o sistema consulte e colete informaes nas
fontes geradoras, respeitando suas especificidades quanto disponibilizao de
contedo.
7.1.2 Associao de Atributos das Fontes de Informaes com o Vocabulrio de
Referncia
A interface representada na Figura 7.3 foi desenvolvida para viabilizar a associao
dos atributos de uma fonte de informao a termos do vocabulrio de referncia.

Figura 7.3. Interface da plataforma experimental SocialCol para associao dos atributos de uma fonte de
informao com termos do vocabulrio de referncia. Fonte: Plataforma SocialCol.

Para cada fonte de informao agregada ao sistema, a plataforma efetuar uma leitura
preliminar e listar todos os atributos da informao proveniente daquela fonte. Em seguida,
o administrador do sistema dever associar os atributos da informao correspondentes a
cada termo do vocabulrio de referncia.

151
7.1.3 Gerenciamento dos Grupos Classificatrios para o Processo [CLA] Classificar
Buscando criar uma categorizao abrangente para informaes relacionadas a
emergncias, decidiu-se utilizar a classificao adotada pela diviso setorial das equipes de
resposta a emergncias das Organizaes das Naes Unidas (introduzidas na Figura 1.1):
logstica, nutrio, abrigos de emergncia, gerenciamento e coordenao de campo, sade,
proteo, agricultura, telecomunicao, recuperao rpida, educao, gua e saneamento
(OCHA, 2012).
A Figura 7.4 apresenta a interface da plataforma experimental SocialCol para o
cadastro das classes de um evento e seus respectivos conjuntos de palavras-chave, aplicados
para o processamento de [CLA] Classificao.

Figura 7.4. Interface para o gerenciamento de classes para o evento experimental Terremoto em Porto Prncipe
(Haiti) na plataforma SocialCol. Fonte: Plataforma SocialCol.

A Figura 7.5 ilustra o resultado do processamento do classificador sobre o contedo


textual de uma publicao na plataforma experimental SocialCol.

152

Figura 7.5. Classes atribudas a uma publicao aps o processamento de [CLA] Classificar na plataforma
experimental SocialCol. Fonte: Plataforma SocialCol.

Para a publicao analisada no exemplo ilustrado acima, o classificador atribuiu


quatro

classes:

Necessidade.Water,

Necessidade.Food,

Necessidade.Sanitation

Necessidade.Shelter. Os nmeros entre parntesis que acompanham os nomes das classes


atribudas identificam a quantidade de ocorrncias de palavras-chave referente quela classe,
encontradas no contedo textual analisado.
7.1.4 Configurao do ndice de Correlao para o Agrupamento no Processo
[HIST] Histrias
A formulao do ndice de Correlao pode variar de acordo com os critrios de cada
avaliador.

Assim, para proporcionar maior flexibilidade abordagem, a plataforma

experimental desenvolvida permite ao usurio personalizar a formulao e reprocessar os


clculos e agrupamentos a qualquer momento, conforme destacado na Figura 7.6.

153

Figura 7.6. Possibilidade de personalizar parmetros e a equao para o clculo do ndice de Correlao entre
publicaes na plataforma experimental SocialCol. Fonte: Plataforma SocialCol.

A Figura 7.7 apresenta duas publicaes extradas da base de dados experimental,


utilizadas para ilustrar os clculos determinantes do ndice de Correlao segundo a
heurstica definida na subseo 6.2.3, e seu posterior julgamento quanto agregao ou no
na histria.

Figura 7.7. Exemplo de publicaes extradas da base de dados experimental para o clculo do ndice de
Correlao e deciso quanto ao agrupamento em histria na plataforma SocialCol. Fonte: Plataforma SocialCol.

154

Histria H145566: Publicao Raiz: P145566; Publicao Verificada: P145740; Cmin: 0,5
Clculos:
d145566,145740 = (18.54277343:-72.29811251), (18.54277343:-72.29811251) = 0 metros
t145566,145740 = 31/01/2010 02:52:00 31/01/2010 03:04:00 = 12min x 60seg = 720 segundos
#{class145566,145740} = 1, #{Uclass145566,145740} = 2
C145566,145740 = [(1 - 0/500) + (1 720/3600) + 1/2]/3 C145566,145740 = 0,76
Resultado: C145566,145740 > Cmin Agregar P145740 a H145566 e P145566 a H145740
O agrupamento tambm permite que o analista monitore a evoluo temporal e o
ciclo de vida de uma histria. Apesar de cada publicao estar vinculada sua data de
criao, quando agrupada em uma histria, adquire-se uma viso holstica quanto ao
contexto e as circunstncias que envolveram a sua gerao.
Conforme ilustrado na Figura 7.8, a dimenso temporal da informao deixa de ser
pontual (unidimensional) e distribui-se num perodo contnuo (bidimensional).

agrupamento tambm poder evidenciar e quantificar o quo defasado uma determinada


informao se encontra em relao ao incio da histria (data de publicao da colaborao
mais remota), construindo uma visualizao que apoia a determinao do grau de atualidade
da referida informao.

Figura 7.8. Disposio cronolgica das publicaes de uma histria em forma de Linha do Tempo na
plataforma experimental SocialCol. Fonte: Plataforma SocialCol.

7.1.5 Valorao de Atributos Quantitativos em Publicaes


A Figura 7.9 apresenta a interface desenvolvida na plataforma experimental
SocialCol, onde revisores colaboradores podem identificar e valorar os atributos

155
quantitativos presentes nas publicaes coletadas.

Este estgio de tratamento est

representado no workflow da arquitetura (Figura 6.2) pelo processo [MIAQ] Identificar


Atributos Quantitativos, na fase [RCOL] Reviso Colaborativa.

Figura 7.9. Interface para identificao de atributos quantitativos em publicaes na plataforma experimental
SocialCol. Fonte: Plataforma SocialCol.

Alm de identificar a ocorrncia de atributos com valores conflitantes dentro de uma


mesma histria, o produto desta etapa possibilitar a sinalizao dos casos de incompletude,
isto , aqueles caracterizados por atributos associados a valores qualitativos como, por
exemplo: muitos mortos, poucos alimentos, alguns medicamentos, etc.. Para estes
casos, as requisies de feedback podem ser acionadas para apoiar a obteno do valor
preciso para o atributo.
7.1.6 Identificao Histrias e Tratamento de Conflitos
A Figura 7.10 apresenta o painel de histrias do evento. Cada linha da tabela
representa uma histria do evento emergencial.

Figura 7.10. Identificao de conflitos de informaes em uma histria na plataforma SocialCol. Fonte:
Plataforma SocialCol. Fonte: Plataforma SocialCol.

A coluna Raiz identifica o nmero da publicao que originou a formao da


histria. A coluna Perodo descreve as datas da publicao mais remota e mais recente

156
dentro do grupo de publicaes da histria. A coluna Posts Relacionados apresenta os
identificadores das demais publicaes que compem a histria. Para uma publicao fazer
parte daquele conjunto, significa que o ndice de Correlao entre ela e a publicao raiz
superou o valor mnimo (Cmin) previamente estipulado para o agrupamento.
Conforme apresentado na Figura 7.6, para este experimento o valor mnimo de corte
foi definido em 0,4, para um ndice de Correlao que pode variar entre 0,0 (sem correlao)
e 1,0 (correlao total). Conforme o exemplo apresentado e detalhadamente calculado na
Figura 7.7, para ser agregado a uma histria, o ndice de Correlao entre duas publicaes
deve sempre ser igual ou superior a 0,4 (Craiz,n 0,4).
A coluna [CONF].[ICO] Identificao de Conflitos apresenta os conflitos
sinalizados em cada histria. Na ilustrao acima, a histria H158224 apresenta trs conflitos
de atributos. O destaque em cor vermelha significa que o conflito ainda no se encontra
solucionado pelo analista de informaes. A cor verde significa que o analista j verificou e
solucionou o conflito.
A coluna Mdia Cm,n representa a mdia aritmtica entre os ndices de Correlao
das publicaes que compem a histria.

Quanto maior este valor, maior o grau de

correlao entre todas as publicaes pertencentes histria.


Conforme ilustrado na Figura 7.11, a disposio cronolgica das publicaes pode
apoiar a anlise para a resoluo do conflito. Ao ordenar a sequncia dos fatos, o analista
dispe de uma melhor visualizao para verificar se o referido conflito realmente se trata de
uma inconsistncia de verses do fato, ou apenas retrata de uma evoluo da situao.

Figura 7.11. Interface para a resoluo de conflitos supervisionada na plataforma experimental SocialCol.
Fonte: Plataforma SocialCol.

Supondo, por exemplo, que uma determinada histria descreva acontecimentos de


um desabamento, a ocorrncia de um conflito de valores para o atributo pessoas falecidas
no necessariamente dever assumir um nico valor como correto.

Neste cenrio

157
possvel que parte, ou at mesmo todos os valores discrepantes sejam verdadeiros, uma vez
que eles podem apenas registrar atualizaes da evoluo do cenrio no decorrer do tempo.
Para fins de julgamento, ponderaes em funo do grau de confiabilidade da fonte,
distncia geogrfica, reputao dos emissores, nvel de atualidade da informao (maior peso
atribudo a publicaes mais recentes) podem representar mtricas teis para apoiar a
deciso final na resoluo do conflito.
7.2 Bases de Dados Adquiridas para a Experimentao
A experimentao conduzida analisou os resultados do processamento do prottipo
sobre um conjunto de bases de dados reais. O acervo de informaes adquirido se refere ao
desastre decorrente do terremoto de magnitude 7.0 que atingiu a cidade de Porto Prncipe,
capital do Haiti, na tarde de 12 de janeiro de 2010. O desastre causou efeitos devastadores
sobre o pas, culminando na morte 222.000 pessoas e ferindo mais 300.000
(GRONEWOLD, 2010).
Apelos de ajuda solicitados pela populao local, relatrios de avaliaes de equipes
de campo e dados de sensores gerados durante a fase de resposta ao desastre compem o
conjunto das bases de informaes adquiridas atravs de pesquisas na Internet, contatos
diretos por e-mail e, tambm pela participao pessoal do autor no apoio resposta do Haiti
(BEM-PARAN, 2010).
Ao todo foram utilizadas bases provenientes de sete origens distintas, conforme
elencadas na Figura 7.12, e detalhadas a seguir.

Figura 7.12. Bases de dados carregadas na plataforma para a experimentao. Fonte: Plataforma SocialCol.

158
A primeira coluna descreve o nome da base de dados (fonte de informao) e as
respectivas datas da publicao mais remota e da mais recente na base. A coluna Pubs.
apresenta o nmero de publicaes em cada base de dados. A coluna Confiana expressa
a hierarquizao do nvel de confiana definida pelo administrador do sistema para cada
fonte agregada ao sistema. Conforme detalhado na subseo 7.1.1, a hierarquizao da
confiabilidade apoia as decises do analista da informao na resoluo de incongruncias e
na priorizao de encaminhamentos de feedbacks de complementao, para casos de
informaes conflitantes.
Estas informaes constituem um conjunto satisfatrio para a aplicao experimental
uma vez que busca observar o comportamento sistmico da arquitetura, considerando as
complexidades proporcionadas por situaes reais de emergncia. Outro fator positivo do
conjunto utilizado o elevado grau de heterogeneidade existente entre as fontes, quanto aos
distintos nveis de confiabilidade, estruturao e frequncia de gerao de contedo.
As subsees a seguir documentam o papel desempenhado pelas organizaes, a
contribuio de suas respectivas bases de informaes durante a fase de resposta ao desastre
e os caminhos percorridos para adquiri-las.
7.2.1 Ushahidi SMS
Conforme j apresentado na subseo 2.3, a organizao Ushahidi80 vem
desempenhando um papel fundamental no apoio captura e tratamento de informaes
colaborativas durante a fase de recuperao de desastres naturais.
Sua contribuio mais notria e expressiva ocorreu justamente no apoio resposta ao
terremoto de magnitude 7.0 ocorrido no Haiti. Como resultado, a equipe de voluntrios
Ushahidi validou e disponibilizou mais de quatro mil registros de informaes e pedidos de
ajuda que partiram da populao e provaram ser teis s equipes de apoio e resgate.
Este repositrio de informaes foi adquirido atravs de pesquisas na internet81 e
compe a base experimental de informaes colaborativas geradas a partir de apelos da
populao local, atravs de mensagens SMS.

80

Ushahidi - http://www.ushahidi.com/
Dataset Haiti Crisis Map - http://datahub.io/dataset/ushahidi/resource/81d058a8-173a-49d9-8ce94edf5e7cafc9
81

159
A tabela de dados representada na Figura 7.13 estrutura instncias de apelos por
ajuda e informaes sobre desabrigados e necessidades bsicas enviadas pela populao
local atravs de mensagens SMS, submetidas a uma triagem de procedimentos (workflow da
triagem apresentado na Figura 5.3) para fins de traduo, geolocalizao e validao da
autenticidade da informao.

Figura 7.13. Amostra da base de informaes Ushahidi referente ao terremoto em Porto Prncipe, Haiti (2010).

7.2.2 Sahana SMS e Rede Social Twitter


A iniciativa Sahana Foundation82 oferece solues de gerenciamento de informaes
que permitem s organizaes e comunidades uma melhor preparao durante a resposta aos
desastres. A organizao atua no desenvolvimento de softwares livres e de cdigo aberto,
alm da prestao de servios que ajudam a resolver problemas concretos e trazer ganhos de
eficincia para a coordenao de resposta a desastres entre governos, organizaes de ajuda,
a sociedade civil e os prprios sobreviventes.
Durante a fase de resposta ao terremoto ocorrido em Porto Prncipe, a equipe Sahana
recebeu um grande nmero de requisies de ajuda originadas pela populao local. As
solicitaes recebidas originaram-se a partir de mensagens SMS e do microblog Twitter.
Procedimentos colaborativos de traduo e validao foram aplicados ao contedo recebido,
de modo a possibilitar uma compreenso mais clara acerca das necessidades da comunidade
local, por parte das organizaes internacionais de apoio envolvidas na resposta.
Para a conduo da experimentao neste trabalho, a base de informaes Sahana foi
obtida a partir de contato direto com o coordenador da organizao, senhor Michael Howden
(histrico da conversa por e-mail disponvel no Apndice E). O coordenador gentilmente
forneceu os dados exclusivamente para fins de experimentao, em prol do desenvolvimento
de solues para o apoio humanitrio.
82

Sahana Foundation http://www.sahanafoundation.org

160
Apesar das informaes terem sido originadas basicamente a partir de mensagens
SMS e do microblog Twitter, a base de informaes cedida pela organizao no
disponibiliza os atributos originais destes meios de comunicao.

Aps o tratamento

colaborativo das informaes recebidas, os atributos foram simplificados e condensados para


uma estrutura uniforme e enxuta, conforme ilustrado na Figura 7.14.

Figura 7.14. Base de informaes cedida pela iniciativa Sahana Foundation referente s solicitaes de ajuda
enviadas pela populao aps o terremoto em Porto Prncipe, Haiti (2010).

7.2.3 Flickr Redes Sociais


A rede social Flickr especializada no compartilhamento de fotos entre seus
usurios.

Ao contrrio das limitaes impostas por outras redes sociais populares

(Facebook, Twitter e Instagram), seus recursos de API permitem recuperar publicaes


criadas em qualquer data anterior.
Desta maneira foi possvel recuperar qualquer contedo gerado por seus usurios
durante a fase de recuperao do desastre, restringindo a consulta ao perodo entre 12 de
janeiro e 29 de maro de 2010. Alm disso, a consulta foi restrita somente s publicaes
que apresentavam coordenadas geogrficas localizadas no interior do retngulo que
circunscreve o territrio do Haiti.
A Figura 7.15 ilustra uma publicao atravs da rede social Flickr, que retrata o
resgate de um cidado debaixo de escombros, cinco dias aps a ocorrncia do terremoto em
Porto Prncipe.

161

Figura 7.15. A imagem publicada atravs da rede social Flickr retrata o resgate de um cidado debaixo de
escombros aps terremoto em Porto Prncipe, em janeiro de 2010. Fonte: Flickr 83

Para a experimentao, a base de dados Flickr representa a colaborao social atravs


das redes sociais. Trata-se de uma valiosa fonte de informaes multimdia, alm dos
comentrios, marcadores (tags) e legendas descritivas que as acompanham.
7.2.4 United States Geological Survey (USGS) Sensores Sismgrafos
A USGS84 (United States Geological Survey) uma organizao cientfica norteamericana que avalia e monitora os perigos naturais que ameaam a vida humana e os
recursos naturais essenciais humanidade.
No campo sismolgico, a instituio conta com uma vasta rede de sensores
espalhados pelo mundo para fins de monitoramento e a manuteno de servios de alertas
contra terremotos (sismos de grandes propores).

Sua base de informaes de

monitoramento ssmico tem cobertura mundial e atualizada em tempo real. Esta base de
dados de domnio pblico, e est disponvel a qualquer usurio conectado internet85.
A interface de consulta possibilita ainda a filtragem restrita a reas geogrficas,
intervalos de magnitude, profundidade do hipocentro, dentre outros parmetros relacionados
a atividades ssmicas. Os resultados da consulta podem ser visualizados diretamente no

83

https://www.flickr.com/photos/vbcityphotographs/4332561503
USGS - http://www.usgs.gov/
85
http://earthquake.usgs.gov/earthquakes/map/
84

162
navegador, dispostos sobre um mapa (conforme ilustrado na Figura 7.16) ou, descarregados
no computador do usurio sob o formato tabular.
Para a obteno dos dados ssmicos referentes ao terremoto do Haiti foi realizada
uma consulta restrita somente regio do Caribe, compreendida entre os meses de janeiro e
fevereiro de 2010. A Figura 7.16 apresenta a visualizao dos 105 resultados desta consulta.
Os registros foram descarregados sob o formato tabular CSV (Comma-separated Values) e
importados na plataforma SocialCol.

Figura 7.16. Registros dos sensores da USGS referente aos sismos ocorridos na regio do Haiti entre janeiro e
fevereiro de 2010. Fonte: USGS86.

Esta base histrica de sismos ocorridos na regio do Haiti entre janeiro e fevereiro de
2010 representa a carga experimental de dados proveniente dos sensores de monitoramento
ambiental.
7.2.5 Mission 4636 - SMS
A Organizao No Governamental Mission 463687 uma iniciativa voluntria
internacional que ofereceu apoio fundamental comunidade local atravs da coleta,

86

USGS - http://earthquake.usgs.gov/earthquakes/map/

163
traduo e processamento on-line de informaes que ligava o povo haitiano uns com os
outros e com os esforos de ajuda internacional.
A iniciativa disponibilizou um canal de comunicao prtico e livre de custos
populao local. Atravs de mensagens de texto SMS enviadas gratuitamente ao nmero
4636 (amplamente divulgado pelas estaes de rdio locais), a populao pde manifestar
suas necessidades aos agentes envolvidos na resposta ao desastre. O trabalho voluntrio
resultou no processamento gil de um volume expressivo de mensagens originrias da
populao local. Ao todo a base de informaes processou mais de quarenta e trs mil
mensagens.
Atravs de contatos estabelecidos por e-mail (histrico do contato apresentado no
Apndice E) esta base de informaes foi gentilmente cedida pela organizao Mission
4643. A Figura 7.17 apresenta uma amostra da base de informaes recebidas e tratadas
pela iniciativa Mission 4636 durante a resposta ao terremoto do Haiti, a exemplo da base de
dados da iniciativa Ushahidi, esta base composta por instncias de apelos e prestao de
informao da populao local, traduzidas, categorizadas e estruturadas pela equipe da
voluntrios da organizao Mission 4636.

Figura 7.17. Amostra da base de informaes recebidas e tratadas pela iniciativa Mission 4636 durante a fase
de resposta ao terremoto do Haiti (2010).

87

Mission 4636 - http://www.mission4636.org/

164
7.2.6 CENACID/UFPR - Vistorias de Equipes de Campo
O Centro Nacional de Apoio Cientfico em Desastres88 (CENACID/UFRJ) tem por
objetivo proporcionar apoio cientfico e tcnico a comunidades afetadas por desastres
naturais. Visa tambm gerar propostas de aes a serem empreendidas no seguimento da
emergncia, bem como promover cursos de treinamento para a preveno e a investigao
das causas e efeitos de desastres ambientais.
Por solicitao da expressiva atuao do governo brasileiro no Haiti, o Centro prestou
apoio fundamental na fase de resposta ao desastre, operando no diagnstico dos impactos
estruturais, polticos e sociais do desastre sobre a populao daquele pas (ITAIPU, 2010).
Incurses a campo possibilitaram equipe avaliar os danos e o comportamento da destruio
causada na capital Porto Prncipe.

Quantificao de perdas e danos, levantamento de

recursos disponveis, avaliaes de riscos iminentes e visitas a comunidades atingidas foram


registrados na plataforma VICON/SAGA, consolidando a base de informaes da equipe
CENACID.
A Figura 7.18 ilustra um exemplo de informao recuperada atravs da plataforma
VICON/SAGA, utilizada nesta experimentao assumindo o papel da informao obtida por
agentes de campo, ou seja, daqueles que representam as fontes com alto nvel de
confiabilidade.

88

CENACID/UFPR - http://www.cenacid.ufpr.br/

165

Figura 7.18. Relatrio de registro de informao coletada a parit de vistorias de campo pela equipe
CENACID/UFPR durante atividades de resposta ao terremoto do Haiti (2010).

7.2.7 PAHO Catlogo Oficial das Unidades de Sade no Haiti


A PAHO (Panamerican Health Organization) mobilizou esforos para ajudar o
governo haitiano a atender s necessidades bsicas de sade de seu povo durante a fase de
resposta ao terremoto. A organizao coordenou e facilitou a mobilizao de especialistas
em sade e equipes de resgate provenientes de seus Estados-Membros e de outras regies
para prestar socorro e recuperao.
Durante a fase de resposta ao terremoto do Haiti, a organizao PAHO disponibilizou
a lista atualizada dos hospitais localizados no pas.

Toda a informao levantada foi

georreferenciada e serviu de apoio para que as iniciativas de sade envolvidas na resposta


encaminhassem seus atendimentos s unidades de sade mais prximas.

166
A organizao PAHO contou com o apoio da plataforma da fundao Sahana para
armazenar e compartilhar suas informaes. Toda a documentao referente ao acervo
levantado, descrio de seus metadados e meios de acesso aos dados foi disponibilizada
atravs de uma pgina web89. A Figura 7.19 apresenta um extrato da listagem das unidades
de sade catalogadas pela organizao, tambm utilizadas na experimentao deste trabalho.

Figura 7.19. Hospitais do Haiti catalogados pela organizao PAHO.

Diferentemente das demais bases experimentais, a base de dados PAHO constituda


pelo levantamento de hospitais localizados no territrio do Haiti, ou seja, representa
instncias de entidades (conceito apresentado no Captulo 3).

Seu atributo temporal

representa apenas a data em que a instncia foi agregada ao catlogo. Entretanto, a entidade
Hospital existia muito antes da data de publicao do catlogo, isto , desde o incio de
suas operaes de atendimento (vide exemplo ilustrado atravs da Figura 6.6).
Neste caso, a dimenso temporal, representada na base de dados pelo atributo
Date_Creation, imprpria para o estabelecimento de correlaes atravs do processo
[EPC] Encontrar Publicaes Correlatas.

Portanto, sua dimenso temporal deve ser

desconsiderada nos clculos de correlao (condio atendida pelo parmetro EVENTm,n


igual a zero) e, conforme o encaminhamento apresentado e justificado na subseo 6.2.3.1, a
formulao do ndice de Correlao ser balanceada de modo a no penalizar os resultados
para tais casos.

89

http://wiki.openstreetmap.org/wiki/WikiProject_Haiti/Status/Hospitals

167
7.3

Resultados da Experimentao
As bases de dados foram carregadas na plataforma experimental SocialCol,

totalizando 34.010 publicaes originadas por 7 fontes de informaes distintas, conforme


detalhado na seo anterior. A experimentao teve por finalidade analisar a efetividade dos
procedimentos de tratamento implementados a partir do modelo conceitual da arquitetura,
proposto no Captulo 6.
7.3.1 Resultados do Processamento [CFD] Compatibilizar Formato de Data
A Tabela 7.1 apresenta o desempenho do processo [CFD] Compatibilizar Formato
de Data na experimentao.

Mesmo adotando uma abordagem simplista para a

uniformizao do formato de datas, os resultados apontam a compatibilizao com sucesso


de todas as publicaes processadas.
Tabela 7.1. Desempenho do processamento [CFD] Compatibilizar Formato de Data na experimentao.
Fonte: Plataforma SocialCol.

Este resultado positivo pode ser justificado pela abordagem de compatibilizao


elaborada para a arquitetura (descrito na subseo 6.2.2.3). A data e hora da criao de
instncias de informaes so automaticamente registradas pelas fontes de informaes,
caracterizando um atributo da informao completamente padronizado. Ao agregar uma
nova fonte de informaes na plataforma experimental da arquitetura, a interface de
gerenciamento requisita que o administrador especifique o seu padro de formatao de data.
Assim, uma vez conhecido o padro de formatao deste atributo, o processo de
converso no falhar.

Independentemente do nmero de registros processados, basta

identificar a posio (fixa) de cada componente da data (dia, ms, ano, hora, minuto,

168
segundo), e reposicion-los segundo o novo formato de sada determinado para o
prosseguimento do tratamento.
7.3.2 Resultados do
Coordenadas

Processamento

[CFC]

Compatibilizar

Formato

de

A Tabela 7.2 apresenta o desempenho do processo [CFC] Compatibilizar Formato


de Coordenadas aps a experimentao.
Tabela 7.2. Desempenho do processamento [CFC] Compatibilizar Formato de Coordenadas na
experimentao. Fonte: Plataforma SocialCol.

A taxa de publicaes processadas, equivalente a 0% para a fonte de informao


Sahana, justifica-se devido ao fato da base no apresentar o atributo espacial referente s
suas publicaes, conforme pode ser verificado em sua amostra apresentada na Figura 7.14.
Quanto fonte Mission 4636, dada disponibilidade dos campos latitude e longitude
(vide Figura 7.17), o atributo espacial fora associado no momento da incluso desta base
plataforma e, portanto, processado por [CFC] Compatibilizar Formato de Coordenadas.
Entretanto, o alto ndice de falhas de processamento (84,79%) tambm ocorreu devido
ausncia da informao das coordenadas em grande parte das publicaes, como pode ser
observado na amostra ilustrada na Figura 7.17.
Para as demais fontes, a alta taxa de assertividade se justifica da mesma forma que a
alta taxa obtida pelo processo [CFD] Compatibilizar Formato de Data.

Ambos os

processos adotaram abordagens anlogas para a converso dos atributos temporal e espacial.
7.3.3 Resultados do Processamento [CLA] Classificar
De acordo com o Grfico 7.1, o processo [CLA] Classificar realizou 20.776
associaes, distribudas entre as 14 distintas classes cadastradas para o evento Terremoto

169
em Porto Prncipe (Haiti).

A requisio por alimentos e gua, representadas

respectivamente pelas classes need.Food e need.Water apresentaram a maior frequncia de


associaes, totalizando juntas 56% das associaes estabelecidas.
Vale lembrar que para cada publicao, o processo classificador pode no realizar
nenhuma associao, bem como atribuir uma ou mais classes cadastradas para o evento.
Este ltimo caso encontra-se ilustrado na Figura 7.5.

Grfico 7.1. Distribuio da quantidade de publicaes associadas s classes do evento aps o processamento
de [CLA] Classificar na experimentao. Fonte: Plataforma SocialCol.

7.3.4 Resultados do Processamento [EPC] Encontrar Publicaes Correlatas


O Grfico 7.2 apresenta o resultado do processamento experimental de [EPC]
Encontrar Publicaes Correlatas, considerando os parmetros limitadores dMAX igual a 500
metros e tMAX igual a 7.200 segundos (2 horas).
O grfico expressa a quantidade de pares de publicaes correlacionados, distribudas
pelos intervalos de valores do ndice de Correlao. A distribuio aponta que apenas 1%
das correlaes superou o ndice de 0,6, e que 0,49% do total de pares comparados
alcanaram o intervalo de mxima correlao, isto , de 0,9 a 1,0.

170

Grfico 7.2. Distribuio da quantidade de pares de publicaes correlacionadas agrupadas por intervalos de
valores do ndice de Correlao, aps o processamento de [EPC] Encontrar Publicaes Correlatas na
experimentao. Fonte: Plataforma SocialCol.

7.3.5 Resultados do Processamento [AGR] Agrupar em Histrias


O Grfico 7.3 quantifica a distribuio de histrias formadas, em funo da mdia
aritmtica interna dos ndices de Correlao das publicaes que compem cada histria.

Grfico 7.3. Resultado processamento de [AGR] Agrupar em Histrias na experimentao: quantidade de


histrias formadas e sua distribuio em funo da mdia do ndice de Correlao entre as publicaes que
compem cada histria. Fonte: Plataforma SocialCol.

O Grfico 7.4 apresenta a distribuio em valores absolutos e percentuais da


participao das bases de dados na formao de histrias.

171

Grfico 7.4. Participao das fontes de informaes em histrias. Fonte: Plataforma SocialCol.

A base de dados Sahana destaca-se por evidenciar que, mesmo que nenhuma de suas
publicaes tenha sido processada na etapa [CFC] Compatibilizar Formato de
Coordenadas, ou seja, todas se apresentam deficientes da componente espacial, 33% de
suas publicaes foram posteriormente correlacionadas com outras publicaes e, obtendo
ndices no mnimo maior ou igual que 0,4.
Segundo a formulao proposta para [EPC] Encontrar Publicaes Correlatas, cada
dimenso contribui de forma igualitria em 33,3% para o clculo. Consequentemente, o
ndice de Correlao entre pares que envolvam publicaes da base Sahana atingir, no
mximo, o valor de 0,66. Ainda que deficiente da dimenso espacial, mais da metade das
publicaes (53,05%) agrupadas em histrias so originadas da base de dados Sahana, o que
pode justificar o alto ndice de correlaes dentro do intervalo de 0,5, conforme indicado no
Grfico 7.3.
7.3.6 Tempo de Processamento e Escalabilidade da Plataforma Experimental
O Grfico 7.5 apresenta o tempo mdio consumido para o processamento de uma
publicao em cada etapa do ciclo de processamento. O tempo total dispendido para a
triagem completa, desde a entrada no sistema at sua agregao dentro de uma histria
estimado em 0,14 segundos.

172

Grfico 7.5. Tempo de processamento de uma publicao para cada etapa de tratamento estabelecida na
arquitetura de soluo. Fonte: Plataforma SocialCol.

Para fins de anlise da escalabilidade do sistema, o Grfico 7.6 apresenta o


comportamento estimado da distribuio dos tempos totais para processar diretamente
distintos volumes de publicaes. A experimentao conduzida neste trabalho processou por
completo a base experimental composta por 34.010 publicaes em aproximadamente 1 hora
e 21 minutos.

Grfico 7.6. Tempo total, em minutos, para o processamento da base de dados experimental segmentado pelos
processos da arquitetura. Fonte: Plataforma SocialCol.

A introduo dos parmetros limitadores dMAX, tMAX e Cmin (apresentados na subseo


6.2.3) otimiza o desempenho do processamento e reduz consideravelmente o tempo de
execuo dos processos [EPC] Encontrar Publicaes Correlatas e [AGR] Agrupar em
Histrias, ao descartar comparaes irrelevantes (distantes geogrfica e temporalmente)
entre a publicao ingressante e cada uma das demais j tratadas e armazenadas.
Esta anlise no considera o tempo de processamento dos procedimentos para
deteco de conflitos ([ICO] Identificar Conflitos em Histria), uma vez que a plataforma
experimental executa o referido processo diretamente na aplicao (on-the-fly), no momento
em que as histrias so carregadas pelo analista da informao.

Trata-se de um

procedimento de varredura rpido e, da maneira como foi implementado, no interfere no


desempenho do ciclo de processamento.

173
Por fim, convm observar que este grfico apresenta estimativas baseadas no tempo
total contabilizado durante a experimentao conduzida. Porm, na prtica, o tempo mdio
real dispendido para o processamento de cada publicao ingressante varia em funo de
fatores como a quantidade de publicaes j armazenadas e as caractersticas de cada uma
das fontes de informaes agregadas ao sistema.

174

8 Propostas de Encaminhamento e Concluses


8.1 Concluses
A pesquisa exploratria pelo estado da arte revelou que as iniciativas e abordagens de
soluo vigentes operam apenas sobre conjuntos homogneos de fontes de informaes.
Contudo, nenhuma abordagem verificada props solues flexveis e adaptveis para fins de
integrao, estabelecimento de associaes e deteco de eventuais conflitos entre
informaes similares, independentemente de suas provenincias e estruturas de dados.
Motivado pela contnua proliferao dos meios de aquisio de dados ambientais,
que por sua vez abrem caminhos para o provimento de informaes teis atravs da
colaborao social, o objeto principal da contribuio deste trabalho buscou comprovar que,
mesmo apresentando distintas estruturas de dados, provenincias e circunstncias de
gerao, as informaes podem se relacionar, aumentar a compreenso do contexto
emergencial em que elas foram geradas e, consequentemente, apoiar a deciso dos gestores
da emergncia.
A Figura 8.1 apresenta duas publicaes agrupadas em uma mesma histria, aps o
processamento experimental.

Ao observ-las percebe-se que, mesmo provenientes de

distintas fontes de informaes e apresentando distintos conjuntos de atributos, ambas as


publicaes de fato se referem exatamente a um mesmo evento. O ndice de Correlao
entre estas publicaes alcanou seu valor mximo (1,0), o que atesta a efetividade da
heurstica elaborada para associar publicaes similares.

Figura 8.1. A similaridade entre duas publicaes agrupadas numa mesma histria pode ser notada a partir da
inspeo visual. O resultado atesta a efetividade da heurstica elaborada para a arquitetura

175
Publicaes provenientes da fonte de informao Flickr tambm evidenciaram um
comportamento particular que contriburam para atestar a eficcia dos procedimentos de
correlao. Trata-se de ocorrncias denominadas duplicidade similar, ou seja, casos onde
um mesmo indivduo submete publicaes contendo descrio e localizao idnticas, dentro
de um curto intervalo de tempo. Este comportamento comum na plataforma e se deve ao
simples fato de que cada publicao submetida pode anexar apenas uma imagem. Assim,
caso o usurio queira publicar mais de uma foto referente a um mesmo evento, precisar
criar uma publicao para cada imagem a ser submetida.
A Figura 8.2 retrata um registro de deteco desta situao, na qual um mesmo
usurio, dentro de um intervalo de aproximadamente um minuto publicou cinco imagens
relativas a um mesmo evento. Aps a experimentao, estas publicaes foram coletadas,
identificadas, correlacionadas e agrupadas em uma mesma histria. A correlao deste
agrupamento atingiu o grau mximo uma vez que a localidade de todas as publicaes
exatamente a mesma, o intervalo de tempo entre as publicaes muito pequeno e, o
contedo textual da publicao (considerado na classificao e clculo da dimenso
taxonmica) tambm exatamente o mesmo para todas as publicaes.

Figura 8.2. A deteco duplicidade similar evidencia um caso tpico ocorrido na rede social Flickr:
submisses sucessivas de um nico emissor retratam um mesmo evento

A ausncia das coordenadas em parte das publicaes processadas na experimentao


possibilitou outra constatao positiva. Esta deficincia de dados ocorrida nas bases
Sahana e Mission 4636 tornou-se til para a verificao da efetividade dos
procedimentos agregadores em condies no ideais. A ocorrncia de publicaes que no
apresentam a componente espacial em agrupamentos de histrias corrobora com a
proposio da independncia e no obrigatoriedade da presena de todos os trs atributos da
informao para o estabelecimento de relacionamentos.

176
Ainda acerca dos resultados da experimentao, caso os tratamentos em segundo
nvel para a busca das coordenadas propostos no processo [CFC] Compatibilizar Formato
de Coordenadas fossem implementados no prottipo, certamente a taxa de processamentos
bem sucedidos poderia ser consideravelmente elevada em relao ao resultado atual e,
consequentemente, mais correlaes poderiam ser estabelecidas a partir dos procedimentos
agregadores. Por medidas de prioridades e tambm por no se tratar do foco deste trabalho,
tal encaminhamento fora apenas previsto, porm, no desenvolvido no prottipo
experimental.
Com relao estrutura de armazenamento e recuperao da arquitetura, a construo
do prottipo experimental demonstrou que a adoo da estrutura de banco de dados
relacional foi suficientemente capaz de atender as demandas de armazenamento e
recuperao do fluxo de dados circulantes na arquitetura proposta. O Apndice F apresenta
o diagrama entidade-relacionamento do repositrio de coleta e processamento modelado para
o prottipo experimental da arquitetura.
Em vias conclusivas e apoiado pelos resultados da experimentao pode-se afirmar
comprovadamente que a abordagem de soluo proposta nesta Tese alcanou de forma
satisfatria suas metas inicialmente estipuladas.
8.2

Propostas de Encaminhamento
Alternativas e medidas para fins de elevao da frequncia de colaborao, aumento

da confiabilidade e validade da informao, e a elevao do grau de autonomia do sistema


podem aprimorar e incrementar a modelagem atual da arquitetura, conforme as propostas a
seguir.
Como alternativa para aumentar a aderncia das colaboraes de retorno s
requisies de feedback, possvel direcion-las levando-se em conta a reputao do
informante, seu tempo mdio de atividade diria, local e data de sua ltima publicao,
dentre outros indicadores que podero ajudar a identificar colaboradores possivelmente mais
eficientes. O estabelecimento de um ranking de colaborao tambm pode apoiar o analista
da informao no processo de seleo dos colaboradores mais ativos e confiveis para as
tarefas. Muitas abordagens neste sentido foram levantadas na pesquisa do estado da arte e
podem servir de base para tais melhorias.

177
Ainda no que tange a efetividade das requisies de feedbacks, polticas de
recompensas tambm podem ser estabelecidas em funo do ranking da efetividade e
participao do cidado quanto ao provimento da informao durante a resposta.

iniciativa adotada pela equipe vencedora do desafio Red Ballon Challenge (TANG et al.,
2011), por exemplo, garante uma poltica de premiao justa e proporcional ao grau de
colaborao do indivduo, alm de garantir que o oramento estipulado no seja extrapolado.
Para a resoluo de conflitos, regras de resoluo previamente definidas combinadas
a algoritmos de aprendizado de mquina podero ser aplicados para que decises sejam
tomadas sem a necessidade de interveno humana.
Mtodos automticos para identificao e extrao de valores de atributos
quantitativos em publicaes, traduo, geolocalizao tambm podem ser aplicados com a
finalidade de reduzir ainda mais a dependncia do processamento humano, aumentar a
autonomia do sistema e a eficincia de seus respectivos processos.
Para fins de simplificao e generalizao, a formulao elaborada para o
estabelecimento da correlao temporal introduziu o parmetro binrio [EVENTm,n]
(detalhado na subseo 6.2.3.1) para condicionar seus cmputos em funo dos distintos
perodos de validade temporal existentes entre eventos e entidades. Entretanto, a validade
temporal de uma informao pode ser modelada de maneira mais realista ao substituir a
representao generalista do parmetro binrio por outro, mais preciso, que quantifique o
intervalo de tempo de validade da referida informao. Tal medida contribuir para a
determinao da correlao entre duas instncias de informaes de forma mais precisa e
realista.
Tambm como prosseguimento do trabalho, em termos analticos acerca da eficincia
dos processos constituintes da arquitetura e suas vantagens em relao s demais iniciativas
de coleta e tratamento de informaes, sugere-se a elaborao de novas rodadas de
experimentaes que apliquem indicadores e mtricas de desempenho comparativas a estas
iniciativas afins. Desta maneira, ser possvel avaliar e medir de maneira mais efetiva e
objetiva, o ganho e a contribuio destes novos mtodos propostos em relao ao que j
existe no estado da arte.

178

Referncias Bibliogrficas
AGGARWAL, C. C.; ZHAI, C. A Survey of Text Clustering Algorithms. In: C. C.
Aggarwal; C. Zhai (Orgs.); Mining Text Data. p.77128, 2012.
AHN, L. VON; DABBISH, L. Labeling images with a computer game. ACM Conference
on Human Factors in Computing Systems. v. 6, p.319 326, 2004.
AQUAWARE: Um Ambiente de Suporte Qualidade de Dados em Data Warehouse,
Dissertao de Mestrado, Universidade Federal do Rio de Janeiro, 165p, 2003.
ANNUNZIATA, G.; OCKWELL, R. (ORGS.). Managing WHO Humanitarian Response
in the Field. Geneva, Switzerland: World Health Organization Press, 2008.
BARANAUSKAS, J. A.; MONARD;, M. C. Conceitos sobre Aprendizado de Mquina.
In: S. O. Rezende (Org.); Sistemas Inteligentes - Fundamentos e Aplicaes. 1o ed., p.89
114, 2003.
BARRT, A.; BARTHLEMY, M.; VESPIGNANI, A. Dynamical Processes on Complex
Networks. Journal of Statistical Physics, v. 135, n. 4, p. 773774, 2009.
BEAUMONT, C. Mumbai attacks: Twitter and Flickr used to break news. The
Telegraph, 27. nov. 2008.
BEM-PARAN. Equipe da UFPR embarca para o Haiti no domingo. Disponvel em:
<http://www.bemparana.com.br/noticia/135406/equipe-da-ufpr-embarca-para-o-haiti-nodomingo>. Acesso em: 6/6/2014.
BENBYA, H.; MCKELVEY, B. Toward a complexity theory of information systems
development. Information Technology & People, v. 19, n. 1, p. 1234, 2006.
BLEI, D. M.; NG, A. Y.; JORDAN, M. I. Latent Dirichlet Allocation. Journal of
Machine Learning Research, v. 3, p. 9931022, 2003.
BOMAN, J.; TAYLOR, J.; NGU, A. Flexible IoT Middleware for Integration of Things
and Applications. Proceedings of the 10th IEEE International Conference on Collaborative
Computing: Networking, Applications and Worksharing. p.481 488, 2014.
BOULOS, M. N. K.; WHEELER, S.; TAVARES, C.; JONES, R. How smartphones are
changing the face of mobile and participatory healthcare: an overview, with example
from eCAALYX. Biomedical engineering online, v. 10, p. 24, 2011.
CAMERON, M. A.; POWER, R.; ROBINSON, B.; YIN, J. Emergency situation
awareness from twitter for crisis management. Proceedings of the 21st international
conference companion on World Wide Web - WWW 12 Companion. p.695, 2012.
CARAGEA, C.; MCNEESE, N.; JAISWAL, A.; TRAYLOR, G.; KIM, H.; MITRA, P.;
WU, D.; TAPIA, A. H.; GILES, L.; JANSEN, B. J.; YEN, J. Classifying Text Messages for

179
the Haiti Earthquake. Proceedings of the 8th International Conference on Information
Systems for Crisis Response and Management, 2011.
CHARIKAR, M. S. Similarity estimation techniques from rounding algorithms.
Proceedings of the thiry-fourth annual ACM symposium on Theory of computing - STOC
02. p.380, 2002.
CHOWDHURY, S. R.; IMRAN, M.; CASTILLO, C. Tweet4act: Using Incident-Specific
Profiles for Classifying Crisis-Related Messages. Proceedings of the 10th International
Conference on Information Systems for Crisis Response and Management (ISCRAM). p.1
5, 2013.
COOPER, S.; KHATIB, F.; TREUILLE, A.; BARBERO, J.; LEE, J.; BEENEN, M.;
LEAVER-FAY, A.; BAKER, D.; POPOVI, Z.; PLAYERS, F. Predicting protein
structures with a multiplayer online game. Nature, v. 466, n. 7307, p. 75660, 2010.
aDApTA: Adaptive Approach for Information Integration to Support Decision Making
in Complex Environments, Universidade Federal do Rio de Janeiro, 129p, 2015.
CORDEIRO, K. DE F.; MARINO, T. B.; CAMPOS, M. L. M.; BORGES, M. R. S. Use of
Linked Data in the design of information infrastructure for collaborative emergency
management system. Proceedings of the 2011 15th International Conference on Computer
Supported Cooperative Work in Design (CSCWD). p.764771, 2011.
COSKUN, E.; OZCEYLAN, D. Complexity in Emergency Management and Disaster
Response Information Systems (EMDRIS). Proceedings of the International Conference at
Information System for Crisis Response and Management, 2011.
DAVID, J. M. Z.; MACIEL, R. S. P. Middleware para sistemas colaborativos. In: M.
PIMENTEL; H. FUKS (Orgs.); Sistemas Colaborativos. 1a Edio ed., p.416, 2011.
DIAZ, F.; METZLER, D.; AMER-YAHIA, S. Relevance and ranking in online dating
systems. Proceedings of the 33rd international ACM SIGIR conference on Research and
development in information retrieval - SIGIR 10. p.66, 2010.
DINIZ, V. B.; BORGES, M. R. S.; GOMES, J. O.; CANS, J. H. Knowledge management
support for collaborative emergency response. Proceedings of the 9th International
Conference on Computer Supported Cooperative Work in Design. p.11881193, 2005.
DISQUE-DENNCIA. Disque Denncia - Nmeros. Disponvel em:
<http://www.disquedenuncia.org.br/numeros.php>. Acesso em: 1/6/2014.
DRANSCH, D.; POSER, K.; FOHRINGER, J.; LUCAS, C. Volunteered Geographic
Information for Disaster Management. Citizen E-Participation in Urban Governance.
p.98118, 2013.
ENEH JOY NNENNA, O. H. O. Mobile Positioning Techniques in GSM Cellular
Networks: A Comparative Performance Analysis. International Journal of Computer
Technology and Electronics Engineering, v. 2, n. 6, p. 2129, 2012.

180
ESRI. Emergency/Disaster Management. Disponvel em:
<http://www.esri.com/industries/public-safety/emergency-disaster-management>. Acesso
em: 21/8/2013.
FERREIRA, A. B. H. Dicionrio Aurlio Eletrnico. Disponvel em:
<http://www.dicionariodoaurelio.com/>. Acesso em: 6/6/2015.
Architectural Styles and the Design of Network-based Software Architectures, Tese de
Doutorado, University of California, 2000.
No-Extensividade Termodinmica, Invarincia Discreta de Escala e ElastoPlasticidade: Estudo Numrico de um Modelo Geomecnico Auto-Organizado
Criticamente, Pontifcia Universidade Catlica do Rio de Janeiro, 189p, 2003a.
No-extensividade termodinmica, invarincia discreta de escala e elasto-plasticidade:
estudo numrico de um modelo geomecnico auto-organizado criticamente, Pontifcia
Universidade Catlica do Rio Janeiro, 2003b.
FILIPPO, D.; FILHO, J. V.; ENDLER, M.; FUKS, H. Mobilidade e ubiquidade para
colaborao. In: H. PIMENTEL, M.; FUKS (Org.); Sistemas Colaborativos. 1a Edio ed.,
p.416, 2011.
FININ, T.; MURNANE, W.; KARANDIKAR, A.; KELLER, N.; MARTINEAU, J.;
DREDZE, M. Annotating Named Entities in Twitter Data with Crowdsourcing. In: C.
Callison-Burch; M. Dredze (Orgs.); . v. 2010, p.8088, 2010.
FITZGERALD, M. IAPA: Two Months On, Haitian Press Still Devastated by
Earthquake. Disponvel em:
<www.editorandpublisher.com/eandp/news/article_display.jsp?vnu_content_id=1004078550
>. .
GEOSMS. Open GeoSMS for Emergency and Disaster Management. Disponvel em:
<http://code.google.com/p/ogssdk/downloads/detail?name=Open+GeoSMS+for+EDM.pdf>. Acesso em: 24/2/2013.
GO, A.; BHAYANI, R.; HUANG, L. Twitter Sentiment Classification using Distant
Supervision. , p. 16, 2009.
GOOGLE. Nosso Planeta Mobile: Brasil - Como entender o usurio de celular.
Disponvel em: <www.ourmobileplanet.com>. Acesso em: 1/6/2012.
GOUVEIA, C.; FONSECA, A. New approaches to environmental monitoring: the use of
ICT to explore volunteered geographic information. GeoJournal, v. 72, n. 3-4, p. 185
197, 2008.
GOUVEIA, C.; FONSECA, A. New approaches to environmental monitoring: the use of
ICT to explore volunteered geographic information. GeoJournal, v. 72, n. 3-4, p. 185
197, 2008.

181
GRONEWOLD, N. Devastated Haiti Braces for an Active Hurricane Season. New York
Times, 12. jul. 2010.
HART, G. The five Ws: An old tool for the new task of audience analysis. Technical
Communication, v. 43, n. 2, p. 139145, 1996.
HEINZELMAN, J.; WATERS, C. Crowdsourcing Crisis Information in DisasterAffected Haiti. Washington, D.C, USA, 2010.
HEINZELMAN, J.; WATERS, C. Crowdsourcing Crisis Information in Disaster-.
Washington, DC, 2010.
HERAVI, B. R.; BORAN, M.; BRESLIN, J. G. Towards Social Semantic Journalism.
Sixth International AAAI Conference on Weblogs and Social Media, 2012.
HERAVI, B. R.; MCGINNIS, J. A Framework for Social Semantic Journalism. First
International IFIP Working Conference on Value-Driven Social & Semantic Collective
Intelligence (VaSCo), at ACM Web Science 2013.
HEYLIGHEN, F. Building a Science of Complexity. Annual Conference of the Cybernetic
Society, 1988.
HOLLAND, J. H. Complex Adaptive Systems: A Primer. Disponvel em:
<http://www.santafe.edu/media/bulletin_articles/summer_fall1987v2n1.pdf>. Acesso em:
17/7/2012.
HOWARD, B. C. Scanning Social Media to Improve Typhoon Haiyan Relief Efforts. , p.
1114, 2013.
HUGHES, A. L.; PALEN, L. Twitter adoption and use in mass convergence and
emergency events. International Journal of Emergency Management, v. 6, n. 3/4, p.
248, 2009.
ITAIPU. Situao no Haiti pode piorar. Disponvel em:
<http://jie.itaipu.gov.br/node/42611>. Acesso em: 6/6/2014.
KAMEL BOULOS, M. N.; RESCH, B.; CROWLEY, D. N.; BRESLIN, J. G.; SOHN, G.;
BURTNER, R.; PIKE, W. A; JEZIERSKI, E.; CHUANG, K.-Y. S. Crowdsourcing, citizen
sensing and sensor web technologies for public and environmental health surveillance
and crisis management: trends, OGC standards and application examples.
International journal of health geographics, v. 10, p. 67, 2011.
KAUFMANN, N.; VEIT, D. More than fun and money . Worker Motivation in
Crowdsourcing A Study on Mechanical Turk Crowdsourcing A Study on
Mechanical Turk. AMCIS 2011 Proceedings, 2011.
KIRA, K.; RENDELL, L. A. The feature selection problem: traditional methods and a
new algorithm. Proceedings of the tenth national conference on Artificial intelligence.
p.129134, 1992.

182
KUZNETSOV, S. Motivations of contributors to Wikipedia. ACM SIGCAS Computers
and Society, v. 36, n. 2, p. 17, 2006.
LEITE, M. S.; REINISCH, A. C. C. S.; BORNIA, A. C. A Cadeia de Suprimento vista
como um Sistema Adaptativo Complexo (SAC): convivncia dialgica de conceitos.
XXIII Encontro Nacional de Engenharia de Produo, 2003.
LINDEL, M. K.; PRATER, C.; PERRY, R. W. Introduction to Emergency Management.
John Wiley & Sons, 2006.
MARINO, T. B.; NASCIMENTO, B. S. DO; BORGES, M. R. S. GIS Supporting Data
Gathering and Fast Decision Making in Emergencies Situations. Proceedings of the 9th
International ISCRAM Conference. p.16, 2012.
MARIOTTI, H. Pensamento Complexo: Suas Aplicaes Liderana, Aprendizagem
e ao Desenvolvimento Sustentvel. 2a Ediao ed.So Paulo, Brasil: Atlas, 2010.
MAZUMDAR, S.; LANFRANCHI, V.; CANO, A. E. Visualising Topical Sentiment and
Influence in Social Media. Proceedings of Social Media and Linked Data for Emergency
Response (SMILE) Workshop. Extended Semantic Web Conference, ESWC 2013. p.112,
2013.
MCCALLUM, A.; NIGAM, K. A Comparison of Event Models for Naive Bayes Text
Classification. AAAI-98 Workshop on Learning for Text Categorization. p.4148, 1998.
MILLER, J. H.; PAGE, S. E. Complex Adaptative Systems: An introduction to
Computational Models of Social Life. Princeton University Press, 2007.
MIRANDA, R. C. R. O uso da informao na formulao de aes estratgicas pelas
empresas. Cincia da Informao, v. 28, n. 3, p. 284290, 1999.
MITCHELL, M. Complexity: The Emerging Science At The Edge Of Order And Chaos.
USA: Touchstone Books, 1992.
MITCHELL, M. Complexity: A Guided Tour. USA: Oxford University Press, 2009.
MORIN, E. Introduo ao Pensamento Complexo. 3a Edio ed.Porto Alegre, Brasil:
Sulina, 2007.
MUNRO, R. Crowdsourcing and the crisis-affected community. Information Retrieval,
v. 16, n. 2, p. 210266, 2013.
NONAKA, I.; TAKEUCHI, H. Criao do Conhecimento na Empresa: como as
empresas geram a dinmica da inovao. Rio de Janeiro, Brasil: Campus, 2007.
OCHA. How are disaster relief efforts organised? Cluster Approach. Disponvel em:
<http://business.un.org/en/assets/39c87a78-fec9-402e-a434-2c355f24e4f4.pdf>. Acesso em:
11/12/2012.

183
OLTEANU, A.; CASTILLO, C.; DIAZ, F.; VIEWEG, S. CrisisLex: A Lexicon for
Collecting and Filtering Microblogged Communications in Crises. In: A. Arbor (Org.);
Proceedings of the AAAI Conference on Weblogs and Social Media (ICWSM14), 2014.
PALAZZO, L. A. M. Complexidade, caos e auto-organizao. Oficina de Inteligncia
Artificial III, Anais. p.4967, 1999.
PASSANT, A.; BRESLIN, J. G.; DECKER, S. Open, distributed and semantic
microblogging with SMOB. Lecture Notes in Computer Science (including subseries
Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). v. 6189 LNCS,
p.494497, 2010.
PASSONNEAU, R. Sentiment Analysis of Twitter Data. Proceeding LSM 11
Proceedings of the Workshop on Languages in Social Media. p.3038, 2011.
Avaliao da Qualidade de Dados pela No Conformidade, Universidade Federal do Rio
de Janeiro, 110p, 2001.
Modelagem primria da temperatura do ar em uma floresta de transio Amazniacerrado no norte de Mato Grosso, Universidade Federal de Mato Grosso, 2011.
PUROHIT, H.; CASTILLO, C.; DIAZ, F.; SHETH, A.; MEIER, P. Emergency-relief
coordination on social media: Automatically matching resource requests and offers.
First Monday, v. 19, n. 1, p. 142, 2013.
R. SABRA JAFARZADEH, J. Emergency management 2.0: Integrating social media in
emergency communications. The New England journal of medicine, v. 9, n. 1, p. 1318,
2011.
REISSWITZ, F. Anlise De Sistemas. Rio de Janeiro, Brasil: Clube de Autores, 2009.
REUTER, C.; MARX, A.; PIPEK, V. Social Software as an Infrastructure for Crisis
Management - a Case Study About Current Practice and Potential Usage. Proceedings
of the 8th International ISCRAM Conference, 2011.
ROGSTADIUS, J.; KOSTAKOS, V. Towards Real-time Emergency Response using
Crowd Supported Analysis of Social Media. Computational Linguistics, 2011.
ROGSTADIUS, J.; KOSTAKOS, V.; KITTUR, A.; SMUS, B.; LAREDO, J.; VUKOVIC,
M. An Assessment of Intrinsic and Extrinsic Motivation on Task Performance in
Crowdsourcing Markets. , , n. Gibbons 1997, p. 321328, 2000.
AgileOOHDM, Pontifcia Universidade Catlica do Rio de Janeiro, 78p, 2004.
SCHLKOPF, B.; SMOLA, A. J.; WILLIAMSON, R. C.; BARTLETT, P. L. New Support
Vector Algorithms. Neural Computation, v. 12, n. 5, p. 12071245, 2000.
SHETH, A. Citizen Sensing, Social Signals, and Enriching Human Experience. IEEE
Internet Computing, v. 13, n. 4, p. 8792, 2009.

184
SILVESCU, A.; CARAGEA, C.; HONAVAR, V. Combining Super-Structuring and
Abstraction on Sequence Classification. 2009 Ninth IEEE International Conference on
Data Mining. p.986991, 2009.
SIMON, H. A. The Architecture of Complexity. The American Philosophical Society.
Disponvel em: <http://www.jstor.org/stable/985254>. Acesso em: 17/5/2012.
SINGH, P.; PARK, I.; LEE, J. Information Sharing: A Study of Information Attributes
and their Relative Significance During Catastrophic Events. In: K. J. Knapp (Org.);
Cyber Security and Global Information Assurance. p.283305, 2009.
SMUTS, J. C. Holism and evolution. New York, USA: The Gestalt Journal Press, 1996.
SOS. 112 in Sweden: The 2008 Annual Activity Report. Stockholm, Sweden, 2008.
SPRING, A.; ROGSTADIUS, J.; VUKOVIC, M.; TEIXEIRA, C. A.; KOSTAKOS, V.;
KARAPANOS, E.; LAREDO, J. A. CrisisTracker: Crowdsourced social media curation
for disaster awareness. IBM Journal of Research and Development, v. 57, n. 5, p. 4:1
4:13, 2013.
STVILIA, B.; TWIDALE, M. B.; SMITH, L. C.; GASSER, L. Information quality work
organization in wikipedia. Journal of the American Society for Information Science
and Technology, v. 59, n. 6, p. 9831001, 2008.
TANG, J. C.; CEBRIAN, M.; GIACOBE, N. A.; KIM, H.-W.; KIM, T.; WICKERT, D.
BEAKER. Reflecting on the DARPA Red Balloon Challenge. Communications of the
ACM, v. 54, n. 4, p. 78, 2011.
TSUR, O.; LITTMAN, A.; RAPPOPORT, A. Efficient Clustering of Short Messages into
General Domains. Seventh International AAAI Conference on Weblogs and Social Media.
p.10, 2013.
USHAHIDI. Data Science for Social Good and Ushahidi. Summer Fellowship 2013:
Ushahidi, 2013.
VIEIRA, C. L. Sistemas Complexos: A fronteira entre a ordem e o caos. Rio de Janeiro,
Brasil, 2005.
VIVACQUA, A. S.; GARCIA, A. C. B. Ontologia de colaborao. In: M. Pimentel; H.
Fuks (Orgs.); Sistemas Colaborativos2. 1a Ediao ed., p.416, 2011.
VOSS, J. Tagging, Folksonomy & Co - Renaissance of Manual Indexing?. 10th
international Symposium for Information Science. p.12, 2007.
VUKOVIC, M. Crowdsourcing for Enterprises. 2009 Congress on Services - I. p.686
692, 2009.
WALDROP, M. Complexity: The Emerging Science at the Edge of Order and Chaos.
Simon & Schuster, 1992.

185
WEISER, M. Computer for the twenty-first century. Scientific American, v. 265, n. 3, p.
94104, 1991.
XAVIER-DA-SILVA, J. O que Geoprocessamento?. Revista do CREA-RJ No 79, p.
4244, 2009.
XAVIER-DA-SILVA, J.; MARINO, T. B. Citizenship through data sharing in the
Amazon region. Proceedings of the 2nd International Conference on Computing for
Geospatial Research & Applications - COM.Geo 11. p.15, 2011.

186

Apndices
Apndice A Requisitos bsicos para a elaborao de bibliotecas de comunicao para
as fontes de informaes colaborativas
1. Ser uma classe PHP. Ex.: class Twitter { ... }
2. Conter a funo: Public Function getMessages($strKeywords = '',
$strFromDateTime = '', $strToDateTime = '', $dblLatitude = '', $dblLongitude = '',
$dblRadiusKm = '') { return <results> }
2.1. Parmetros da funo:

$strKeywords: restringe os resultados da busca a palavras-chave especficas,


separadas pelo caractere vrgula (,).
Exemplo: haiti,earthquake,port au prince,port prince,tremblant

$strFromDateTime: determina que o conjunto de publicaes retornado deve


conter somente registros criados a partir da data estabelecida pelo parmetro.
Formato: YYYY-MM-DD HH:MM:SS | Exemplo: 2010-01-12 16:43:00

$strToDateTime: determina que o conjunto de publicaes retornado deve


conter somente registros criados at da data estabelecida pelo parmetro.
Formato: YYYY-MM-DD HH:MM:SS | Exemplo: 2010-03-30 23:59:59

$dblLatitude: coordenada latitude referente ao ponto central de referncia da


filtragem espacial dos resultados.
Formato: DD.DDDDDD (grau decimal) | Exemplo: -21.1223456

$dblLongitude: coordenada longitude referente ao ponto central de referncia


da filtragem espacial dos resultados.
Formato: DD.DDDDDD (grau decimal) | Exemplo: -21.1223456

$dblRadiusKm: determina que o conjunto de publicaes retornado deve conter


somente registros criados a partir da data estabelecida em tal parmetro.
Formato: Decimal | Exemplo: 0.7

2.2. O retorno XML deve conter as tags <results> para identificar o incio do conjunto
de publicaes e <post> para identificar cada publicao capturada.
3. Funo: public function postMessage($idUser, $strMessage) {} NO OBRIGATRIA
3.1. Parmetros da funo:

$strID: identificador nico do usurio da fonte de informao.

$txtMessage: mensagem a ser enviada ao usurio.

187
Apndice B Exemplo de cdigo PHP do script para coleta de publicaes da rede
social Facebook atravs do processo [COL] Coletar Publicaes
<?php
class Facebook {
private $accountUserEmail
private $accountUserPassword
private $appID
private $appSecret

=
=
=
=

"colaboracaosocial@gmail.com";
"Colabora2.0";
"476440689114027";
"51ecf8812cd5e5bf42132fcc9e84c0f3";

public function postMessage($strID, $txtMessage) {


// Send email to user $strID@@facebook.com
$txtMessage = utf8_decode($txtMessage);
$strTo = $strID . '@facebook.com';
$txtMessage = $strSubject . ' ++++++++++<br>' . $txtMessage;
$blnResult = @mail($strTo, SOCIALCOL: FEEDBACK,$txtMessage);
return $blnResult;
}
public function getMessages($strKeywords, $strFromDateTime='',
$strToDateTime='',$strLatitude='',$strLongitude='',$strRadiusKm='') {
$arrResult = array();
/* Setting filters */
$arrKeywords = array();
if ($strKeywords) {
$arrKeywords = explode(',', utf8_encode($strKeywords));
}
// Parameters
$arrFilterParams = array();
if($strFromDateTime)$arrFilterParams[]='&since='.$strFromDateTime;
if($strToDateTime) $arrFilterParams[]='&until='.$strToDateTime);
if($strLatitude)
$arrFilterParams[]='&center='.$strLatitude.','.$strLongitude;
if($strRadiusKm)$arrFilterParams[]='&distance='.$strRadiusKm*1000;
$arrFilterParams[] = '&limit=100';
// First getting a access token
$strToken = $this->getAccessToken();
foreach ($arrKeywords as $strKeyword) {
$strKeyword = str_replace(' ', '+', $strKeyword);
$strUrlRequest =
'https://graph.facebook.com/search?type=post&access_token=' .
$strToken . '&q='.$strKeyword . implode('',$arrFilterParams);
$data = $this->strings->processUrl($strUrlRequest);
$json = $this->strings->objectify('json', $data);
// Loop for each result
foreach($json->{"data"} as $entry) {
$arrResult['post'][] = $entry;
}
}
$strXML = $this->strings->strArrayToXML($arrResult);
return $strXML;
}
}
?>

188
Apndice C Vocabulrio de referncia organizado para a associao de atributos comuns e anotao das publicaes tratadas
Termo do Vocabulrio
Post.strPrimaryKey

Tipo
Chave-

Definio Original do Termo

URI

Information source primary key atribute. Ex.: 1421343253

Primria
Post.What.strAttachedFileURL

Texto

The

URI

of

file

attached

to

an

Item.Ex.: http://rdfs.org/sioc/ns#attachment

http://www.flickr.com/f3240f123.jpg
Post.What.strLanguage

Texto

The set of tags, constructed according to RFC 1766, for the http://purl.org/dc/terms/RFC1766
identification of languages.Ex.: en-us

Post.What.strMessage

Texto

The content of the Item in plain text format.Ex.: Just seen a http://rdfs.org/sioc/ns#content
house in fire at city center

Post.What.strMessageOriginal

Texto

The content of the Item in plain text format, under original http://rdfs.org/sioc/ns#content
language.Ex.: Acabo de ver uma residncia pegando fogo no
centro

Post.What.strTags

Texto

The topic of the resource. Typically, the subject will be http://purl.org/dc/terms/#subject


represented using keywords, key phrases, or classification
codes. Recommended best practice is to use a controlled
vocabulary.Ex.: Request for Food

Post.When.dtPosted

Data/Hora

The date and time of the last activity associated with a SIOC http://purl.org/dc/terms/#created

189
concept instance, and expressed in ISO 8601 format. This could
be due to a reply Post or Comment, a modification to an Item,
etc. Ex.: 2014-08-27T18:50Z
Post.Where.dblLatitude

Numrico

The WGS84 latitude of a SpatialThing (decimal degrees).Ex.: - http://www.w3.org/2003/01/geo/


21.1223456

Post.Where.dblLongitude

Numrico

wgs84_pos#lat

The WGS84 longitude of a SpatialThing (decimal degrees).Ex.: http://www.w3.org/2003/01/geo/


-43.3354312

Post.Where.PlaceName

Texto

The

location

wgs84_pos#long
of

the

thing.

More

info: http://dbpedia.org/resource/classes

http://dbpedia.org/ontology/locationEx.: Copacabana - Rio de #Place


Janeiro - Brasil
Post.Who.From.strID

Texto

Refers to the foaf:Agent or foaf:Person who owns this http://rdfs.org/sioc/ns#account_of


sioc:UserAccount.Ex.: 34129011234523

190
Apndice D Especificao da Ontologia SocialCol para Anotao de Publicaes
Correlatas
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:sioc="http://rdfs.org/sioc/ns#"
xmlns:scol="http://greco.ppgi.ufrj.br/socialcol/ontology/"
>
<owl:Ontology rdf:about="http://greco.ppgi.ufrj.br/socialcol/ontology/"
rdf:type="http://www.w3.org/2002/07/owl#Thing">
<dcterms:title xml:lang="en">SocialCol Ontology Namespace</dcterms:title>
<owl:versionInfo>Revision: 1.0</owl:versionInfo>
<dcterms:description xml:lang="en">SocialCol (Social Collaboration) is an ontology for describing
the spatial, temporal and taxonomic correlations between posts originated from heterogeneous
information sources(sensors, social media, SMS, e-mails).</dcterms:description>
<rdfs:seeAlso rdf:resource="http://greco.ppgi.ufrj.br/socialcol/spec" rdfs:label="SocialCol
Ontology Specification"/>
</owl:Ontology>
<owl:ObjectProperty>
<rdfs:label xml:lang="en">isSpatialCorrelatedTo</rdfs:label>
<rdfs:comment xml:lang="en">Specifies that this Post is correlated to another Post due to their
spatial proximity.</rdfs:comment>
<rdfs:domain rdf:resource="http://rdfs.org/sioc/ns#Post"/>
</owl:ObjectProperty>
<owl:ObjectProperty>
<rdfs:label xml:lang="en">isTimeCorrelatedTo</rdfs:label>
<rdfs:comment xml:lang="en">Specifies the temporal correlation between two posts due to the
short time interval between their publications.</rdfs:comment>
<rdfs:domain rdf:resource="http://rdfs.org/sioc/ns#Post"/>
</owl:ObjectProperty>
<owl:ObjectProperty>
<rdfs:label xml:lang="en">isTaxonomicCorrelatedTo</rdfs:label>
<rdfs:comment xml:lang="en">Specifies the taxonomic correlation between two Posts once there
were found common subjects between their contents.</rdfs:comment>
<rdfs:domain rdf:resource="http://rdfs.org/sioc/ns#Post"/>
</owl:ObjectProperty>
</rdf:RDF>

191
Apndice E Histrico de contatos por e-mail para a solicitao das bases de dados
1. Organizao Mission 4636
Tiago Marino (tiagomarino@ufrj.br)
segunda-feira, 18 de novembro de 2013 17:56:50
info@mission4636.org (info@mission4636.org)
Marino, Nascimento, Borges - 2012 - GIS Supporting Data Gathering and
Fast Decision Making in Emergencies Situations.pdf (557,2 KB)
, Curriculum System of Curriculum Lattes (Tiago Badre
Marino).pdf (278,0 KB) , Architecture for Selection, Processing and
Sharing Collaborative Information for Decision Support in Emergency
Situationsv2.pdf (815,0 KB)
My name is Tiago Marino. I'm a PhD student in computer science post-graduate
program at the Federal University of Rio de Janeiro (Brazil).
By over 10 years I've also been volunteering with CENACID http://www.cenacid.ufpr.br/ a UNDAC partner, coordinated by an UNDAC team expert
(prof. Renato Lima). During this time I had the opportunity to support dozens of
disaster's response missions occurred in Brazil and America Latina (including 2010
Haiti Earthquake).
My main role inside the group is related to field assessments information management,
generated during our missions. I'm responsible to organize it and provide updated
maps, situation reports, and so on....
At Geoprocessing Laboratory, I developed a GIS which handles and organizes these
kind of information (details in paper attached to this message).
So that's a small briefing about myself and my interests.
Currently I'm in the 3rd year of my PhD, in a internship at DERI/Galway, at Social
Software Group (leaded by John Breslin) (http://www.deri.ie/uss) and my focus evolves
Collaborative Information for Decision Support During Emergency Responses.
My experiment works over automated procedure for posts translation, classification,
location, grouping considering different information sources such as social networks,
phone calls, sms, email, sensor, data gathered from field agents, social collaboration,
etc.
For my experimentation I've already collected a couple of datasets related to 2010 Haiti
earthquake disaster.
The point is that if I could have any dataset related to 2010 Haiti disaster, it could be
very helpful for my experiment tests.
As I plan to evaluate my techniques under different communication channels it would
be useful if I could have a SMS/Twitter datasets.
Please, if you need more information about my research, it will be a pleasure to share it
with you.
Take this opportunity to congratulate you for the wonderful work and service to
humanity causes.
All the best
Tiago Marino
De:
Enviada:
Para:
Anexos:

192

info@mission4636.org (info@mission4636.org)
De:
domingo, 24 de novembro de 2013 00:31:05
Enviada:
tiagomarino@ufrj.br
Para:
mission_4636_anonymized_v2.tsv (7,5 MB)
Anexos:
Thank you, Tiago
The messages are attached as tab-separated columns.
Here is a definition of the fields:
id: unique id number for the message
date_received: the date the message was received by Mission 4636
message: the actual 4636 message
translation: the translation and notes
sender_phone_anon: the phone number (anonymized but consistent)
primary_category: the main category given to the message
latitude: latitude of the reported location
longitude: longitude of the reported location
city: the name of the city
dept: the name of the department
missing_person_status: the missing person status
date_last_modified: the time that the message was finalized and sent to responders
time_to_process: the time taken to process the message
all_categories: the full set of categories
actionable: whether of not the message was 'actionable' (partial)
ushahidi_date_added: the date the message was published in the Ushahidi Crisis Map
ushahidi_time_to_process: the time taken for the message to be added to the
Ushahidi@Tufts Crisis Map
workforce: the workforce: Mission 4636 volunteers, or paid workers within Haiti
While the messages have been anonymized, there may still contain some personally
identifying information, so please follow the guidelines at:
http://www.mission4636.org/access-to-data/
When referring to this data in your research, please cite the following paper:
Munro, Robert, 2013. Crowdsourcing and Crisis Affected Community.
Journal of Information Retrieval, 16(2), Springer
Robert was a member of Mission 4636 and the only person who interviewed us Haitians
when writing the report. If you haven't already, you can also reach out to him directly:
robert.munro@gmail.com
We wish you the best with your research!
The Mission 4636 coordinators

193
2. Organizao Sahana Foundation
Tiago Marino (tiagomarino@ufrj.br)
segunda-feira, 18 de agosto de 2014 21:51:13
Michael Howden (michael@sahanafoundation.org)
Marino, Nascimento, Borges - 2012 - GIS Supporting Data Gathering and
Fast Decision Making in Emergencies Situations.pdf (557,2 KB)
, Curriculum System of Curriculum Lattes (Tiago Badre
Marino).pdf (278,0 KB) , Architecture for Selection, Processing and
Sharing Collaborative Information for Decision Support in Emergency
Situationsv2.pdf (815,0 KB)
Dear colleague Michael,
My name is Tiago Marino. I'm a PhD student in computer science post-graduate
program at the Federal University of Rio de Janeiro (Brazil).
By over 10 years I've also been collaborating as volunteer with the CENACID http://www.cenacid.ufpr.br/ a UNDAC partner, coordinated by an UNDAC team expert
(prof. Renato Lima). During this time I had the opportunity to support dozens of
disaster's response missions occurred in Brazil and America Latina (including 2010
Haiti Earthquake).
My main role inside the group is related to field assessments information management,
generated during our missions. I'm responsible to organize it and provide updated
maps, situation reports, and so on....
At Geoprocessing Laboratory, I developed a GIS which handles and organizes this kind
of information (details in paper attached to this message).
So that's a small briefing about myself and my interests.
Currently I'm in the 4th year of my PhD and my focus evolves Collaborative
Information for Decision Support During Emergency Responses.
My experiment works over automated procedure for posts translation, classification,
location, grouping considering different information sources such as social networks,
phone calls, sms, email, sensor, data gathered from field agents, social collaboration,
etc..
For my experimentation I've already collected a couple of datasets related to 2010 Haiti
earthquake disaster.
By reading about your contribution at http://sahanafoundation.org/products/eden/, I've
noticed that you built a valuable dataset regarding 2010 Haiti disaster.
So I was wondering if you could share this dataset with me. I ensure you that's just for
research purpose. I won't expose any private content and compromise to credit your
institution in my work and any publication originated from this work.
I've got your e-mail from a PhD mate, Kelli Faria, which already contacted you before
in order to request data for her thesis research as well.
We are part of a workgroup which inspects topics related to information and crisis
situations.
By the way, regarding Kelli's previous request, she stated me that she tried to contact
the person responsible for the Philippines disaster dataset - Mr. Sandy - but she still
couldn't have access to the data she requested.
When I told her that I was about to write to you, she kindly asked me if I could state this
De:
Enviada:
Para:
Anexos:

194
issue (her fail to get the data by contacting him) to you.
Please, if you need more information about my research, it will be a pleasure to share it
with you.
Take this opportunity to congratulate you for the wonderful work and service to
humanity causes.
All the best
Tiago Marino

Michael Howden (michael@sahanafoundation.org)


De:
tera-feira, 19 de agosto de 2014 01:01:04
Enviada:
Tiago Marino (tiagomarino@ufrj.br)
Para:
Mark & Fran - Do either of you know if there is a backup of the Haiti data anywhere?
Or the Sandy Relief? Any issues you can see with sharing this information?
Tiago - I'm new in the role, some hopefully Mark or Fran will be able to shed some light
on this! I would be really interested in see the output of any of your research.
Have
you
had
a
look
at
our
other
deployments:
http://eden.sahanafoundation.org/wiki/Deployments?
Perhaps the Timor-Leste Disaster Risk Management Information System (http://drm.tl/)
- you should be able to extract much of that information - but I may be able to help put
you in touch with some of the users.
I would suggest that Kelli tries following up again with Sandy. I would also suggest that
perhaps she determine exactly what information she wants. A DB dump is a big ask perhaps a few exports would be a lot easier to get permission to provide! I will discuss
this with Sandy if I get a chance to talk to him.
I would also be interested if there was any potential to form any sort of partnership with
your group? Through Sahana we are able to collect a large amount of data about
disasters which could be valuable to you. Your research and analysis of this data could
help to deliver more value to the organizations using Sahana. Let me know if this is
something you're interested in and would like to discuss further.
Cheers
Michael Howden - CEO, Sahana Software Foundation

Fran Boon (fran@sahanafoundation.org)


De:
tera-feira, 19 de agosto de 2014 13:48:33
Enviada:
Tiago Marino (tiagomarino@ufrj.br)
Para:
rms_req.7z
Anexos:
A copy of that table from our DB is attached. It certainly has some of the Tweak the
Tweet data....I'm not sure if this also has 4636 data mixed-in (I know I have that
separately too)
You might be able to get a better dataset from the original person:
http://faculty.washington.edu/kstarbi/ project: http://epic.cs.colorado.edu/?page_id=11
The server is offline...we have no funds to keep old sites alive indefinitely.
Best Wishes, Fran.

195
Apndice F Diagrama Entidade-Relacionamento (DER) do repositrio de coleta e processamento da plataforma experimental
SocialCol

Você também pode gostar