P. 1
ANAIS_SBSC_2011

ANAIS_SBSC_2011

|Views: 1.044|Likes:

More info:

Published by: Marco Aurelio Gerosa on Oct 18, 2011
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

08/20/2013

pdf

text

original

ANAIS

VIII SIMPÓSIO BRASILEIRO DE SISTEMAS COLABORATIVOS
5 a 7 de Outubro de 2011
PARATY, RJ






ANAIS




Coordenação Geral
Marcos Roberto da Silva Borges (IM-UFRJ)

Coordenação do Comitê de Programa
Ana Cristina Bicharra Garcia (UFF)
Pedro Antunes (Universidade Técnica de Lisboa)

Realização
Universidade Federal do Rio de Janeiro (UFRJ)
Universidade Federal Fluminense (UFF)


Promoção
SBC – Sociedade Brasileira de Computação

ISBN
978-85-7669-254-6

VIII Simpósio Brasileiro de Sistemas Colaborativos
- I -

S U M Á R I O
Prefácio ...........................................................................................................VII
Organização SBSC 2011 ................................................................................... IX
Palestras Convidadas .........................................................................................XI
Sessão 1: Interação Social
1.1. Entendendo a Twitteresfera Brasileira .......................................................01
FABRÍCIO BENEVENUTO, DIEGO SILVEIRA, THALISSON OLIVEIRA, LEONARDO BOMBONATO, REINALDO
FORTES E ÁLVARO PEREIRA JR.
1.2. Uma investigação sobre os "Assuntos do Momento"
e a Discussão de Notícias no Serviço de Microblogging ...................................... 09
KAREN FIGUEIREDO E ANA CRISTINA GARCIA
1.3. Social networks and collective intelligence applied
to public transportation systems: A survey ...................................................... 16
ANA PAULA CHAVES, IGOR STEINMACHER E VANINHA VIEIRA
1.4. Multidões: a nova onda do CSCW? ............................................................ 24
DANIEL SCHNEIDER, JANO M. DE SOUZA E KATIA MORAES
Sessão 2: Inteligência Coletiva
2.1. Um modelo para o suporte computacional da
inteligência coletiva na Web ............................................................................ 33
STRAUS MICHALSKY E MARCO AURÉLIO GEROSA
2.2. Predição de falhas em projetos de software baseado
em métricas de redes sociais de comunicação e cooperação ............................... 37
VIDAL FONTOURA, IGOR STEINMACHER, IGOR WIESE E MARCO AURÉLIO GEROSA
2.3. Um aplicativo baseado em inteligência coletiva para
compartilhamento de rotas em redes sociais ..................................................... 41
LUIZ PHILIPE SERRANO ALVES, ANA PAULA CHAVES E IGOR STEINMACHER
- III -
Sessão 3: Colaboração em Micromundos e Através de Dispositivos Móveis
3.1. Using Microworlds to Study Teamwork at the
Cognitive Level ..............................................................................................46
CLAUDIO SAPATEIRO, ANTONIO FERREIRA E PEDRO ANTUNES
3.2. SLMeetingRoom: Um Modelo de Ambiente para
Suporte a Reuniões Remotas, Orientadas a Tarefas,
com Grupos Pequenos para o Second Life .........................................................54
CINTIA CAETANO E ANA CRISTINA GARCIA
3.3. xAgent: Arquitetura para a Colaboração em
Ambientes Cross-Reality ................................................................................62
DÉBORA CARDADOR, KATIA VEGA, HUGO FUKS E CARLOS LUCENA
3.4. Ampliando o suporte à interoperabilidade em uma
arquitetura orientada a serviços de middleware para
sistemas colaborativos ...................................................................................68
RITA SUZANA MACIEL, JOSÉ MARIA DAVID E THIAGO R. DE ALMEIDA
3.5. Uma Ferramenta de Colaboração Móvel para
Auxiliar a Interação em Palestras Presenciais .................................................76
GABRIEL BALESTRIN, CARLA BERKENBROCK E CELSO HIRATA
Sessão 4: Ferramentas e Desenvolvimento de Sistemas Colaborativos
4.1. Adicionando informações de contexto de tarefa a
uma ferramenta de chat síncrono para apoiar o
desenvolvimento distribuído de software ........................................................ 84
ANA PAULA CHAVES, IGOR SCALIANTE WIESE, IGOR STEINMACHER, FABIO BAIA, EDILSON F. DA COSTA,
KAREN MORESCHI, CICERO JUPI, MARCO AURÉLIO GEROSA
4.2. Desenvolvimento e Implantação de uma Ferramenta
de Apoio a Reuniões Presenciais .................................................................... 88
DANIEL BISCALCHIN E JACQUES WAINER
4.3. Ambientes eParticipativos sob a ótica do modelo
3C de colaboração ........................................................................................ 92
CLEYTON SLAVIERO, ANA CRISTINA GARCIA E CRISTIANO MACIEL
Sessão 5: Recomendação
5.1. Creating a Blog Recommendation System Through
a Framework for Building Blog Crawlers. ........................................................ 97
RAFAEL FERREIRA LEITE, JEAN MELO, PATRICK BRITO, EVANDRO COSTA, RINALDO LIMA E FRED FREITAS
VIII Simpósio Brasileiro de Sistemas Colaborativos
- IV -
5.2. How to Know What Do You Want? A Survey of
Recommender Systems and the Next Generation ............................................104
ANGELINA ZIESEMER E JOÃO OLIVEIRA
5.3. Ativistas, passageiros, ocasionais e especialistas:
perfis de usuário na construção de um site de Q&A ........................................112
ADABRIAND FURTADO E NAZARENO ANDRADE
5.4 Content Recommendation Based on Data Mining
in Adaptive Educational Social Networks .......................................................120
MARCEL CARACIOLO
5.5. Social Tag Collaborative Recommendation:
Mining the Meaning .....................................................................................124
ANGELINA ZIESEMER E JOÃO OLIVEIRA
5.6. Proposta de Uso de Modelos de Objetivos na
Engenharia de Requisitos de Sistemas Colaborativos ......................................128
MARIANA MAIA, CARLA SILVA E STEPHANY VITORIO
Sessão 6: Disseminação de Conhecimento
6.1. Sensemaking na Passagem de Serviço em Centros
de Terapia Intensiva .....................................................................................132
JIVAGO MEDEIROS, RODRIGO DE ANDRADE E ANA CRISTINA GARCIA
6.2. Gestão de contexto no levantamento colaborativo
de processos de negócio ...............................................................................139
DOUGLAS SILVA, RENATA ARAUJO E FLAVIA SANTORO.
6.3. MEK: Uma abordagem oportunística para disseminação
colaborativa do conhecimento .......................................................................145
DIEGO S. SOUZA, GUILHERME FOGAÇA, PEDRO C. SILVEIRA, JONICE OLIVEIRA E JANO M. DE SOUZA
6.4. Co-designing Collaborative Museums: Combining
Ethnography and Co-creation Workshops .......................................................152
HELOISA MOURA, DÉBORA CARDADOR, KATIA CÁNEPA, WALLACE UGULINO, MARCOS BARBATO E HUGO
FUKS
Sessão 7: Sistemas Colaborativos Aplicados a Domínio
7.1. Remember Storytelling API: Um Framework Para o
Apoio a Recuperação de Histórias em Group Storytelling ................................161
BRUNO COSTA E RAFAEL ALVES
7.2. Aplicação da Abordagem Colaborativa em
Herbários Virtuais .......................................................................................165
LUÍS ALEXANDRE ESTEVÃO DA SILVA, KLETO MICHEL ZAN, EDUARDO COUTO DALCIN, DJALMA ALVES DE
LIMA, MARCO ANICETO VAZ, FILIPE BRAIDA DO CARMO, GERALDO ZIMBRÃO E JANO M. DE SOUZA
VIII Simpósio Brasileiro de Sistemas Colaborativos
- V -
7.3. Supporting Group Exposure Therapy ......................................................169
LUIS CARRIÇO, LUÍS DUARTE, RICARDO PEREIRA, MARCO DE SÁ, JOÃO FARIA, ISABEL SÁ, GUSTAVO ZURITA
E NELSON BALOAIN
7.4 Evolução dos Sistemas de Comunicação ...................................................173
LEANDRO CALVÃO, MARIANO PIMENTEL E HUGO FUKS
Workshop de Teses & Dissertações
8.1. Modelo de plataforma conectivista para apoio a
aprendizagem socializada e colaborativa ........................................................178
LUCIANE DEUS, CARLA VERÔNICA MARQUES, CLAUDIA MOTTA, CARLO EMMANOEL OVEIRA
8.2. Evolução dos Sistemas de Comunicação ..................................................184
LEANDRO CALVÃO, MARIANO PIMENTEL E HUGO FUKS
8.3. Um processo MDA para Linha de Produtos para
Sistemas Colaborativos ................................................................................190
CRISTIANA BISPO, JOSÉ MARIA DAVID, RITA SUZANA MACIEL
8.4. Apoiando a reputação em programação em
par distribuída .............................................................................................196
DAVI CÉSAR NASCIMENTO, JOSÉ MARIA DAVID
8.5. Cálculo de Reputação em Redes Sociais ..................................................202
EDITH ZAIDA SONCO MAMANI, MARCO AURÉLIO GEROSA
8.6. Visualizações para percepção em modelos
políticos de discussão ..................................................................................208
RAFAEL TAVARES, MARIANO PIMENTEL, RENATA ARAUJO
8.7. SmartMovie: Solução Colaborativa de edição e.........................................214
compartilhamento de vídeo no SBTVD
EDUARDO DA SILVA, ROBERTA GOMES, RENATA S.S. GUIZZARDI
8.8. Colaboração Baseada em Cenários: Contribuindo
Para Viabilizar a Aquisição de Conhecimento da População .............................220
SAMUEL APOLONIO, MARCOS BORGES, ADRIANA VIVACQUA
VIII Simpósio Brasileiro de Sistemas Colaborativos
- VI -
PREFÁCIO
Bem-vindos ao VIII Simpósio Brasileiro de Sistemas Colaborativos (SBSC)
realizado na charmosa cidade histórica de Paraty, no estado do Rio de Janeiro, de
5 a 7 de outubro de 2011. Este é um evento que se firma cada vez mais como um
importante fórum que propicia à comunidade Acadêmica Brasileira debater
questões, técnicas, soluções, inovações e experiências sobre esta área
multidisciplinar.
Não é exagero afirmar que o computador mudou o mundo. Mas pode-se afirmar
que os Sistemas Colaborativos como correios eletrônicos, redes sociais,
ambientes virtuais, videoconferência, blog e outros causaram uma verdadeira
revolução social e porque não dizer até uma mudança de hábitos e costumes. As
notícias, os fatos, informações e acontecimentos correm em velocidade espantosa
na internet. Revoluções econômicas são originadas de intensa comunicação
eletrônica. É difícil reter segredos. O mundo, de fato, virou uma simples aldeia.
Nesse sentido, o evento entra firme nesse instigante universo e estamos
orgulhosos de apresentar um programa rico e diversificado que reflete o interesse
corrente da comunidade de sistemas colaborativos. A preparação desta
conferência, que compreendeu as etapas de submissão de trabalho, análise critica
e seleção, permitiu envolver pesquisadores de diversos estados brasileiros
incluindo AL, BA, MG, MT, PB, PE, PR, RJ, SP e SC. A realização conjunta
com o CRWIG permitiu enriquecer nosso fórum nacional com contribuições
internacionais, tanto em termos de artigos, quanto de palestrantes convidados.
A elevada qualidade dos artigos submetidos dificultou o processo seletivo.
Foram 41 artigos completos submetidos para os 16 artigos aceitos (39% de índice
de aceitação).
O programa do SBSC’2011 está organizado em sessões temáticas que refletem as
principais áreas de interesse da comunidade: interação social em sistemas
colaborativos, colaboração em micros-mundos, colaboração através de
dispositivos móveis, sistemas de recomendação, disseminação de conhecimento,
desenvolvimento de sistemas colaborativos, ferramentas e aplicativos. Os 16
artigos completos e 13 artigos resumidos estão agrupados e divididos nos três
dias de conferência.
Os três dias de sessões técnicas serão antecedidos por apresentações de
palestrantes renomados. No primeiro dia, 5 de outubro, Dave Randal apresenta
sua visão sobre o papel da sociologia no projeto de sistemas colaborativos. No
VIII Simpósio Brasileiro de Sistemas Colaborativos
- VII -
segundo dia, Gerhard Fischer (Colorado University) apresenta a experiência de
seu grupo de pesquisa no entendimento e apoio à cultura de participação.
Finalmente, fechando a conferência, Clarisse de Souza (PUC-Rio) compartilha
sua visão sobre o papel do computador como meio de expressão.
O programa da conferência também inclui um workshop de teses e dissertações
que conta com oito apresentações e dois cursos tutoriais: “Introdução a Sistemas
Colaborativos” e “NoSQL no desenvolvimento de aplicações Web
colaborativas”. O primeiro deles oferece uma visão geral da área e o segundo
trata de questões de implementação de sistemas colaborativos.
Durante o simpósio - que tem como Coordenador Geral o Professor Marcos da
Silva Borges, da Universidade Federal do Rio de Janeiro (UFRJ) - haverá o
lançamento do livro “Sistemas Colaborativos”, ed. Campus/Elsevier, que vem
cobrir a lacuna de um livro texto para alunos de graduação. O livro foi formulado
por um conjunto representativo de pesquisadores da comunidade acadêmica
brasileira.
Gostaríamos de agradecer o apoio dos palestrantes por darem vida ao simpósio,
do comitê de programa pelas revisões, pelos órgãos de fomento (CAPES, CNPq,
CGI, SBC) pelo apoio, pela equipe da UFF e UFRJ que tiveram papel
fundamental nos bastidores da elaboração do evento, e de todos que
voluntariamente ajudaram a fazer o SBSC’2011 possível. Estamos certos que a
conferência proverá excelentes oportunidades para compartilhar soluções e
questões, tecnologias e modelos na área de sistemas colaborativos, assim como
permitir a criação de laços de pesquisa entre os participantes.
Finalizando, para sediar o evento foi escolhida a bela e histórica cidade de
Paraty, cuja arquitetura colonial convida à reflexão, ao aprendizado e porque não
dizer à aventura intelectual, a novos caminhos. Que Paraty seja o palco onde
novos projetos e ideias surgirão para incrementar ainda mais os sociais e
populares Sistemas Colaborativos. A excelência, o alto nível dos palestrantes e
organizadores, workshops e minicursos confirmarão isso. Bem vindos a Paraty.
Aproveitem bem a conferência, e bom trabalho!
Paraty, outubro de 2011.
Ana Cristina Bicharra Garcia
Pedro Antunes
COORDENAÇÃO DO COMITÊ
DE PROGRAMA – SBSC 2011
VIII Simpósio Brasileiro de Sistemas Colaborativos
- VIII -
ORGANIZAÇÃO SBSC 2011

Coordenação do Comitê de Programa
Ana Cristina Bicharra Garcia (UFF)
Pedro Antunes (Universidade Técnica de Lisboa)

Organização do Evento
Marcos Roberto da Silva Borges (NCE-UFRJ)

Coordenação de Minicursos
Alberto Raposo (PUC-Rio)

Coordenação do Workshop de Teses e Dissertações
Marco Aurélio Gerosa (IME/USP)

Comitê de Programa
Adriana Santarosa Vivacqua (DCC-IM-
UFRJ)
Ana Carolina Salgado (UFPE)
Ana Cristina Bicharra Garcia (UFF)
Alberto Castro (UFAM)
Alberto Raposo (PUC-Rio)
Carla Diacui Berkenbrock (UDESC)
Carlos André Guimarães Ferraz (UFPE)
Celso Massaki Hirata (ITA)
Cesar Augusto Tacla (UTFPR)
Claudia Cappelli (UNIRIO)
Cleidson Ronald Botelho de Souza (UFPA)
Cléver Ricardo G. de Farias
(FFCLRP/USP)
Clovis Torres Fernandes (ITA)
Cristiano Maciel (UFMT)
Denise Del Re Filippo (UERJ)
Edeilson Milhomem Silva –
(CEULP/ULBRA e UFPE)
Flávia Bernardini (UFF)
Flávia Maria Santoro (UNIRIO)
Geraldo Bonorino Xexéo (COPPE-UFRJ)
Hugo Fuks (PUC-Rio)
Ivan Luiz Marques Ricarte (UNICAMP)
Jacques Wainer (UNICAMP)
Jano Souza (UFRJ)
Jauvane Cavalcante de Oliveira (LNCC)
Jonice Oliveira (UERJ)
Jose Maria Nazar David (UFJF)
Kate Revoredo (UNIRIO)
Marco Aurélio Gerosa (IME/USP)
Marco Aurélio Souza Mangan (PUC-RS)
Mariano Pimentel (UNIRIO)
Melise Maria Veiga de Paula (UNIFAL-
MG)
Neide dos Santos (UERJ)
Pedro Porfirio Farias (Unifor)
Rafael Prikladnicki (PUC-RS)
Raquel de Oliveira Prates (UFMG)
Renata Mendes de Araujo (UNIRIO)
Roberta Lima Gomes (UFES)
Roberto Willrich (UFSC)
Seiji Isotani (CMU)
Sergio Crespo C. da Silva Pinto
(UNISINOS)
Daniel Paiva (ADDLabs)
Vaninha Vieira (UFBA)
VIII Simpósio Brasileiro de Sistemas Colaborativos
- IX -
Comitê Gestor da Comissão Especial 2011
Mariano Pimentel (UNIRIO) - Coordenador
Claudia Lage Rebello da Motta (NCE-UFRJ) - Vice-coordenadora
Celso Massaki Hirata (ITA)
Denise Del Re Filippo (UERJ)
Marco Aurélio Gerosa (IME/USP)
Renata Mendes de Araujo (UNIRIO)
Vaninha V. Santos (UFBA)


Comitê de Programa do Workshop de Teses e Dissertações
Adriana Santarosa Vivacqua (UFRJ)
Alberto Raposo (PUC-Rio)
Celso Hirata (ITA)
Denise Del Re Filippo (UERJ)
Jose Maria Nazar David (UFJF)
Renata Araújo (UNIRIO)
Roberta Lima Gomes (UFES)
Vaninha Vieira (UFBA)


VIII Simpósio Brasileiro de Sistemas Colaborativos
- X -
PALESTRAS CONVIDADAS
• Compreensão, Promoção e Apoio à Cultura de Participação.
Gerhard Fischer (University of Colorado – USA)

Diretor do Centro para a Aprendizagem ao Longo da Vida e Design. Professor
do Departamento de Ciência da Computação, e membro do Instituto de Ciência
Cognitiva, todos pertencentes a Universidade de Colorado (EUA).
Membro Human Computer Interaction Academy (CHI) e da Association for
Computing Machinery (ACM).
Suas linhas de pesquisa incluem: aprendizagem ao longo da vida, design, meta-
design, design de software, criatividade, criatividade social, inteligência
distribuída, interação homem-computador, e design para todos (tecnologias de
apoio).

• Computador como meio de expressão: novas falas na
contemporaneidade.
Clarisse Sieckenius de Souza (PUC-Rio)

Graduou-se como Tradutora e Intérprete de Conferência pela PUC-Rio, onde
também obteve título mestrado em Português e doutorado em Lingüística
Computacional.

Em 1988 ela entrou para o Departamento de Informática da PUC-Rio, onde
começou na área de Interação Humano-Computador. Clarisse também é
professora visitante em diversas universidades e institutos, como Stanford (com
Terry Winograd), University of Waterloo (com Tom Carey), e UMBC (com
Jenny Preece).

Em 1996, ela fundou SERG (Grupo de Pesquisa em Engenharia Semiótica), que
desenvolve pesquisa de ponta em IHC, Engenharia Semiótica e Lingüística
Computacional.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- XI -

S E S S Ã O 1
Interação Social
Entendendo a Twitteresfera Brasileira
Fabrício Benevenuto
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitário
+55 31 3559-1692
benevenuto@gmail.com
Diego Silveira
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitário
+55 31 3559-1692
dcotta15@msn.com
Thalisson Oliveira
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitário
+55 31 3559-1692
thalissonvidal@hotmail.com
Leonardo Bombonato
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitário
+55 31 3559-1692
leonardobombonato@gmail.com
Reinaldo Fortes
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitário
+55 31 3559-1692
reifortes@yahoo.com.br
Álvaro Pereira Jr.
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitário
+55 31 3559-1692
alvarorpj@yahoo.com
ABSTRACT
Twitter has been constantly growing as an important sys-
tem where users discuss about everything, expressing opini-
ons, political view, sexual orientation, and even their mood
like happiness or sadness. Social networks are pointed as
places where users influence and are influenced by others,
being a perfect environment for word-of-mouth marketing,
advertisement, and political campaigns. In order to offer a
better understand of the use of Twitter in Brazil, this work
provides a wide characterization of Brazilian users in Twitter
as well as a deep understand of the content posted by Bra-
zilians in Twitter. We correlate Brazilian demographic data
with geographic data from the Twitter users to show that
some Brazilian states are underestimated in Twitter. Ad-
ditionally, we characterize the different linguistic patterns
adopted, we analyzed the most propagated URLs, and we
identified the most influential Brazilian users in Twitter on
each Brazilian region.
RESUMO
O Twitter vem constantemente crescendo como um im-
portante sistema onde usu´arios discutem sobre tudo, ex-
pressando opini˜oes, vis˜ao pol´ıtica, orienta¸c˜ ao sexual e at´e
mesmo humor, como felicidade ou tristeza. Redes sociais
s˜ao apontadas como locais onde usu´arios influenciam e s˜ao
influenciados por outros sendo, portanto, ambientes perfei-
tos para a realiza¸c˜ ao de marketing boca-a-boca, propagan-
das e campanhas pol´ıticas. Com o intuito de oferecer en-
tendimento sobre o uso do Twitter no Brasil, este trabalho
provˆe uma ampla caracteriza¸c˜ ao dos usu´arios brasileiros no
Twitter e do conte´ udo postado por esses usu´ arios. N´os cor-
relacionamos dados demogr´aficos brasileiros com dados da
localiza¸ c˜ ao dos usu´arios do Twitter para mostrar que alguns
estados brasileiros est˜ao subestimados nesse sistema. Al´em
disso, n´os caracterizamos os diferentes padr˜oes lingu´ısticos
adotados, analisamos as URLs mais propagadas, e identifi-
camos os usu´arios brasileiros mais influentes no Twitter em
cada regi˜ ao brasileira.
Categories and Subject Descriptors
H.3.5 [Online Information Services]: Web-based ser-
vices; J.4 [Computer Applications]: Social and behavio-
ral sciences
General Terms
Experimentation, Measurement
Keywords
Twitter, Microblog, Web 2.0
1. INTRODUÇÃO
Desde seu in´ıcio a Internet tem sido palco de uma s´erie de
novas aplica¸c˜oes incluindo a WWW e email. Atualmente,
a Web tem recebido uma nova onda de aplica¸ c˜ oes associa-
das ao crescimento e prolifera¸c˜ ao das redes sociais online.
V´ arios desses sistemas surgiram, incluindo redes de profissi-
onais (ex. LinkedIn), redes de amizade (ex. MySpace, Fa-
cebook e Orkut), e redes voltadas para o compartilhamento
de algum tipo espec´ıfico de conte´ udo como mensagens cur-
tas (ex. Twitter), di´arios e blogs (ex. LiveJournal), fotos
(ex. Flickr) e v´ıdeos (ex. YouTube).
Em particular, o Twitter surgiu como uma plataforma so-
cial na Web onde usu´arios discutem sobre tudo, expressando
opini˜oes, vis˜ao pol´ıtica, orienta¸c˜ ao sexual e at´e mesmo con-
ceitos vagos como humor e felicidade. Al´em disso, o Twitter
tem atra´ıdo a popularidade de jornais e celebridades, co-
nectados a usu´arios comuns atrav´es de elos de seguidores e
seguidos pelos quais usu´arios podem trocar informa¸c˜ oes. Es-
timativas sugerem que, atualmente, os 200 milh˜oes de usu´a-
rios ativos do Twitter postam cerca de 150 milh˜oes de tweets
(mensagens) contendo cerca de 23 milh˜oes de URLs diari-
amente [4, 25]. Segundo a comScore, o Brasil ´e o terceiro
pa´ıs onde o Twitter mais cresce atualmente [12].
Com tanta popularidade, o Twitter se tornou uma pla-
taforma para a descoberta de informa¸ c˜ ao em tempo real e
vem se mostrando uma importante ferramenta para a disse-
mina¸c˜ ao de not´ıcias de ´ ultima hora, tais como revolu¸c˜ oes e
desastres. Al´em disso, Google e Bing j´a indexam tweets p´ u-
blicos como forma de prover busca por informa¸c˜ ao em tempo
real [23]. Como consequˆencia, o Twitter vem sendo alvo de
diversos sistemas relacionados `a descoberta de informa¸c˜ oes
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 1 -
em tempo real, como a identifica¸c˜ao autom´ atica de terremo-
tos a partir da an´alise de tweets [20], extra¸c˜ ao de opni˜oes
de eleitores em rela¸c˜ao a candidatos a cargos pol´ıticos [24]
e at´e mesmo como fonte de dados para o monitoramento de
casos de dengue no Brasil [14].
Apesar da comprovada aplicabilidade desses estudos e fer-
ramentas, pouco se sabe sobre o uso do Twitter no Brasil.
Como exemplo, n˜ao sabemos se um determinado estado bra-
sileiro est´a sub ou super representado no Twitter em rela-
¸c˜ ao ` a sua demografia real, o que poderia ter profundo im-
pacto nos resultados reportados por ferramentas brasileiras
que monitoram eventos no Twitter. Pouco se sabe sobre o
uso do Twitter no Brasil com rela¸c˜ ao aos temas discutidos,
usu´arios mais influentes, sites mais divulgados no Twitter,
etc. Neste cen´ario, apesar de haver um grande interesse de
empresas brasileiras em divulgar produtos e realizar propa-
ganda boca-a-boca, pouco se sabe sobre quais estrat´egias
realmente seriam efetivas. Nesse contexto, acreditamos que
uma ampla an´ alise da twitteresfera poderia oferecer respos-
tas para v´ arias dessas quest˜oes.
Este trabalho visa dar um primeiro passo nessa dire¸c˜ ao
de forma a realizar uma ampla an´alise do conte´ udo postado
por brasileiros no Twitter. Para isso, utilizamos uma co-
le¸c˜ ao que possui 55 milh˜oes de usu´arios do Twitter, todos
os elos de seguidores e seguidos (grafo com quase 2 bilh˜oes
de elos) e todos os tweets postados por esses usu´arios (1.8
bilh˜oes de tweets). Dado que o Brasil ´e um pa´ıs t˜ao ex-
tenso e diversificado, a localiza¸c˜ ao geogr´ afica das pessoas
pode ter um importante papel nos assuntos discutidos, nos
temas compartilhados e at´e mesmo na felicidade e no hu-
mor das pessoas. Sendo assim, identificamos a localiza¸c˜ ao
geogr´afica de usu´arios do twitter para realizar uma an´ alise
sobre seu uso nas diferentes regi˜oes brasileiras.
Nossas an´alises revelam que alguns estados brasileiros es-
t˜ ao subestimados no Twitter em rela¸c˜ao a dados demogr´afi-
cos, sendo que caracter´ısticas s´ocio-econˆomicas desses esta-
dos parecem influir no n´ umero de usu´ arios do Twitter. Al´em
disso, nossas an´alises ainda revelam padr˜oes lingu´ısticos as-
sociados ao uso de microblogs no Brasil, identificando n˜ao
s´o os termos mais frequentes nos tweets postados por bra-
sileiros, mas tamb´em aqueles associados a contextos felizes
e tristes. N´os ainda analisamos as URLs postadas por bra-
sileiros no Twitter e comparamos a popularidade dos s´ıtios
web mais populares no Twitter com a popularidade desse s´ı-
tios na Web de maneira geral. Por ´ ultimo, foram estudadas
diferentes abordagens para identificar os usu´ arios brasileiros
mais influentes no Twitter e foi constru´ıdo um ranking de
usu´arios influentes para cada regi˜ao do Brasil. Acreditamos
que a metodologia empregada nas an´ alises presentes nesse
trabalho pode guiar futuros trabalhos e ferramentas que pre-
tendem realizar algum tipo de monitoramento de dados ex-
tra´ıdos de redes sociais online, em especial o Twitter.
O restante do trabalho est´ a organizado da seguinte forma.
A se¸c˜ ao 2 descreve trabalhos relacionados. A se¸c˜ ao 3 des-
creve a estrat´egia adotada para a coleta de dados da twitte-
resfera brasileira. A se¸c˜ ao 4 apresenta dados da demografia
dos usu´arios brasileiros do Twitter. A se¸c˜ ao 5 apresenta
os termos mais frequentes utilizados pelos brasileiros, bem
como uma an´alise da polaridade desses termos. Em seguida,
a se¸c˜ao 6 analisa os dom´ınios das URLs mais populares pro-
pagadas no Twitter. A se¸c˜ ao 7 indentifica os usu´arios brasi-
leiros mais influentes de cada regi˜ao brasileira. Finalmente,
a se¸c˜ ao 8 oferece conclus˜oes e dire¸c˜ oes para trabalhos futu-
ros.
2. TRABALHOS RELACIONADOS
O Twitter tem sido alvo de um grande n´ umero de traba-
lhos relacionados `as suas caracter´ısticas topol´ogicas e aspec-
tos da intera¸ c˜ao de seus usu´arios. Kwak e colaboradores [16]
estudaram a topologia do Twitter, encontrando distribui¸ c˜ oes
que seguem leis de potˆencia para o n´ umero de seguidores e
seguidos, um diˆametro curto e baixa reciprocidade. Eles
ainda estudaram abordagens para ranquear usu´arios basea-
das no uso do Pagerank calculado sobre a estrutura de se-
guidores e seguidos no Twitter. Mais recentemente, Cha
e colaboradores [10] mostraram que usu´arios influentes n˜ao
s˜ao necessariamente os usu´arios mais seguidos do Twitter,
o que significa que a topologia do Twitter pode n˜ao ser su-
ficiente para capturar a influˆencia dos usu´arios. Scellato e
colaboradores [21] estudaram como informa¸c˜ao propagada
no Twitter pode ser explorada para melhorar sistemas de
caches de arquivos multim´ıdia em redes de distribui¸c˜ ao de
conte´ udo (CDNs - Content Distribution Networks). Como
resultados eles mostraram que o n´ umero de acertos em ca-
che pode ser aumentado em rela¸ c˜ ao a pol´ıticas de caches que
n˜ao levam em considera¸c˜ ao informa¸c˜ oes geogr´aficas e soci-
ais. Rodrigues e colaboradores [18] provˆeem uma s´erie de
an´alises sobre os padr˜oes de propaga¸c˜ ao de informa¸c˜ao en-
tre os usu´arios do Twitter. Al´em de quantificar o aumento
de audiˆencia de uma informa¸c˜ ao que retweets podem cau-
sar, eles identificaram caracter´ısticas t´ıpicas da estrutura das
´arvores de propaga¸c˜ ao de informa¸c˜ ao nesse sistema. Final-
mente, a existˆencia de phishing [11] e spammers no Twitter
vem sendo constantemente reportada [17] e esfor¸cos recen-
tes propuseram abordagens para a detec¸ c˜ ao de spammers no
Twitter [7].
Alguns trabalhos recentes analisaram a repercuss˜ao de
eventos espec´ıficos no Twitter. Em particular, Sakaki e co-
laboradores [20] mostraram o poder da informa¸c˜ ao dispo-
nibilizada em tempo real nas redes sociais online propondo
um mecanismo para detec¸c˜ao de ocorrˆencias de terremotos
baseado em monitoramento do Twitter. A abordagem, que
consiste identificar tweets relacionados a terremotos por re-
gi˜ao, foi capaz de enviar alertas sobre terremotos mais ra-
pidamente do que agˆencias meteorol´ogicas. Tumasjan e co-
laboradores [24] mostraram que opini˜oes identificadas em
tweets relacionados `a elei¸c˜ ao federal alem˜a foi capaz de re-
fletir o sentimento pol´ıtico registrado fora das redes sociais.
Mais recentemente, uma an´alise geogr´afica e temporal sobre
dengue no Twitter foi realizada por Gomide e seus colabora-
dores [14]. De forma complementar a esses trabalhos, nosso
trabalho oferece uma vis˜ao geral do uso do Twitter no Bra-
sil e n˜ao analisa somente a repercuss˜ao de um determinado
evento.
3. METODOLOGIA DE MEDIÇÃO
Em um passado recente, redes sociais eram um dom´ınio de
soci´ologos e antrop´ologos, que utilizavam pesquisas e entre-
vistas com pequenos grupos de usu´arios como ferramentas de
coleta de dados. Com o surgimento das redes sociais online,
a obten¸ c˜ ao de dados reais em larga escala se tornou poss´ıvel,
e pesquisadores de diversas ´areas da computa¸ c˜ ao come¸caram
a realizar coletas de dados. Entretanto, a coleta de conte´ udo
criado por usu´ arios envolve um grande n´ umero de desafios.
Esta se¸c˜ ao apresenta a metodologia adotada para a obten-
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 2 -
¸c˜ao dos dados utilizados em nossas medi¸c˜ oes. Inicialmente,
a se¸c˜ ao 3.1 descreve a estrat´egia adotada para coletar da-
dos do Twitter. Em seguida, a se¸c˜ ao 3.2 discute a coleta
da localiza¸c˜ao geogr´ afica de usu´arios do Twitter, de forma
a permitir a realiza¸c˜ ao de an´alises restritas `a twitteresfera
brasileira. A se¸c˜ ao 3.3 descreve o processo utilizado para
identificar tweets felizes, tristes ou neutros. Finalmente, a
se¸c˜ ao 3.4 discute poss´ıveis limita¸c˜oes dos dados obtidos.
3.1 Coleção de dados do Twitter
Esta se¸c˜ ao descreve brevemente a estrat´egia utilizada para
construir uma cole¸ c˜ ao de dados do Twitter. Podemos aces-
sar cada usu´ario do sistema, visto que o Twitter atribui um
identificador (ID) num´erico e sequencial para cada usu´ario
cadastrado [6]. Como novos usu´arios recebem um identifi-
cador sequencial, podemos percorrer todos os IDs, sem ter
que verificar a lista de amigos desses usu´arios em busca de
novos IDs para coletar.
Recentemente, n´os realizamos uma coleta do Twitter se-
guindo essa estrat´egia. Foi solicitado aos administradores
do Twitter a permiss˜ao para realizar uma coleta em larga
escala. Em resposta, eles adicionaram os endere¸cos IPs de
58 m´aquinas sob nosso controle em uma lista branca, com
permiss˜ao para coletar dados. Cada uma das 58 m´ aquinas,
localizadas no Max Planck Institute for Software Systems
(MPI-SWS), na Alemanha
1
, teve permiss˜ao para coletar da-
dos a uma taxa m´axima de 20 mil requisi¸c˜ oes por hora. Uti-
lizando a API do Twitter, nosso coletor investigou todos os
80 milh˜oes de IDs de forma seq¨ uencial, coletando todas as
informa¸c˜ oes p´ ublicas sobre esses usu´arios, bem como seus
elos de seguidores e seguidos e todos os seus tweets. Dos 80
milh˜oes de contas inspecionadas, encontramos cerca 55 mi-
lh˜oes em uso. Isso acontece porque o Twitter apaga contas
inativas por um per´ıodo maior do que 6 meses. No total,
coletamos 54.981.152 milh˜oes de usu´arios, todos os elos de
seguidores e seguidos, que correspondem a 1.963.263.821
elos ´ unicos e todos os tweets postados por esses usu´arios,
em um total de 1.755.925.520 tweets. Ao inspecionar as
listas de seguidores e seguidos coletadas, n˜ao encontramos
nenhum identificador acima dos 80 milh˜oes inspecionados,
sugerindo que coletamos todos os usu´arios do sistema na
´epoca. Para uma descri¸c˜ ao mais detalhada desses dados e
das t´ecnicas empregadas para a realiza¸c˜ ao da coleta desses
dados, recomendamos ao leitor as seguintes referˆencias [10,
6].
3.2 Coleta de informações geográficas
Para identificarmos usu´arios e tweets brasileiros precisa-
mos primeiramente identificar a localiza¸c˜ ao e origem dos
tweets nos dados coletados. A localiza¸c˜ ao dos usu´arios do
Twitter coletados aparece na forma de texto livre e freque-
mente cont´em localiza¸c˜ oes inv´alidas, tais como “Marte” ou
“minha casa”. Al´em disso, ´e muito comum usu´arios abrevia-
rem localiza¸c˜ oes como BH para Belo Horizonte, Sampa para
S˜ao Paulo, e Floripa para Florian´opolis. A API do Twit-
ter provˆe a latitude e a longitude apenas dos usu´arios que
utilizam aparelhos m´oveis com servi¸co GPS e permitem o
compartilhamento desse tipo de informa¸c˜ ao. Esses usu´arios
correspondem a uma fra¸c˜ ao muito pequena dos usu´arios, es-
pecialmente no per´ıodo em que os dados foram coletados.
1
Esta coleta foi realizada pelo primeiro autor desse trabalho
durante uma visita ao MPI-SWS
Como forma de realizar uma estrat´egia sistem´atica de se
obter a localiza¸ c˜ ao dos usu´arios, foi utilizada a API do Go-
ogle Geocoding para traduzir endere¸ cos em formato texto
em coordenadas geogr´ aficas (latitute e longitute). A API
do Google Geocoding ´e utilizada por diversos servi¸cos do
Google que utilizam mapas e tem como vantagem identifi-
car corretamente localiza¸c˜ oes abreviadas, como BH, Sampa
e Floripa. Essa API provˆe um mecanismo direto de se ob-
ter as coordenadas geogr´ aficas, o pa´ıs, o estado e a cidade
a partir de uma localiza¸ c˜ ao fornecida em texto atrav´es de
uma requisi¸c˜ ao HTTP [15]. Nos casos em que o usu´ario for-
neceu diretamente coordenadas geogr´ aficas atrav´es do uso
de aparelhos m´oveis com GPS, o Google Geocoding foi uti-
lizado apenas para buscar o nome da cidade e do pa´ıs desses
usu´arios.
´
E importante ressaltar que a API do Google Geocoding
limita o n´ umero m´aximo de requisi¸c˜ oes por IP a 200 requi-
si¸c˜ oes por hora. Essa taxa torna dif´ıcil a obten¸ c˜ao da loca-
liza¸c˜ ao de todos os usu´arios coletados que correspondem a
quase 55 milh˜oes de usu´arios. Sendo assim, n´os restringimos
a coleta aos usu´arios cujo fuso hor´ ario fosse um dos adota-
dos no Brasil. Al´em disso, foi implementado um sistema
de cache de localiza¸ c˜oes, de forma a evitar que duas locali-
za¸ c˜ oes idˆenticas fossem requisitas `a API do google Geoco-
ding. Dos 923.232 usu´arios investigados, foram identificados
198.714 usu´ arios com localiza¸c˜ao detalhada no n´ıvel de ci-
dades. No total esses usu´arios postaram 29.013.854 tweets.
Esses usu´arios e tweets correspondem ao conjunto de dados
que analisaremos nas pr´oximas se¸c˜ oes.
3.3 Identificação de sentimentos
Emoticons representam uma excelente forma de capturar
emo¸c˜ oes expressas no texto, pois eles capturam a emo¸c˜ ao do
escritor que inclui uma express˜ao f´ acil utilizando caracteres
ASCII. N´ os definimos trˆes categorias para classificar tweets
de acordo com a presen¸ ca de emoticons: positivo, negativo
ou neutro. A tabela 1 apresenta os emoticons utilizados, o
n´ umero de tweets em cada categoria. Note que n´os classi-
ficamos somente os tweets com localiza¸c˜ ao geogr´ afica, que
s˜ao os que utilizaremos em nossas an´alises.
3.4 Limitação dos dados
Apesar do conjunto de dados coletado nos permitir a opor-
tunidade ´ unica de estudar as caracter´ısticas da twitteresfera
brasileira, esses dados possuem algumas limita¸c˜ oes. Pri-
meiro, nossa an´alise ´e restrita ao per´ıodo coletado do Twit-
ter, que cont´em dados desde a cria¸c˜ ao do Twitter em 2006
at´e Julho de 2009, que ´e um per´ıodo no qual o Twitter era
muito mais popular nos EUA. Segundo, para examinar a lo-
caliza¸c˜ ao geogr´ afica dos usu´arios, n´os consideramos que cada
usu´ario possui uma ´ unica localiza¸c˜ ao fixa, desconsiderando
que usu´arios podem postar tweets de diferentes localidades.
Finalmente, 21,5% dos usu´arios investigados tiveram suas
Categoria Emoticons Tweets
Positivo :-) :D :) =D =) 2.244.628
Negativo :-( :( D: ): T.T =\~ :\~ :’( =[
T T :’-( :,( ]= )-: :,-( ),: :-’(
=-[ :-,(
468.903
Neutro 26.300.323
Tabela 1: Categorias de tweets de acordo com a pre-
sen¸ ca de emoticons
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 3 -
localiza¸c˜ oes identificadas.
4. USUÁRIOS E TWEETS POR REGIÃO
Nesta se¸c˜ ao apresentamos uma an´alise do n´ umero de usu´a-
rios do Twitter com rela¸c˜ ao `a popula¸c˜ao de cada estado e
`a propor¸c˜ ao da popula¸c˜ ao com acesso ` a internet, a partir
de dados do Instituto Brasileiro de Geografia e Estat´ıstica
(IBGE) [2]. A Tabela 2 apresenta o n´ umero de usu´arios
do Twitter, o n´ umero de tweets, a popula¸c˜ ao em 2007 e o
percentual da popula¸ c˜ ao com acesso ` a internet (2008), para
cada um dos estados brasileiros e agregados por regi˜ao. As
duas ´ ultimas colunas apresentam, respectivamente, a m´edia
de tweets enviados por usu´ario para cada estado (usu´ arios
ativos: raz˜ao entre o n´ umero de tweets e o n´ umero de usu´a-
rios), e o percentual da popula¸c˜ ao que usa o Twitter (raz˜ao
entre o n´ umero de usu´arios e a popula¸c˜ao de cada estado).
Observando o percentual da popula¸ c˜ ao que usa o Twitter,
vemos que as unidades da federa¸c˜ ao que mais usam o Twitter
s˜ao Distrito Federal, S˜ao Paulo e Rio de Janeiro, com 0,21%
da popula¸c˜ao, seguidos pelos estados do Sul (Santa Catarina,
Paran´a e Rio Grande do Sul), todos com 0,11%. Em geral,
o Norte ´e a regi˜ao que menos usa o Twitter, seguido pela
regi˜ao Nordeste e logo pela regi˜ao Centroeste.
Observando a coluna com a m´edia de tweets enviados por
usu´ario, de forma geral vemos que as unidades da federa¸c˜ ao
com mais usu´arios em propor¸c˜ ao `a popula¸c˜ ao s˜ao tamb´em
as unidades com os usu´arios mais ativos. Este dado pode ser
consequˆencia do pr´oprio fato do uso ser maior entre as pes-
soas no estado, uma vez que h´a influencia do meio social que
a pessoa est´a inserida no comportamento da pessoa (neste
caso o comportamento ´e usar de forma ativa o Twitter como
ferramenta social). Apesar dessa observa¸c˜ ao geral, ela n˜ao ´e
uma regra. H´a estados como Pernambuco, Cear´a, Alagoas,
Piau´ı e Esp´ırito Santo que possuem alto ´ındice de usu´arios
ativos, mas poucos usu´arios em propor¸c˜ ao.
Observamos que n˜ao h´a uma correla¸c˜ ao entre o n´ umero de
usu´arios e a popula¸c˜ao dos estados. Por exemplo, v´arios es-
tados da regi˜ ao norte brasileira praticamente n˜ao possuem
usu´arios identificados em nossa base de dados. A Bahia
possui a maior popula¸c˜ao da regi˜ao nordeste e a quarta po-
pula¸c˜ ao do Brasil, mas ´e um dos estados que menos usam o
Twitter no Brasil. Em contrapartida, o Distrito Federal tem
uma baixa popula¸ c˜ ao e uma grande propor¸c˜ ao de usu´arios
no Twitter, ao passo que S˜ao Paulo tem a maior popula¸ c˜ ao
do Brasil e grande propor¸c˜ ao de usu´arios no Twitter.
Com rela¸c˜ ao ` a fra¸c˜ ao da popula¸c˜ ao com acesso ` a internet,
h´ a alguma rela¸c˜ ao com o uso do Twitter, mas n˜ao ´e uma
regra. Mais de 56% da popula¸c˜ao do Distrito Federal tem
acesso `a Internet (´ındice bem maior que dos demais esta-
dos), e ´e um dos que mais usam o Twitter. Entre os demais
estados que mais usam o Twitter (S˜ao Paulo, Rio de Ja-
neiro, Santa Catarina, Paran´a e Rio Grande do Sul), todos
possuem bom ´ındice de pessoas com acesso `a internet, com-
parando com os demais estados brasileiros e com a m´edia
nacional (32,7%). Por outro lado, h´a estados que tˆem boa
taxa de acesso `a internet, mas baixo uso do Twitter, como
Rio Grande do Norte e Mato Grosso do Sul.
Estudamos ainda se existe rela¸c˜ ao entre o uso do Twitter
e a renda m´edia mensal familiar dos estados e o PIB dos es-
tados, mas nenhuma rela¸c˜ ao foi observada. Por este motivo
n˜ao apresentamos estes dados na Tabela 2.
5. TERMOS FREQUENTES
Nesta se¸c˜ ao faremos uma an´alise dos termos mais frequen-
tes encontrados em tweets. A figura 1 apresenta a nuvem
dos 150 termos mais frequentes, sem qualquer filtro (inclu-
sive stop words foram mantidas).
Figura 1: Nuvem dos termos mais frequentes em
tweets
Alguns padr˜oes interessantes foram observados na lista
dos termos mais frequentes (considerando os 300 termos
mais frequentes). Primeiramente, vemos que h´a um grande
n´ umero de substantivos relacionados a tempo de alguma
forma, ou adjuntos adverbiais de tempo, como: dia, agora,
hoje, noite, tempo, semana, amanh˜a, sempre, hora, tarde,
ontem, nunca, anos, dias, sexta, ano, horas (nesta ordem
de frequˆencia). O Twitter parece ser uma ferramenta usada
para descrever fatos ou eventos que aconteceram recente-
mente, est˜ao acontecendo, ou v˜ao acontecer, o que justifica
a forte presen¸ca de termos indicadores de tempo.
Observamos tamb´em que o texto nos tweets s˜ao em geral
informais, com a presen¸ca de um conjunto de abrevia¸c˜ oes
comuns entre os usu´arios, como: d (de), q (que), p (para),
vc (vocˆe), ta (est´ a), pq (porque), gt (gente), tˆo (estou), hj
(hoje), s (sem), tava (estava), rs (risos), eh (´e), tb (tam-
b´em), tbm (tamb´em) (nesta ordem de frequˆencia). Ainda,
h´ a um conjunto de termos bem informais que muitas vezes
n˜ ao fazem parte do dicion´ario da l´ıngua portuguesa, mas
s˜ao usados com frequˆencia por um grande n´ umero de usu´a-
rios, como: s´o, cara, a´ı, hahaha, n´e, haha, legal, ah, hehehe,
hahahaha, hehe, oi, xd. Das formas utilizadas para expres-
sar um sorriso, ou uma risada, vemos que “hahaha”´e a mais
usuada, e que n˜ao h´ a um padr˜ ao ´ unico, sendo usadas ainda
as express˜oes: haha, hehehe, hahahaha, hehe, rs, xd.
A seguir analisamos os termos relacionados a tweets com
polaridade positiva e relacionados a tweets com polaridade
negativa. Dois conjuntos com os 1.000 termos mais frequen-
tes foram gerados: um somente dos tweets com polaridade
positiva e outro somente dos tweets com polaridade nega-
tiva. A diferen¸ca destes conjuntos foi usada para gerar duas
listas de termos: uma dos termos de tweets com polaridade
positiva que n˜ao ocorrem com frequˆencia em tweets com
polaridade negativa, e outra dos termos de tweets com pola-
ridade negativa que n˜ao ocorrem com frequˆencia em tweets
com polaridade positiva. As nuvens dos 150 termos mais
frequentes destas listas s˜ao apresentadas nas figuras 2 e 3,
respectivamente.
´
E interessante observar os termos que ocorrem em tweets
com polaridade positiva que n˜ao ocorrem com frequˆencia
em tweets com polaridade negativa, como: obrigado, adorei,
viva, ´otima, boas, bacana, bastante, beleza, sucesso, indico,
bons, rir, gostar, recomendo, concordo, bonito, divertido,
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 4 -
N´ umero de N´ umero de Popula¸c˜ao Percentagem do uso Usu´arios Perc. da popula¸ c˜ao
Estado usu´arios Tweets 2007 de internet 2008 ativos que usa o Twitter
Rondˆonia 0 0 1.453.756 31,0 0,0 0,000
Tocantins 596 72.500 1.243.627 31,3 121,6 0,047
Amap´a 267 31.066 587.311 31,3 116,4 0,045
Par´a 1.814 206.048 3.641.395 23,9 113,6 0,049
Amazonas 935 120.375 3.221.939 30,2 128,7 0,029
Roraima 59 1.401 7.065.573 35,3 23,7 0,001
Acre 304 18.139 655.385 29,4 59,7 0,046
Regi˜ao Norte 3.975 449.529 17.868.986 30,3 113,1 0,022
Alagoas 809 113.172 3.037.103 17,8 139,9 0,026
Pernanbuco 4.569 722.882 8.485.386 25,6 158,2 0,053
Rio Grande do Norte 1.956 263.550 3.013.740 43,2 134,7 0,064
Bahia 4.034 488.144 14.080.654 26,9 121,0 0,028
Para´ıba 1.710 223.584 3.641.395 26,4 130,8 0,047
Maranh˜ao 1.010 86.098 6.118.995 20,2 85,2 0,016
Sergipe 716 68.274 1.939.426 29,3 95,4 0,036
Cear´a 3.710 554.833 8.185.286 25,8 149,6 0,045
Piau´ı 838 119.015 3.032.421 20,2 142,0 0,027
Regi˜ao Nordeste 19.352 263.9552 51.534.406 26,2 136,4 0,037
Santa Catarina 6.527 999.253 5.866.252 40,2 153,1 0,111
Rio Grande do Sul 12.114 1.671.759 10.582.840 36,3 138,0 0,114
Paran´a 11.774 1.685.625 10.284.503 40,2 143,2 0,114
Regi˜ao Sul 30.415 4.356.637 26.733.595 38,9 143,2 0,113
S˜ao Paulo 84.584 12.895.459 39.827.570 43,9 152,5 0,212
Rio de Janeiro 33.247 4.953.433 15.420.375 40,9 149,0 0,215
Minas Gerais 1.5118 2.100.818 19.273.506 33,1 139,0 0,078
Esp´ırito Santo 1.714 241.625 3.351.669 35,3 141,0 0,051
Regi˜ao Sudeste 134.663 20.191.335 77.873.120 38,3 149,9 0,172
Distrito Federal 5.327 867.362 2.455.903 56,1 162,8 0,216
Mato Grosso 824 78.166 2.854.642 33,8 94,9 0,028
Mato Grosso do Sul 817 85.244 2.265.274 39,2 104,3 0,036
Goi´ as 3.341 346.029 5.647.035 35,2 103,6 0,059
Regi˜ao Centroeste 10.309 1.376.801 13.222.854 41,1 133,6 0,078
Total 198.714 29.013.854 187.232.961 32,7 146,0 0,106
Tabela 2: Dados de usu´arios e tweets do Twitter relacionados com dados do IBGE
Figura 2: Nuvem dos termos que ocorrem em twe-
ets com polaridade positiva que n˜ao ocorrem com
frequˆencia em tweets com polaridade negativa
engra¸cado, especial, parabens, querida, gra¸cas. Tamb´em ´e
interessante observar os termos que ocorrem em tweets com
polaridade negativa que n˜ao ocorrem com frequˆencia em twe-
ets com polaridade positiva, como: triste, droga, morreu, t´e-
dio, chorar, morrer, infelizmente, doente, sozinha, cansada,
raiva.
6. URLS MAIS PROPAGADAS
Mensagens no Twitter podem conter no m´ aximo 140 ca-
racteres. Tal restri¸c˜ao de espa¸co servi¸cos tem tornado encur-
Figura 3: Nuvem dos termos que ocorrem em twe-
ets com polaridade negativa que n˜ao ocorrem com
frequˆencia em tweets com polaridade positiva
tadores de URLs cada vez mais populares. Esses sistemas
funcionam da seguinte forma. Eles traduzem uma URL (que
pode consistir de centenas de caracteres) em uma nova URL,
tipicamente com poucos caracteres que retorna os c´ odigos
HTTP 301 ou 302 de redirecionamento para a URL longa
original [5]. Por exemplo, o link http://topics.nytimes.
com/top/news/business/companies/twitter/ pode ser en-
curtado para http://nyti.ms/1VKbrC pelo bit.ly [3], que ir´a
redirecionar qualquer requisi¸c˜ ao para o s´ıtio Web original.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 5 -
Para estudarmos os principais dom´ınios propagados no
Twitter, precisamos obter a vers˜ao longa de todas as URLs
encurtadas encontradas em nossa base. Para isso, desen-
volvemos uma ferramenta capaz de resolver a URL de um
tweet, enviando uma requisi¸c˜ ao ao sistema encurtador e re-
solvendo a URL. Se o dom´ınio obtido fosse diferente, n´os
consideramos a URL no tweet ser uma URL encurtada, se-
n˜ao, consideramos a URL como longa. Foram encontrados
30 servi¸cos encurtadores de URL nos dados de usu´arios bra-
sileiros, sendo que os servi¸cos tinyurl.com e bit.ly s˜ao os mais
populares com mais de 90% do total de URLs encurtadas.
Twitter Dom´ınio Alexa
1 twitpic.com 47
2 blip.fm 2654
3 lolquiz.com -
4 youtube.com 3
5 plurk.com 5141
6 ff.im -
7 tumblr.com 34
8 flickr.com 36
9 twitter.com 13
10 meadd.com 695
Tabela 3: Ranking de dom´ınios no Twitter e suas
respectivas popularidades no ranking do alexa.com
Com base nesses dados, podemos verificar se as URLs mais
compartilhadas por brasileiros no Twitter s˜ao URLs de do-
m´ınios populares na Web brasileira. Como forma de compa-
ra¸c˜ ao, n´os listamos os dom´ınios brasileiros mais populares
segundo o s´ıtio Web alexa.com [1], que mede o n´ umero de
acessos recebidos por diversos s´ıtios web. A tabela 3 apre-
senta os dom´ınios mais populares das URLs propagadas por
brasileiros no Twitter e suas respectivas posi¸c˜oes no ran-
king do alexa.com. De forma similar, a tabela 4 mostra o
ranking dos dom´ınios mais populares brasileiros segundo o
alexa.com e suas respectivas posi¸c˜oes no ranking dos dom´ı-
nios mais propagados no Twitter.
Podemos fazer v´arias observa¸c˜ oes interessantes a partir
dessas tabelas. O ranking do alexa.com ´e bastante diferente
do ranking dos dom´ınios propagados no Twitter. Em par-
ticular, o dom´ınio mais popular propagado nos tweets de
brasileiros ´e o twitpic.com, um sistema para permite o com-
partilhamento de fotos. No alexa.com, o s´ıtio web com maior
n´ umero de acessos ´e do Google, que aparece muito pouco nos
dados do Twitter. Ao observarmos os 100 dom´ınios mais
populares no Twitter notamos uma predominˆ ancia de do-
m´ınios de s´ıtios web associados a not´ıcias, entretenimento e
redes sociais. Apenas um s´ıtio web de compras aparece no
ranking, na posi¸c˜ ao 97. No ranking do alexa.com, al´em de
redes sociais, encontramos uma predominˆancia de sistemas
de busca, servi¸cos como o s´ıtio do banco Ita´ u na posi¸c˜ ao 23
e minist´erio da fazenda na posi¸ c˜ ao 41, al´em de dezessete sis-
temas de compra online, incluindo Mercado livre na posi¸c˜ ao
17, buscape na posi¸c˜ao 30 e submarino na posi¸c˜ ao 34.
7. USUÁRIOS INFLUENTES NO BRASIL
Usu´arios influentes possuem uma fun¸c˜ ao vital em qual-
quer ecossistema, devido `a associa¸ c˜ ao da no¸c˜ ao influˆencia `a
no¸c˜ ao de poder de formar a opini˜ao de outras pessoas, afe-
tando funcionalidades da sociedade, como por exemplo, em
quem eleitores votam [8] ou como uma determinada moda se
espalha [13]. Apesar de amplamente estudada em diferentes
Alexa Dom´ınio Tweets
1 google.com.br -
2 google.com 78
3 youtube.com 4
4 facebook.com 65
5 uol.com.br -
6 orkut.com.br 16
7 live.com -
8 globo.com 11
9 blogspot.com -
10 yahoo.com -
Tabela 4: Ranking dos dom´ınios no alexa.com e suas
respectivas popularidades no ranking do Twitter
´areas, tais como sociologia, marketing e ciˆencia pol´ıtica [19],
a no¸ c˜ ao de influˆencia nunca foi quantificada nesses contextos
por se tratar de um conceito vago e dif´ıcil de ser quantifi-
cado. Entretanto, com a enorme popularidade do Twitter,
v´arias id´eias conflitantes e algoritmos para a identifica¸ c˜ ao de
usu´arios influentes no Twitter vˆem surgindo.
V´ arias m´aquinas de busca, incluindo o Google, estimam
a importˆancia dos tweets baseados no Pagerank na tenta-
tiva de retornar tweets mais “importantes” como resultado
de buscas [22]. O PageRank ´e um algoritmo interativo que
assinala um peso num´erico para cada nodo com o prop´osito
de estimar sua importˆancia relativa no grafo. O algoritmo
foi inicialmente proposto por Brin e Page [9] para ordenar
resultados de busca do prot´ otipo de m´aquina de busca da
Google. A intui¸c˜ ao por tr´ as do PageRank ´e que um usu´ario
do Twitter ´e importante se existem muitos usu´arios o se-
guindo ou existem outros usu´arios importantes o seguindo.
A equa¸c˜ao que calcula o PageRank (PR) de um usu´ario i,
PR(i), ´e definida da seguinte forma:
PR(i) = (1 −d) +d
X
v∈S(i)
PR(v)
N
v
(1)
onde S(i) ´e o conjunto de usu´ arios que seguem i, N
v
deno-
mina o n´ umero de arestas que saem do nodo v, e o parˆametro
d ´e um fator que pode ter valor entre 0 e 1. Em nossos expe-
rimentos, o Pagerank foi computado para o grafo completo
do Twitter e n˜ao somente para os usu´ arios brasileiros, visto
que o uso de uma amostra do grafo para o c´ alculo do Page-
rank pode alterar significativamente os resultados. O valor
do parˆ ametro d utilizado foi o valor padr˜ao de 0,85, definido
em [9].
Apesar de sua imensa aplicabilidade, o Pagerank ainda
n˜ ao foi rigorosamente verificado como m´etrica capaz de cap-
turar os usu´ arios mais relevantes do Twitter. Algumas ce-
lebridades, como Barack Obama, s˜ao seguidos por muitos
usu´arios, mas tamb´em os seguem de volta tornado esses
usu´arios importantes e, possivelmente afetando o uso do
Pagerank como medida de influˆencia. Trabalhos recentes
mostraram a existˆencia de um grande n´ umero de spammers
no Twitter que atuam seguindo automaticamente de usu´a-
rios no Twitter na tentativa de ser seguido de volta e ter
sua influˆencia aumentada [7]. Al´em disso, Cha e seus co-
laboradores [10] mostraram que usu´arios que possuem mui-
tos seguidores no Twitter n˜ao s˜ao necessariamente usu´arios
muito retweetados. O n´ umero de retweets funciona como
um indicador da habilidade de um usu´ario gerar conte´ udo
com valor suficiente para ser passado para a frente. Alguns
s´ıtios web com prop´osito comercial tˆem ganhado populari-
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 6 -
dade ao prover o Retweetrank de usu´arios comuns, como
´e o caso do www.retweetrank.com. Sendo assim, al´em do
Pagerank, vamos considerar como medida de influˆencia o
retweetRank, que ´e o ranking de usu´arios mais retweetados.
Para isso, foi preciso compararmos cada tweet postado pelos
usu´arios brasileiros com os tweets postados posteriormente
pelos seus seguidores na tentativa de identificar potenciais
retweets. Um retweet ocorre quando um usu´ario posta uma
mensagem com os seguintes padr˜oes RT @usu´ario ou via
@usu´ario ao final do tweet.
A tabela 5 mostra os 10 usu´arios brasileiros mais bem
ranqueados de acordo com Pagerank e suas respectivas po-
si¸c˜ oes de acordo com o Retweetrank. De maneira seme-
lhante, a tabela 6 mostra o ranking dos usu´arios de acordo
com Retweetrank e suas respectivas posi¸c˜ oes de acordo com
o Pagerank. Podemos fazer interessantes observa¸c˜ oes sobre
essas tabelas. Primeiro, podemos notar que o usu´ario com
maior Pagerank ´e o usu´ario @manomenezes, que ´e o perfil
do atual t´ecnico da sele¸c˜ao brasileira de futebol, Mano Me-
nezes.Entretanto, o usu´ario mais retweetado ´e o jornalista
Marcelo Tas (@marcelotas), apresentador do programa de
televis˜ao CQC. Apesar de muito seguido, o t´ecnico Mano
Menezes aparece apenas na posi¸c˜ ao 64 do ranking dos mais
retweetados. De fato, usu´arios do Twitter podem estar mais
interessadas em receber em primeira m˜ao as informa¸c˜ oes de
um t´ecnico de futebol, mas n˜ao necessariamente repass´a-las
aos seus seguidores. Outra importante observa¸c˜ ao ´e rela-
cionada ao grande n´ umero de artistas brasileiros entre os
mais influentes, especialmente aqueles ligados a programas
de humor.
Pagerank Usu´ario Retweetrank
1 manomenezes 64
2 marcelotas 1
3 DaniloGentili 13
4 marcoluque 26
5 ivetesangalo 91
6 kibeloco 2
7 rodrigovesgo 20
8 christianpior 6
9 OscarFilho 22
10 andreolifelipe 100
Tabela 5: Posi¸ c˜ao dos 10 usu´arios com maior Page-
rank no ranking do Retweetrank
Retweetrank Usu´ario Pagerank
1 marcelotas 2
2 kibeloco 6
3 rosana 12
4 Cardoso 58
5 melhoresfrases 17
6 christianpior 8
7 millorfernandes 15
8 esoterismo 209
9 abduzeedo 33
10 malvados 55
Tabela 6: Posi¸ c˜ao dos 10 usu´arios com maior Retwe-
etrank no ranking do Pagerank
Apesar de oferecer uma vis˜ao geral sobre os usu´arios mais
influentes no brasil, nossas an´alises apontam usu´arios da
twitteresfera brasileira com maior potencial de influenciar
um grande n´ umero de pessoas. Entretanto, influˆencia pode
variar de acordo com as diferentes regi˜oes brasileiras, espe-
cialmente em um pa´ıs t˜ao vasto como o Brasil. De fato,
empresas ligadas a estrat´egias de marketing boca-a-boca no
Brasil podem estar mais interessadas em identifcar usu´arios
que sejam influentes locais em determinadas regi˜oes do que
usu´arios j´a famosos na televis˜ao e que s˜ao consequentemente
populares no Twitter.
Como forma de identificar tais usu´arios, a Tabela 7 mos-
tra os 10 usu´arios mais influentes de cada regi˜ao do Brasil de
acordo com o Pagerank e sua posi¸c˜ ao no ranking geral. De
maneira similar, a Tabela 8 mostra os 10 usu´arios mais influ-
entes de cada regi˜ao do Brasil de acordo com o Retweetrank
e sua posi¸c˜ ao no ranking geral. Note que al´em das cele-
bridades, a maioria concentrada na regi˜ao sudeste, nossas
rankings de usu´arios influentes reveleram a existˆencia de in-
fluentes locais em diversas regi˜oes. Como exemplo, o usu´ario
@diariodopara, na regi˜ao norte aparece na posi¸ c˜ ao 1505 no
ranking brasileiro do Pagerank, mas ´e o d´ecimo usu´ario mais
influente de toda a regi˜ ao Norte, tendo uma atua¸ c˜ ao ainda
mais importante no estado do Par´a. J´a no caso de retweets,
o usu´ario @Cardoso se mostrou mais retweetado at´e mesmo
do que o usu´ario @marcelotas na regi˜ao nordeste, que apa-
rece em primeiro lugar nos demais estados. Tais observa¸c˜ oes
sugerem que algumas regi˜oes podem possuir influentes locais
que, dependendo da regi˜ao, podem representar uma melhor
op¸ c˜ ao para a realiza¸ c˜ ao de uma a¸c˜ ao de marketing e propa-
ganda.
8. CONCLUSÕES
Este trabalho apresenta uma ampla an´ alise geogr´afica dos
usu´arios brasileiros no Twitter e de seus tweets. Nossas
an´ alises revelam que alguns estados brasileiros est˜ao subes-
timados no Twitter em rela¸c˜ao a dados demogr´aficos, sendo
que caracter´ısticas s´ocio-econˆomicas desses estados parecem
influenciar no n´ umero de usu´arios do Twitter. Al´em disso,
nossas an´alises ainda revelam padr˜oes lingu´ısticos associa-
dos ao uso de microblogs no Brasil, identificando palavras
geralmente associadas a contextos felizes e tristes. Nossas
an´alises revelam as URLs mais postadas por brasileiros no
Twitter e mostra que essas n˜ao s˜ ao as mais acessadas na
web de maneira geral. Por ´ ultimo, identificamos os usu´arios
brasileiros mais influentes no Twitter e mostramos que o
ranking de influˆencia varia em diferentes regi˜oes brasileiras.
Como ´ ultima contribui¸ c˜ ao, cabe ressaltar que a metodolo-
gia aqui empregada em diversas an´alises pode guiar futuras
an´alises relacionadas ao Twitter.
Como trabalhos futuros, pretendemos desenvolver uma
ferramenta de busca, de forma a permitir que usu´arios web
possam extrair informa¸c˜ oes de nossa base de dados. Em ou-
tras palavras pretende-se desenvolver as bases de um sistema
que permita que interessados possam entender a repercuss˜ao
e a opini˜ao de usu´arios do Twitter sobre eventos ocorridos
no passado em diferentes localiza¸c˜ oes geogr´aficas. Exemplos
de cen´ arios que esperamos identificar com essa ferramenta
s˜ao: (i) epidemia de dengue afeta negativamente o humor
das pessoas, onde pela nuvem de tags poderemos ver no-
mes e entidades criticadas; (ii) a vit´oria do Rio de Janeiro
como sede das Olimp´ıadas de 2016 causou enorme alegria
aos brasileiros; vit´oria de um determinado time de futebol
gera alegria em uma regi˜ao e infelicidade em outra; (iii) quais
as regi˜oes receberam positivamente/negativamente o lan¸ca-
mento de um novo produto.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 7 -
Top Norte Top Nordeste Top Centro-oeste Top Sudeste Top Sul
DiscoLee (151) ivetesangalo (5) bfeneto (18) manomenezes (1) abduzeedo (33)
talivale (767) sigacl (30) passagensaereas (37) marcelotas (2) federicodevito (43)
jerilsonduarte (836) comunicadores (66) WelderMM (62) DaniloGentili (3) piangers (46)
DEZMinutos (903) murilogun (96) oab brasil (167) marcoluque (4) garotasemfio (75)
educhaves (1051) gilbertogil (124) consumidor gov (227) kibeloco (6) lucasfresno (82)
asttro (1093) scheilacarvalho (138) brazilians (238) rodrigovesgo (7) nanypeople (91)
joaopedrosenado (1122) m camelo (168) agenciabrasil (301) christianpior (8) bobagento (102)
jenizambiazzi (1255) LisiSilveira (187) AlonFeuerwerker (431) OscarFilho (9) azaghal (106)
pedrox (1451) Danosse (230) jorgeemateus (450) andreolifelipe (10) laumundial (102)
diariodopara (1505) veramartins (248) comediamm (464) oceara (11) anderssauro (164)
Tabela 7: Top influentes de cada regi˜ao de acordo com o Pagerank e sua posi¸c˜ao no ranking geral
Top Norte Top Nordeste Top Centro-oeste Top Sudeste Top Sul
pedrox (306) Cardoso (4) marcelotas (1) marcelotas (1) marcelotas (1)
Cardoso (4) marcelotas (1) kibeloco (2) rosana (3) Cardoso (4)
kibeloco (2) rosana (3) Cardoso (4) kibeloco (2) kibeloco (2)
marcelotas (1) kibeloco (2) rosana (3) Cardoso (4) rosana (3)
rosana (3) melhoresfrases (5) melhoresfrases (5) melhoresfrases (5) millorfernandes (7)
diariodopara (838) christianpior (6) christianpior (6) christianpior (6) melhoresfrases (5)
melhoresfrases (5) millorfernandes (7) millorfernandes (7) millorfernandes (7) tplayer (25)
christianpior (6) comunicadores (11) inagaki (15) malvados (10) tiagomx (103)
millorfernandes (7) malvados (10) malvados (10) esoterismo (8) christianpior (6)
paolelli (1022) inagaki (15) samara7days (16) comunicadores (11) malvados (10)
Tabela 8: Top influentes de cada regi˜ao de acordo com o Retweetrank e sua posi¸c˜ao no ranking geral
9. AGRADECIMENTOS
O presente trabalho foi realizado com o apoio do UOL
(www.uol.com.br), atrav´es do Programa UOL Bolsa Pes-
quisa, processo n´ umero 20110210152501.
10. REFERÊNCIAS
[1] Alexa, the web information company.
http://www.alexa.com. Accessed in March/2010.
[2] Arquivos do ibge.
http://www.ibge.gov.br/servidor arquivos est.
[3] Bit.ly. http://www.bit.ly.
[4] There Are Now 155m Tweets Posted Per Day, Triple the
Number a Year Ago. http://rww.to/gv4VqA, April 2011.
[5] D. Antoniades, I. Polakis, G. Kontaxis, E. Athanasopoulos,
S. Ionnadis, E. P. Markatos, and T. Karagiannis. we.b: The
web of short URLs. In Int’l World Wide Web Conference
(WWW), 2011.
[6] F. Benevenuto, J. Almeida, and A. Silva. Coleta e an´alise de
grandes bases de dados de redes sociais online. In Jornadas
de Atualiza¸ c˜ ao em Inform´ atica (JAI), pages 11–57. 2011.
[7] F. Benevenuto, G. Magno, T. Rodrigues, and V. Almeida.
Detecting spammers on twitter. In Annual Collaboration,
Electronic messaging, Anti-Abuse and Spam Conference
(CEAS), 2010.
[8] J. Berry and E. Keller. The Influentials: One American in
Ten Tells the Other Nine How to Vote, Where to Eat, and
What to Buy. Free Press, 2003.
[9] S. Brin and L. Page. The anatomy of a large-scale
hypertextual web search engine. Computer Networks and
ISDN Systems, 30(1-7):107–117, 1998.
[10] M. Cha, H. Haddadi, F. Benevenuto, and K. Gummadi.
Measuring User Influence in Twitter: The Million Follower
Fallacy. In Int’l AAAI Conference on Weblogs and Social
Media (ICWSM), 2010.
[11] S. Chhabra, A. Aggarwal, F. Benevenuto, and
P. Kumaraguru. Phi.sh/$ocial: The phishing landscape
through short urls. In Annual Collaboration, Electronic
messaging, Anti-Abuse and Spam Conference (CEAS),
2011.
[12] comScore. The netherlands ranks number 1 worldwide in
penetration for twitter and linkedin.
http://bit.ly/hOpdAb, 2011.
[13] M. Gladwell. The Tipping Point: How Little Things Can
Make a Big Difference. Back Bay Books, 2002.
[14] J. Gomide, A. Veloso, W. M. Jr., V. Almeida,
F. Benevenuto, F. Ferraz, and M. Teixeira. Dengue
surveillance based on a computational model of
spatio-temporal locality of twitter. In ACM SIGWEB Web
Science Conference (WebSci), 2011.
[15] Google Geocoding API. http://code.google.com/intl/en/
apis/maps/documentation/geocoding/.
[16] H. Kwak, C. Lee, H. Park, and S. Moon. What is twitter, a
social network or a news media? In Int’l World Wide Web
Conference (WWW), pages 591–600, 2010.
[17] K. Lee, B. Eoff, and J. Caverlee. Seven months with the
devils: A long-term study of content polluters on twitter. In
Int’l AAAI Conference on Weblogs and Social Media
(ICWSM), 2011.
[18] T. Rodrigues, F. Benevenuto, M. Cha, K. P. Gummadi,
and V. Almeida. On word-of-mouth based discovery of the
web. In ACM SIGCOMM Internet Measurement
Conference (IMC), 2011.
[19] E. M. Rogers. Diffusion of Innovations. Free Press, 1962.
[20] T. Sakaki, M. Okazaki, and Y. Matsuo. Earthquake shakes
twitter users: real-time event detection by social sensors. In
WWW ’10: Proceedings of the 19th international
conference on World wide web, pages 851–860, 2010.
[21] S. Scellato, C. Mascolo, M. Musolesi, and J. Crowcroft.
Track Globally, Deliver Locally: Improving Content
Delivery Networks by Tracking Geographic Social Cascades.
In Int’l World Wide Web Conference (WWW), 2011.
[22] D. Talbot. How Google Ranks Tweets.
http://www.technologyreview.in/web/24353/, Jan 2010.
[23] T. N. Y. Times. Google Adds Live Updates to Results,
December 2009. http://nyti.ms/cnszI5.
[24] A. Tumasjan, T. Sprenger, P. Sandner, and I. Welpe.
Predicting elections with twitter: What 140 characters
reveal about political sentiment. 2010.
[25] L. Rao, Twitter Seeing 90 Million Tweets Per Day, 25
Percent Contain Links, TechCrunch, 2010.
http://tinyurl.com/27x5cay.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 8 -
Uma Investigação sobre os ³Assuntos do Momento´ e a
Discussão de Notícias no Serviço de Microblogging
Twitter
Karen da Silva Figueiredo Ana Cristina Bicharra Garcia
Instituto de Computação (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
kfigueiredo@ic.uff.br
Instituto de Computação (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
bicharra@ic.uff.br

ABSTRACT
Microblogging services like Twitter are a great opportunity oI
research to study patterns oI social interaction, given that, every
day,thosesystemsreachthousandsoIuserswhoshareandspread
inIormation through the network. In this paper we present an
investigation on the most commented topics on Twitter, called
Trend Topics, in order to identiIy: the real-world events which
thesetopicsarediscussing,thecompositionoIthemessagesabout
these topics, and the relationship between these topics and the
news Irom the online news medias. The analysis was perIormed
on a sample oI more than 500 000 tweets, 530 trend topics and
morethan3900newscollectedduringoneweek.
CategoriesandSubjectDescriptors
H.5.3 |Information Interfaces and Presentation|: Group and
Organization InterIaces collaborative computing, web-basea
interaction.
GeneralTerms
Measurement,HumanFactors.
Keywords
Twitter, Microbbloging, Online social network, InIormation
diIIusion,NewsdiIIusion,TrendTopics.
RESUMO
Serviços de microblogging como o Twitter são excelentes
oportunidades para pesquisas de padrões sociais de interação,
tendoemvistaquetodososdiasestessistemasalcançammilhares
deusuariosquecompartilhamedivulgaminIormaçõesatravésda
rede. O presente trabalho apresenta uma investigação sobre os
assuntos mais comentados no serviço de microblogging Twitter,
denominados 'Assuntos do Momento¨, a Iim de compreender do
que se tratam tais assuntos, i.e. a quais eventos do mundo real
estes assuntos estão relacionados, quais as caracteristicas das
mensagens sobre estes assuntos e qual é a relação entre estes
assuntos e as noticias divulgadas online. A realização da analise
Ioi executada em uma amostra de mais de 500 mil tweets, 530
'Assuntos do Momento¨ e mais de 3900 noticias coletados
duranteumasemana.

CategoriaseDescritoresdeAssuntos
H.5.3|InterfacesdeInformaçãoeApresentação|:InterIacesde
Grupo e Organização computação colaborativa, interação
baseaaaemweb.
TermosGerais
Medição,FatoresHumanos.
Palavras-chave
Twitter, Microbbloging, Redes sociais online, DiIusão de
InIormações,DiIusãodenoticias,AssuntosdoMomento.
1. INTRODUÇÃO
Serviços de microblogging e redes sociaiselevaramasIormasde
comunicação mediadas por computador a um novo patamar,
tornando-se alvos de pesquisas por oIerecem uma excelente
oportunidade para estudar padrões sociais de interação tendo em
vista que estes sistemas alcançam milhares de usuarios todos os
dias.
Osserviçosdemicrobloggingpermitemqueusuariosdivulgueme
compartilhem inIormações sobre as suas atividades, opiniões e
status|1|.Entrevariosdestesserviçosdemicrobloggingtalvezo
Twitter |2| seja o mais popular atualmente. Além de ser um
microblogging que oIerece suporte a criação de conteudos pelo
usuario(comumlimitede140caracteres),tambémconstituiuma
redesocialpoispermiteaosseususuariosseguiremaspaginasde
conteudos de outros usuarios (e tenham suas paginas seguidas),
criandovinculosentreestes.
Algumasdaspesquisasquetêmsidodesenvolvidasnodominiode
microblogging, analisam o Twitter a Iim de entender como
ocorrem: (i) a criação de conteudos pelos usuarios |1|; (ii) as
relaçõesdeamizadenarede|3|,|4|;(iii)aIormaçãodeconversas
e processos colaborativos |3|, |5|, |6|; e (iv) a propagação de
inIormaçõesdentrodarede|4|,|7|,|8|.
EsoboviésdapropagaçãodeinIormaçõesnaredequeopresente
trabalhoestalocalizado.Oobjetivodestapesquisaéinvestigar:(i)
quaissãoosassuntosmaiscomentadospelosusuariosnoTwitter;
(ii) a quais eventos do mundo real estes assuntos estão
relacionados; (iii) quais as caracteristicas das mensagens sobre
estes assuntos; e (iv) qual é a aIinidade entre estes assuntos e as
noticiasdivulgadasonline.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 9 -
A partir dessa seção, o restante deste artigo esta organizado da
seguinte Iorma: na Seção 2 o Twitter e suas principais
caracteristicas são apresentadas; na Seção 3 alguns trabalhos
relacionados são brevemente tratados; na Seção 4 o processo de
investigação da pesquisa é detalho, nela são descritos acoletade
dados e os resultados obtidos; e na Seção 5 as conclusões e
trabalhosIuturossãodiscutidos.
2. OTWITTERESUAS
CARACTERISTICAS
O Twitter, como dito anteriormente, é tanto um serviço de
microblogging, quanto uma rede social. E um sistema
colaborativo|6|queoIerecesuporteacriaçãodeconteudospelos
seususuariosquandoosmesmosrespondemaperguntaexibidana
pagina inicial do sistema: 'O que esta acontecendo?¨. Esta
respostadeveternomaximo140caractereseédenominadatweet.
Oconjuntodetweetsproduzidosporumusuarioconstituemasua
linha do tempo que é disponibilizada para todos em sua pagina,
caso o usuario permita. Usuarios podem seguir as paginas de
outros usuarios e, a partir de então, os primeiros começam a
receberostweetsdosusuariosseguidosdiretamentenasuapagina
inicial.
Oquestionamentoconstantedaperguntaexibidanapaginainicial
e o limite de 140 caracteres incentivam uma Irequência maior de
produção de conteudo pelo usuario e a disponibilidade de uma
versão mobile do sistema Iacilita ainda mais o compartilhamento
deinIormaçõesemtemporeal.
O serviço também possui caracteristicas peculiares que o tornam
mais atrativo e Iacilitam a diIusão deconteudonarede.Algumas
destascaracteristicassãolistadasedescritasaseguir:
x Menções: um usuario pode citar outro usuarioemseu tweet
através de uma menção. Essa menção é Ieita utilizando o
simbolode¸seguidodonomedousuarioasermencionado.
A menção pode ser utilizada como uma Ierramenta para
chamar a atenção de um usuario para o conteudodo tweete
parainiciarconversasentreosusuariosnarede|6|.
x Retweets: caso um usuario considere interessante o tweetde
outro usuario ele pode utilizar este tipo especial de menção
chamadoretweet.Atravésdoretweetousuariocompartilhao
conteudo do tweet de outro usuario com os seus seguidores
mantendo o crédito do seu produtor. O retweet pode ser
realizado de Iorma automatica através da Iuncionalidade
Retweetar do sistema, ou de Iorma manual caracterizado
geralmente com um 'RT¨ no inicio da mensagem seguido
pela menção e pelo tweet original do usuario Ionte. Outras
Iormasderetweetssãodiscutidasem|9|.
x Hashtags:umusuariopodedestacarumtermoemseutweet
preIixando-o com o simbolo '#¨. Termos destacados desta
Iorma são conhecidos como hashtags e são utilizados como
umaIormadeindicaroteordoconteudodotweet.OTwitter
geraumlinkparacadahashtagque,aoserselecionado,leva
a uma busca que tem como resultado os ultimos tweets de
todososusuariosdaredequecontenhamotermodahashtag.
x Assuntos do Momento (1rend 1opics, em inglês): na
paginainicialdecadausuarioéexibidaumalistaquecontém
os 10 termos mais comentados em todos os tweets ou nos
tweets de usuarios de determinada região (escolhida pelo
usuario). Tais termos denominados como 'Assuntos do
Momento¨ podem ser hashtags ou uma sequência de
palavrasiniciadascomletrasmaiusculas.Cadatermodalista
de 'Assuntos do Momento¨ Iunciona como um atalho para
uma busca que retorna como resultado os ultimos tweets de
todososusuariosdaredequecontenhamaqueletermo.
x Busca e operadores de busca: o Twitter oIerece uma
Ierramenta de busca que pode apresentar como resultados
para o termo de entrada: ultimos tweets, imagens e videos
divulgadosatravésdeURLsnostweetseusuarios.Umasérie
de operadores pode ser usada em conjunto com o termo
desejado na entrada para reIinar os resultados da busca, tais
como: operadores de localidade, operadores de idioma,
operadorestemporais,etc.
x Operadores de atitudes: compõem um subconjunto dos
operadores de busca que reIinam os resultados do termo de
entrada. São estes operadores: ':)¨ e ':(¨. O operador ':)¨
Iiltra os resultados exibindo apenas tweets com uma atitude
positiva em relação a entrada da busca. De Iorma oposta, o
operador ':(¨ exibe os tweetsresultantesqueexpressemuma
atitudenegativaemrelaçãoaentradadabusca.
As caracteristicas apresentadas tornam a navegação na rede e a
comunicação entre os usuarios mais dinâmica, motivando o
compartilhamento de inIormações e opiniões como ja
demonstrado em |1| e |4|. O presente trabalho tem como Ioco a
analise dos 'Assuntos do Momento¨ e as caracteristicas dos
tweetsrelacionadosaestesassuntos:numerodemenções,numero
deretweets,numerodeURLsequantidadedeatitudespositivase
negativas.
3. TRABALHOSRELACIONADOS
Em |1| o primeiro estudo sobre as propriedades topologicas e
geograIicas do serviço de microblogging Twitter Ioi executado.
Os autores analisaram as intenções dos usuarios e a tendência de
usuarios com intenções similares de se conectarem. E, ainda em
|1|, os autores classiIicaram os usuarios da rede em três tipos
principais: Iontes de inIormações, amigos e buscadores de
inIormações. Esta classiIicação conIirma que os usuarios do
TwitterenxergamaredecomoumconcentradordeinIormações.
Outra caracteristica de |1| Ioi a utilização de um método para
calcular quais termos eram os mais comentados durante
determinado dia da semana, algo muito similar aos 'Assuntos do
Momento¨. Na época da pesquisa |1| ainda não exista a
Iuncionalidade 'Assuntos do Momento¨ no Twitter
1
. Uma vez
calculadosostermosmaiscomentados,osautoresclassiIicaramos
termos em três categorias: 'Programas de TV¨, 'Eventos Atuais¨
e 'Atividades¨. Uma abordagem semelhante a esta categorização
dotrabalho|1|érealizadanesteartigonaSeção4.
Em |6| o aspecto colaborativo do Twitter Ioi observado com o
objetivodedeterminaroquantoassuasIuncionalidadesIacilitam
a troca de inIormações entre usuarios. No Iinal do trabalho são
discutidas modiIicações de aesign que tornariam o Twitter uma
Ierramenta melhor para colaboração. Metade destas modiIicações
apontadas pelos autores de |6| ja estão disponiveis na rede
atualmente, dentre elas aIuncionalidadedebuscamencionadana
Seção 2, essencial para a elaboração deste trabalho (veja mais
detalhesnaSeção4).

1
A Iuncionalidade 'Assuntos do Momento¨ surgiu em 2008.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 10 -
Kwak et al. |4| também apresentaumaanalisedascaracteristicas
topologicas do Twitter, porém com enIoque no poder da rede de
compartilhar inIormações. O estudo trata do comportamento
temporal dos 'Assuntos do Momento¨ e da propagação de
inIormações através de sequências de retweets. Além disso, os
autores comparam os termos da lista de 'Assuntos do Momento¨
com os termos do Google Trena e as manchetes da rede CNN.
Entretanto, não são relatados dados reIerentes a comparação dos
'Assuntos do Momento¨ com a CNN, a unica inIormação
discutida no artigo é a de que a CNN estaria em mais da metade
dasvezesaIrentenadivulgaçãodenoticiasdoqueoTwitter.
Trabalhos sobre a propagação de inIormações semelhantes a |4|
Ioram executados previamente em outras redes sociais |10| e
serviçosdeblogging|11|.Entretanto,atéondeédoconhecimento
dosautoresdopresenteartigo,nãoexistemtrabalhosrelacionados
adiscussãodenoticiasnestessistemasounoTwitter.
4. OPROCESSODEINVESTIGAÇÃO
NestaseçãooprocessodeinvestigaçãorealizadoaIimdeanalisar
os 'Assuntos do Momento¨ e a discussão de noticias no Twitteré
detalhado. Esta investigação tem como objetivos identiIicar: (i)
quaissãoosassuntosmaiscomentadospelosusuariosnoTwitter;
(ii) quais eventos do mundo real estão relacionados a estes
assuntos; (iii) quais assuntos estão relacionados as noticias
divulgadas online; (iv) quais as caracteristicas das mensagens
sobre os assuntos mais comentados, especialmente sobre os
assuntosidentiIicadosnoitem(iii).
Na Seção 4.1 o método utilizado para a coleta dos dados é
descritoenaSeção4.2osresultadosobtidossãodiscutidos.
4.1 AColetadosDados
ParaacoletadosdadosIoidesenvolvidoumwebcrawleremJava
|12|utilizandoasbibliotecasTwitter4J|13|paraaconexãocomo
TwittereROME|14|paraaconexãocomcentraisdenoticias.
A cada cinco minutos o web crawler copiava a lista dos atuais
'Assuntos do Momento¨
2
do Twitter e realizava três buscas para
cada um desses assuntos, copiando também os seus resultados.
Foram utilizadas como entradas para os três tipos de busca: (i) o
termodoassunto;(ii)otermodoassuntoseguidodooperadorde
atitudes positivas;e(iii)otermodoassuntoseguidodooperador
deatitudesnegativas.
Na mesma periodicidade de cinco minutos, Ioram coletadas
manchetes e datas de publicação de noticias de três centrais de
noticiasonline
3
.
AcoletadedadosIoiexecutadaentreosdias18e24dejunhode
2011, constituindo um intervalo de sete dias (uma semana).

2
A lista de 'Assuntos do Momento¨ é determinada regionalmente
pelo Twitter. A lista coletada neste trabalho Ioi a lista de
'Assuntos do Momento¨ da região: 23424768 'Bra:il
Country¨.
3
As centrais de noticias escolhidas para este trabalho Ioram G1
|15|, R7 |16| e Google Noticias Brasil |17|. A escolha destas
centraisIoideterminadapelapopularidadedasduasprimeirase
pelo Iato da ultima apresentar uma coletânea das principais
centraisdoBrasil.
Durante este periodo Ioram coletados mais de 500 mil tweets
4
,
530 'Assuntos do Momento¨ e mais de 3900 noticias.
Devidoagrandequantidadededadoscoletados,Ioramanalisados
neste estudo somente os 10 'Assuntos do Momento¨ de cada dia
que permaneceram por mais tempo na lista de assuntos, e seus
respectivos resultados de busca, totalizando 70 'Assuntos do
Momento¨ emaisde306miltweets.
4.2 ApresentaçãoeDiscussãodosResultados
4.2.1 ,GHQWLILFDomRH&DWHJRUL]DomRGRV³$VVXQWRV
GR0RPHQWR´
ConIorme descrito na Seção 3, em |1| Ioi utilizado um método
para calcular quais termos eram os mais comentados durante
determinado dia da semana e, apos calculados, os termos mais
comentadosIoramclassiIicadosem três categorias: 'Programas de
TV¨, 'Eventos Atuais¨ e 'Atividades¨.
DeIormasemelhanteaotrabalho|1|,nestaseçãoos 'Assuntos do
Momento¨ coletadosIoramclassiIicadosemcategoriasdescritasa
seguir a Iim de compreender melhor os assuntos que são mais
debatidosnoTwitter.OsresultadossãoapresentadosnasTabelas
1e2.
x Eventos Atuais: assuntos relacionados a acontecimentos do
dia.
x Eventos Passados: assuntos relacionados a acontecimentos
dediasanteriores.
x EventosFuturos:assuntosrelacionadosaacontecimentosde
diasIuturos.
x Programas de TV: assuntos relacionados a programas de
TVdomomento.
x Esportes: assuntos relacionados a eventos esportivos do
momento.
x ³Crassroots´ o termo não tem uma tradução direta para o
portuguêsesereIereamovimentospopularesquesurgemde
Iorma natural e espontânea. ClassiIicou-se como grassroots
assuntosrelacionadosaestestiposdemovimentospopulares,
como brincadeiras (e.g. #Iollowgeral), maniIestações (e.g.
#euescolhiesperar),etc.
Na Tabela 1 são apontados os 10 'Assuntos do Momento¨ de
cada dia da semana analisada que permaneceram por maistempo
na lista de assuntos
5
. Cada assunto da Tabela 1 Ioi identiIicado
com uma cor que representa a sua categoria a Iim de Iacilitar a
leitura da tabela considerando a quantidade de entradas, por
exemplo, a cor laranja indica que um assunto é da categoria
'Esportes¨.

4
ComooIocodesteartigonãoéadetecçãodespam,optamospor
adotaratécnicadeeliminaçãodetweetsquecontinhammaisdo
quetrês'Assuntos do Momento¨ na mesma mensagem, técnica
tambémutilizadaem|4|.
5
A lista completa de 'Assuntos do Momento¨ coletados durante a
semanacomosseusrespectivostemposdepermanêncianalista
de assuntos esta disponivel em: http://www.ic.uII.br/
~kIigueiredo/tresearch/assuntos.pdI
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 11 -
Tabela1.AssuntosdoMomentoesuasCategorias
Legenda:

EventosAtuaisEventosPassadosEventosFuturos
ProgramasdeTVEsportes"Crassroots"
Posição Sábado Domingo
1 SoniaBraga #chicolatrasday
2 UndisclosedDesires #saojoaodonordeste
3 DeborahBlando Joe&Nick
4 #uIc134 FallingSkies
5 #sigavelhostempos StevenSeagal
6 #plantaeraiz DragonballEvolution
7 SNZ #RogerioCeni
8 #ZeGotinha PapaiJoel
9 LeandraLeal BetoBarbosa
10 #maislegalquetvxuxa Werdum
Posição Segunda-feira Terça-feira
1 GAGAWON #euescolhiesperar
2 #bancodeseguidores #twitter3
3 RyanDunn WilzaCarla
4 MarthaRocha KellyKelly
5 #cidadedoshomens SkolSensations
6 EvangelineLilly DakotaFanning
7 FallingSkies MovesLikeJagger
8 #oprecodeumalicao #herois
9 3YearsCampRock RyanDunn
10 Jackass CarlaDiaz
Posição Quarta-feira Quinta-feira
1 Phineas&Ferb OrgulhoPeLanza
2 #Ieriadao #SantosCampeao
3 GarotaInIernal KleberMachado
4 EnriqueIglesias FerrisBueller
5 OrgulhoHetero #zelove
6 #Iollowgeral #curtindoavidaadoidado
7 AlianzaLima Phineas&Ferb
8 IWannaGodney Uruguaios
9 #dianacionaldovexame RodrigoSantana
10 CorpusChristi StellaFlorence
Posição Sexta-feira
1 #palmeirasminhavida
2 CapitãoAmérica
3 TeamFortress
4 OrgulhoPeLanza
5 PadreJuarez
6 #billboardawards
7 #uiquilics
Posição Sexta-feira
8 SnoopDog
9 IBGE
10 #boladay

Tabela2.AnáliseQuantitativadasCategorias
Categoria
Númerode
³$VVXQWRVGR0RPHQWR´ Percentual
EventosAtuais 18 25,71°
EventosPassados 2 2,86°
EventosFuturos 2 2,86°
ProgramasdeTV 21 30°
Esportes 7 10°
'Grassroots¨ 14 20°
NãoidentiIicada 6 8,57°
Total 70 100,00°

A Tabela 2 aponta a quantidade de 'Assuntos do Momento¨ de
cada categoria de acordo com a classiIicação Ieita na Tabela 1.
Como se pode observar na Tabela 2, os programas de TV são os
assuntos mais comentados no Twitter, ocupando 30° dos
'Assuntos do Momento¨ da semana analisada. Em seguida, estão
oseventosatuais(25,71°)eosgrassroots(20°).
Os grassroots no Twitter são tão importantes que, se a mesma
categorização utilizada neste trabalho Ior aplicada para as
hashtags retweetadas mais populares apresentadas em |18|, o
percentualdehashtagsda categoria 'Grassroots¨ chega a 70°.
Apos classiIicado, cada termo dos 'Assuntos do Momento¨ da
Tabela 1 Ioi buscado entre as 3900 manchetes de noticias. Os
'Assuntos do Momento¨ sublinhados na Tabela 1 reIerem-se a
assuntosqueobtiveramresultadosduranteestabusca.

Tabela3.PrimeirasOcorrênciasdosAssuntosdoMomentono
TwitterenasCentraisdeNotícias
Assunto
1ªocorrêncianos
"AssuntosdoMomento"
1ªocorrência
nasNotícias
#Ieriadao 22/06as10:36h 22/06as06:00h
#RogerioCeni 19/06as16:31h 19/06as18:02h
#SantosCampeao 22/06as23:57h 23/06as08:38h
#ZeGotinha 18/06as11:16h 18/06as06:00h
CapitãoAmérica 23/06as21:24h 23/06as21:08h
CorpusChristi 22/06as08:48h 22/06as06:00h
IBGE 24/06as08:04h 24/06as04:03h
Jackass 20/06as12:15h 21/06as11:00h
OrgulhoHetero 22/06as12:34h 22/06as13:02h
RyanDunn 20/06as11:39h 21/06as11:00h
WilzaCarla 20/06as21:24h 21/06as00:20h
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 12 -
Comparou-seentãoadatadepublicaçãodanoticiacomadatade
atualização do Twitter da lista de 'Assuntos do Momento¨ que
continha o assunto reIerido. Os resultados são apresentados na
Tabela3.
Nota-se que apenas 15,71° dos assuntos mais comentados no
Twitteraparecemnasnoticias,sendo63,64°sobreeventosatuais
e18,18°sobreesportes.AsocorrênciassublinhadasnaTabela3
destacamaprimeiraocorrênciageraldoassunto.
De acordo com as ocorrências sublinhadas na Tabela 3, 54,55°
dos assuntos analisados Ioram comentados no Twitter antes das
noticias serem publicadas, e esse numero sobe para 100° em
assuntos da categoria 'Esportes¨. Um motivo que pode justiIicar
este resultado é o Iato dos eventos esportivos serem
acompanhados em tempo real pelos usuarios, e assim, serem
discutidosnaredeenquantoaindaestãoacontecendo.
Os assuntos 'Ryan Dunn¨, 'Jackass¨ e 'Wilza Carla¨ também
apareceram primeiro no Twitter, estando estes relacionados ao
Ialecimento de celebridades. Como a vida de celebridades
costuma ser acompanhada pelos seus Iãs, talvez isso explique as
primeirasocorrênciasdessesassuntosnoTwitter.
4.2.2 ,GHQWLILFDomRH&DWHJRUL]DomRGRV³$VVXQWRV
GR0RPHQWR´
Com o objetivo de analisar as caracteristicas da composição dos
tweets coletados nas buscas dos 'Assuntos do Momento¨ Ioram
calculadasasseguintestaxasparacadaassunto
6
:
x Taxa de Retweets: porcentagem de tweets que são retweets
nototaldetweetscoletado.
x Taxa de Menções: porcentagem de tweets que Iazem
mençõesaoutrosusuariosnototaldetweetscoletado.
x TaxadeURLs:porcentagemdetweetsquecontémURLsno
totaldetweetscoletado.
x Taxa de Atitudes Positivas/Negativas: porcentagem de
tweetsqueapresentamumaatitudepositiva/negativanototal
de tweets coletados através das buscas com operadores de
atitudes.
Asmédiasdastaxascalculadasparacadaassuntosãoindicadasna
Tabela4.

Tabela4.MédiadasTaxasdosAssuntosdoMomento
Taxa ValorMédio
TaxadeRetweets 23,32°
TaxadeMenções 41,65°
TaxadeURLs 12,29°
TaxadeAtitudesPositivas 65,43°
TaxadeAtitudesNegativas 34,57°

6
A tabela geral contendo todos os assuntos e suas respectivas
taxas esta disponivel em http://www.ic.uII.br/~kIigueiredo/
tresearch/taxasDosAssuntos.pdI
As taxas de atitudes positivas e atitudes negativas somam 100°
dos tweets coletados. Um tweet é sempre classiIicado como
possuindo ou uma atitude positiva ou uma atitude negativa pelo
Twitter. Ja as taxas de retweets, menções e URLs não são
mutuamenteexclusivaseportantonãototalizam100°dostweets
coletados. Um tweet pode ser ao mesmo tempo uma menção,um
retweeteconterumaURL,bemcomopodenãopossuirnenhuma
dessascaracteristicas.
Emmédiaataxademençõeséde41,65°,sendoumpoucomais
dametadedestasdotiporetweet(23,32°dototal).Estevalorda
taxa de menções é um pouco maior do que valor obtido em |6|,
que Ioi de 30°. No trabalho |6|, Ioram medidas as menções de
todos os tweets, não somente os relacionados aos 'Assuntos do
Momento¨ o que pode indicar que os usuarios trocam mais
mensagens com os outros sobre os assuntos mais populares na
rede. Ja o valor da média da taxa de URLs é bem proximo ao
valores de 13° e 19° indicados por Java et al. em |1| e Zarella
em|19|respectivamente.
Com relação as médias das taxas de atitudes positivas/negativas,
pode-se observar que em sua maioria (65,43°) aatitudepositiva
dos usuarios sobre os 'Assuntosdo Momento¨ prevalece.
NaTabela5são ilustrados os valores das taxas para os 'Assuntos
do Momento¨ que apareceram em noticias, listados previamente
naTabela3.

Tabela5.TaxasdosAssuntosdoMomentoNoticiados
A
s
s
u
n
t
o

T
a
x
a

d
e

R
e
t
w
e
e
t
s

T
a
x
a

d
e

M
e
n
ç
õ
e
s

T
a
x
a

d
e

U
R
L
s

T
a
x
a

d
e

A
t
i
t
u
d
e
s

P
o
s
i
t
i
v
a
s

T
a
x
a

d
e

A
t
i
t
u
d
e
s

N
e
g
a
t
i
v
a
s

#Ieriadao 11,75° 19,12° 3,69° 55,38° 44,62°
#RogerioCeni 25,71° 35,73° 2,89° 91,10° 8,90°
#SantosCampeao 22,96° 40,04° 2,30° 58,57° 41,43°
#ZeGotinha 16,39° 32,59° 3,08° 53,39° 46,61°
CapitãoAmérica 10,80° 24,90° 21,12° 82,11° 17,89°
CorpusChristi 20,42° 44,03° 20,06° 49,42° 50,58°
IBGE 22,40° 45,40° 53,77° 85,57° 14,43°
Jackass 40,33° 63,11° 17,03° 50,62° 49,38°
OrgulhoHetero 42,49° 54,24° 7,27° 53,93° 46,07°
RyanDunn 53,38° 65,16° 13,97° 45,79° 54,21°
WilzaCarla 36,48° 43,14° 35,62° 19,56° 80,44°
ValorMédio 27,56° 42,50° 16,44° 58,68° 41,32°

Comopode-senotarovalormédiodataxademençõesparaestes
assuntos se manteve bem proximo do valor médio geral.
Entretanto,épossivelperceberumpequenoaumentocomrelação
astaxasderetweets(27,56°)eURLs(16,44°).
Outros pontos interessantes revelados na Tabela 5, são: (i) os
assuntos da categoria 'Esportes¨ têm a menor taxa de URLs, em
média 2,59°, provavelmente pelo Iato dos eventos esportivos
seremacompanhadosemtemporealpelosusuariosquedevemter
menor interesse na divulgação de URLs nesse momento; (ii) os
assuntos que Ioram comentados primeiramente no Twitter têmas
maiores taxas de retweets o que pode indicar o intuito dos
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 13 -
usuariosdepropagaremessesassuntospelarede;e(iii)asnoticias
relacionadas ao Ialecimento decelebridadestêmasmaiorestaxas
de atitudes negativas, por motivos obvios, contrariando a
tendência geral dos assuntos mais comentados de terem uma
maiortaxadeatitudespositivas.
5. CONCLUSÃOETRABALHOS
FUTUROS
O presente trabalho apresentou uma analise sobre os assuntos
mais comentados no serviço de microblogging Twitter,
denominados 'Assuntos do Momento¨, a Iim de compreender do
que se tratam tais assuntos, i.e. a quais eventos do mundo real
estes assuntos estão relacionados. Para tanto, realizou-se uma
categorização dos 'Assuntos do Momento¨ e a partir dela, pode-
seobservarqueostopicosqueosusuariosdaredemaiscomentam
são os programas de TV e eventos que acontecem no dia,
seguidos dos grassroots que são movimentos populares
geralmente iniciados na propria rede, como brincadeiras,
maniIestações,homenagens,etc.
Além da categorização dos 'Assuntos do Momento¨, os assuntos
coletados também Ioram comparados com as manchetes de
centrais de noticias online, destaIormaIoipossivelidentiIicaros
assuntos mais comentados na rede que estão relacionados a
noticias e, até mesmo, apontar quais dessas noticias sepropagam
noTwitterantesmesmoseserempublicadas.
OutracontribuiçãodestetrabalhoIoiaelaboraçãodeumaanalise
da composição dos tweets sobre os 'Assuntos do Momento¨
através da medição de taxas de retweets, menções, URLs e
atitudes positivas/negativas das mensagens, discutindo
principalmente os resultados associados aos assuntos que estão
ligadosanoticias.
Até onde é de conhecimento dos autores deste artigo, este é o
primeiro trabalho investigativo sobre o Twitter que explora em
suaanalise:(i)adiscussãodenoticiasnarede;(ii)acategorização
dos assuntos mais comentados incluindo os grassroots; e (iii) a
medição de atitudes positivas/negativas nos tweets sobre os
'Assuntos do Momento¨.
Estetrabalhopodeseropontodepartidaparapesquisasemoutras
areas.Entenderascaracteristicasdacomposiçãodos 'Assuntos do
Momento¨ no Twitter é importante para a criação de novas
estratégias de marketing e a analise da sua propagação para
investigaçõesnaareadecomunicação.
Como trabalho Iuturo pretende-se realizar uma investigação mais
proIunda,apartirdeumacoletadedadosglobaisnoTwitter,com
uma duração de 30 dias e incluindo mais Iontes de centrais de
noticias, pois é esperado pelosautoresqueonumerode assuntos
discutidossobrenoticiasaumentenessascondições.
6. REFERÊNCIAS
|1| Java,A.,Song,X.,Finin,T.,andTseng,B.2007.Whywe
twitter:understandingmicrobloggingusageand
communities.InProceedingsoIthe9thWebKDDand1st
SNA-KDD2007workshoponWebminingandsocial
networkanalysis(WebKDD/SNA-KDD'07).ACM,New
York,NY,USA,56-65.
|2| Twitter.Disponivelem:http://twitter.com,Acessoem:30
deJunhode2011.
|3| Huberman,B.,Romero,D.andWu,F.2009.Social
networksthatmatter:Twitterunderthemicroscope.First
Monday,Volume14,Number1-5January,2009.
|4| Kwak,H.,Lee,C.,Park,H.andMoon,S.2010.Whatis
Twitter,asocialnetworkoranewsmedia?InProceedingsoI
the19thinternationalconIerenceonWorldwideweb
(WWW'10).ACM,NewYork,NY,USA,591-600.
|5| Wu,S.,HoIman,J.M.,Mason,W.A.andWatts,D.J.2011.
Whosayswhattowhomontwitter.InProceedingsoIthe
20thinternationalconIerenceonWorldwideweb(WWW
'11).ACM,NewYork,NY,USA,705-714.
|6| Honeycutt,C.andHerring,S.2009.BeyondMicroblogging:
ConversationandCollaborationviaTwitter.Hawaii
InternationalConIerenceonSystemSciences,pp.1-10,42nd
HawaiiInternationalConIerenceonSystemSciences.
|7| Sakaki,T.,Okazaki,M.andMatsuo,Y.2010.Earthquake
shakesTwitterusers:real-timeeventdetectionbysocial
sensors.InProceedingsoIthe19thinternationalconIerence
onWorldwideweb(WWW'10).ACM,NewYork,NY,
USA,851-860.
|8| Bakshy,E.,HoIman,J.M.,Mason,W.A.andWatts.D.J.
2011.Everyone'saninIluencer:quantiIyinginIluenceon
twitter.InProceeaingsofthefourthACMinternational
conferenceonWebsearchanaaatamining(WSDM'11).
ACM,NewYork,NY,USA,65-74.
|9| Boyd,D.,Golder,S.,andLotan,G.2010.Tweet,
Tweet,Retweet:ConversationalAspectsoIRetweetingon
Twitter.InProceegingsoIHICSS`10, 1-10.
|10| Cha,M.,Mislove,A.andGummadi,K.P.2009.A
measurement-drivenanalysisoIinIormationpropagationin
theIlickrsocialnetwork.InProceeaingsofthe18th
internationalconferenceonWorlawiaeweb(WWW'09).
ACM,NewYork,NY,USA,721-730.
|11| Gruhl,D.,Guha,R.,Liben-Nowell,D.andTomkins,A.
2004.InIormationdiIIusionthroughblogspace.In
Proceeaingsofthe13thinternationalconferenceonWorla
WiaeWeb(WWW'04).ACM,NewYork,NY,USA,491-
501.
|12| TheJavaLanguageSpeciIication.Disponivelem:
http://java.sun.com/docs/books/jls/,Acessoem:30deJunho
de2011.
|13| Twitter4J.Disponivelem:http://twitter4j.org/en/index.html,
Acessoem:30deJunhode2011.
|14| Rome.Disponivelem:http://rome.dev.java.net/,Acessoem:
30deJunhode2011.
|15| G1RSS.Disponivelem:
http://g1.globo.com/dynamo/rss2.xml,Acessoem:30de
Junhode2011.
|16| R7RSS.Disponivelem:
http://www.r7.com/data/rss/brasil.xml,Acessoem:30de
Junhode2011.
|17| GoogleNewsBrasilRSS.Disponivelem:
http://news.google.com.br/news?pz÷1&hdlOnly÷1&cI÷all&
ned÷pt-BR¸br&hl÷pt-BR&topic÷h&num÷3&output÷rss,
Acessoem:30deJunhode2011.
|18| Suh,B.,Hong,L.,Pirolli,P.andChi,E.H.2010.Wanttobe
Retweeted?LargeScaleAnalyticsonFactorsImpacting
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 14 -
RetweetinTwitterNetwork.InProceeaingsofthe2010
IEEESeconaInternationalConferenceonSocialComputing
(SOCIALCOM'10).IEEEComputerSociety,Washington,
DC,USA,177-184.
|19| Zarrella,D.2009.ScienceoIRetweets.Disponivelem:
http://danzarrella.com/the-science-oI-retweets-report.html,
Acessoem:30deJunhode2011

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 15 -
Social networks and collective intelligence applied to
public transportation systems: A survey
Ana Paula Chaves
Coordination of Technology
Systems for Internet
Federal Technological
University of Paraná (UTFPR)
Campo Mourão - PR
anachaves@utfpr.edu.br
Igor Steinmacher
Coordination of Technology
Systems for Internet
Federal Technological
University of Paraná (UTFPR)
Campo Mourão - PR
igorfs@utfpr.edu.br
Vaninha Vieira
Department of Computer
Science
Federal University of Bahia
(UFBA)
Salvador - BA
vaninha@ufba.br
ABSTRACT
Road traffic in big cities is becoming increasingly chaotic.
The use of public transportation is an alternative to im-
prove this scenario, since it diminishes the number of pri-
vate vehicles on the roads. However, to improve its quality
is important to understand the problems people are facing
when using this kind of transportation. This paper presents
the results of a survey conducted with public transportation
users which investigates how collaborative systems based on
social networks and collective intelligence can support shar-
ing information with the passengers. The results show that
there is a scarcity of ways to obtain real-time information
related to public transportation and that the use of social
network applications and collective intelligence is an inter-
esting way to share and obtain this kind of information.
Keywords
Intelligent Transportation System, collective intelligence, so-
cial network
1. INTRODUCTION
Big cities are increasingly suffering from the problem of ur-
ban mobility. Several problems, such as constant traffic jam,
lack of investments in road infrastructure, and poor quality
of the services provided by public transportation makes the
citizens daily life stressful and complicated. Estimulating
the use of public transportation is essential to support ur-
ban mobility, because it reduces the number of cars on pub-
lic roads [5]. Besides, since Brazil will be hosting important
sport events in the coming years, it is important to inves-
tigate how information technology can be applied to public
transportation to better support users’ needs and decisions.
According to [3], the use of information technology for plan-
ning, managing, operating and monitoring public transporta-
tion has become a feasible alternative. Intelligent Trans-
portation Systems (ITS) aims to investigate how to apply
well established information and communication technolo-
gies to improve the quality of transportation systems [12].
A classification for ITS solutions, presented in [12], con-
siders the area of Advanced Public Transportation Systems
(APTS), which aims to propose solutions to support infor-
mation provisioning to passengers, such as the current status
and timetables of the public vehicles, the indication of the
route lines and the stops attended by a line, incidents on
public transportation with the indication of possible delays,
and others. When notified of such information, passengers
can make their decisions easily, planning their route and ac-
tivities, which results in less stress and anxiety and more sat-
isfaction with the public transportation services. According
to a recent article in Wired magazine [1], people are willing
to leave their cars or motorcycles, if they can get information
in real time, about the public transportation.
The popularization of social media (such as blogs, social
networks and wikis) changed the way people deal with their
daily problems by increasingly using virtual communities to
share and seek for information. As indicated in [10], it en-
ables communities to solve more problems than it would be
possible individually. Collective intelligence involves com-
bining knowledge (which may include behaviors, preferences,
ideas, and so on) provided by a group of people to produce
novel information or insight [11]. Some applications [14, 6]
that make use of collective intelligence capabilities were pro-
posed to collect knowledge based on what is being discussed
on the Internet.
In this context, we are investigating how collaborative sys-
tems, specially social media and collective intelligence, can
increase the awareness of public transportation users reduc-
ing the lack of information related to the route conditions,
the lines availability and the waiting time at bus stops. This
research is part of a project called UbiBus [13] whose objec-
tive is to propose, specify and implement technological solu-
tions to easy users’ access to public transportation informa-
tion in real time, based on dynamic context-sensitive infor-
mation, available on multiple devices. A module of UbiBus,
called UbiBus-Net, aims to investigate and implement col-
lective intelligence solutions and tools that analyze textual
information produced by users on social networks about the
public transportation conditions, allowing the access to the
generated collective knowledge.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 16 -
To support the requirements elicitation for UbiBus, we de-
signed and conducted a survey with transportation users, in
different Brazilian cities, through the application of a ques-
tionnaire. This survey aims to identify deficiencies and needs
related to the information provided to public transportation
passengers. The main advantage of conducting a field sur-
vey is that we can have the opinion of who actually use the
public transportation and know the real services conditions
in their city or region. Thus, we can develop applications
closer to users’ expectations.
This paper presents the results obtained in this survey and
analyzes the problem of providing information to public trans-
portation users based on collective intelligence and social
networks. To accomplish it, the paper is organized as fol-
lows. Section 2 presents some related work in the area of ITS
and Collective Intelligence. Section 3 brings the methodol-
ogy used to perform the survey. In Section 4, we discuss the
results obtained with the survey, and in Section 5 we present
our conclusions about the survey findings.
2. BACKGROUND
2.1 Collective Intelligence
Currently, collaboration among people has been gaining at-
tention due to the popularity of social media such as forums,
weblogs, wikis and social networks. These media are collab-
orative systems that enable users to share their knowledge,
skills and other information. As a result, they are becom-
ing important sources of collective intelligence. The science
of collective intelligence, proposed from the discussions of
Pierre L´evy [8], tries to harness the potential of social net-
works as a means to exercise the citizenship. It assumes
that individual intelligences are summed and shared across
society.
Collective intelligence led to the rise of a new business model
known as crowdsourcing. The term, coined by Jeff Howe [7],
describes a model that takes advantage of several creative
solutions that people can propose. The idea of crowdsourc-
ing is to send a task to the crowd instead of running it using
their own resources.
There are some recent initiatives that make use of collec-
tive intelligence to benefit public or private efforts. Wiki-
Crimes [6] enables people to share information about the
occurrence of criminal acts in a particular location. Vivac-
qua and Borges [14] propose the usage of collective intelli-
gence capabilities for emergency response systems. In some
countries, there are initiatives to share information about
corruption, as the sites ”I paid a bribe”
1
(India) and “No les
votes”
2
(Spain). The“Map of Corruption in Brazil”
3
consists
of a site hosted on Google Maps for people to provide and
seek for information about corruption in Brazil. In Panama,
the site “Mi Panama Transparente”
4
uses collective intelli-
gence to gather information about various aspects relevant
to society such as corruption, crime and violence.
The increasing demand and use of collective intelligence ap-
1
http://www.ipaidabribe.com
2
http://wiki.nolesvotes.org
3
http://doiop.com/mapadacorrupcao
4
http://www.mipanamatransparente.com
plications indicates that people tend to collaborate in or-
der to build a collective knowledge, since such knowledge is
beneficial to themselves and the group they belong. Thus,
collective intelligence principles can offer solutions to many
sectors in the society, including the improvement of public
transportation systems.
2.2 Advanced Public Transportation Systems
Advanced Public Transportation Systems (APTS) is a sub-
area of Intelligent Transportation Systems that aims to use
technology to provide real time information to assist users
of public transportation on planning their trips [12]. This
information includes the types of available transportation,
transportations’ estimated departure and arrival times, their
itinerary, among others. A better accessibility to informa-
tion concerning the public transportation in a city makes
this option a more attractive mean of transportation to its
potential users [4]. This interaction can occur by using dif-
ferent devices, such as information centers, displays inside a
bus or at a bus station, the web, smartphones or interactive
TV.
Several applications have been developed to assist users on
being aware about public transportation means in a city
(e.g. OneBusAway [5], Your City on Time [13], TOTransit
5
,
OnibusRecife
6
). Tools for mobile devices like OneBusAway
7
[5] and Waze
8
provide information according to the user’s
geographic location, achieved by GPS (Global Positioning
System). Waze generates maps according to the route in-
formed by the user, and presents traffic data collected in
real time from other people who are also using the software
[9]. OneBusAway is directed to bus users from the city of
Seattle and vicinity, and presents all bus stops closer to the
user’s location, the lines associated to each stop and their
current schedules, updated in real time by the bus company.
OneBusAway also provides a web interface that displays a
map with the bus stops’ locations and the timetables for all
vehicles associated to those stops.
Other available tools are based on the principle of visual-
izing information on maps, including: OnibusRecife which
displays the bus stops closer to a given (typed) location in
the city of Recife, Brazil, and the possible routes to a given
destination; ToTransit displays the map location of street-
cars in Toronto, Canada, with information provided, in real
time, by the transportations companies; and Bus Maps Lon-
don
9
, which shows static information about bus stops, routes
and schedules for the city of London. Google Maps
10
also
presents APTS features for some cities, enabling people to
plan their routes using public transportation system. More-
over, Google Maps APIs are used to compose most part of
the applications mentioned on this section.
Despite those initiatives, it is difficult to obtain dynamic
information about public transportation conditions, since
many unexpected events may occur in the route (e.g. traffic
5
http://totransit.ca/
6
http://www.onibusrecife.com.br/
7
http://www.onebusaway.org/
8
http://www.waze.com/
9
http://www.tfl.gov.uk/tfl/gettingaround/maps/buses/
10
http://maps.google.com
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 17 -
jam, accidents or incidents). Most solutions also strongly de-
pend on the information provided by the official transporta-
tion companies. A feasible alternative to obtain real-time
information is to create an intelligent transportation system
that makes use of the power of collective intelligence.
3. METHODOLOGY
The research presented in this paper was based on a ques-
tionnaire answered by public transportation users in Brazil.
Results were analyzed to check if they could indicate some
requirements to build an APTS to provide information to
passengers and if the usage of social networks and collective
intelligence could create better APTS. The following steps
were performed:
• planning;
• conduction;
• data preparation; and
• data analysis and results.
During the planning activity, we defined the research hy-
potheses, which were used to formulate the questionnaire.
The hypotheses are:
• Hypothesis 1: public transportation passengers have
very few ways to get information about the lines they
need to use, and when available, the information is
incomplete.
• Hypothesis 2: passengers tend to share information
about events that affect public transportation, so col-
laborative systems based on collective intelligence can
be useful to improve the quantity and quality of avail-
able information.
• Hypothesis 3: passengers have more confidence on
information provided by people in their social network
(friends, acquaintances, or other ties) than on infor-
mation achieved from unknown sources.
• Hypothesis 4: applications for mobile devices can
be used to provide information to passengers, to ease
information sharing about occurrences on public trans-
portation at the time they happen and at any place the
user is situated.
The questions in the questionnaire were divided in two main
groups. The first one included twelve questions (Table 1) re-
lated to the user profile, the public transportation they use,
and their knowledge about available information. The sec-
ond group comprised nine questions (Table 2) related to the
use of social networks by passengers, and the use of online
applications to share information about public transporta-
tion. Most questions are multiple choice type and it was
always possible for the respondents to point out “Other” as
an alternative, in case none of the available options were
adequate.
Table 1: Group 1: You and the Public Transport
1 City you live:
2 State you live:
3 How often do you use public transportation?
4 When you need to use public transportation, how do you
get information about the time that the vehicle will be
arriving at a given stop?
5 How often does the transportation arrive at the bus stop
at the expected time?
6 When delays occur in the line you use, what kind of prob-
lems can be considered as causes of delay in most cases?
7 Suppose you are at the bus stop, waiting for the vehicle
of a given line. If there is any delay,do you have a way
to become aware of what happened, before the vehicle
reaches the stop?
7.1 (If the answer to question 7 was “Yes”) How do you
get information about the reasons for the delay?
7.2 (If the answer to question 7 was “ No”) Do you consider
important that this kind of information was available?
8 When you need to take a bus from a particular line for
the first time, do you try to get information about this
line?
8.1 (If the answer to question 8 was “ Yes”) What information
sources do you usually consult?
8.2 (If the answer is to question 8 was “ Yes”) What kind
of information can you find?
Table 2: Group 2: You and the Social Networks
1 Do you use Internet on your cellphone?
2 Do you use GPS on your cellphone?
3 Do you participate in social networks?
3.1 (If the answer to question 3 was “Yes”) In which social
networks do you participate actively
4 Do you post events that occur in traffic on social net-
works?
4.1 (If the answer is to question 4 was “Yes”) Do you wish
there was an application to process and display the infor-
mation posted on social networks?
4.2 (If the answer to question 4 was “No”) Would you post
this kind of events if there was an application to facilitate
this?
5 If there was an application to display real-time informa-
tion about the bus lines you use, would you consult it?
6 Do you trust information about bus lines posted on the
Internet?
The questionnaire was created using LimeSurvey
11
and
made available electronically
12
. We conducted the survey
from March 24th to April 29th, 2011, using web-based sam-
pling methods. According to Caulfield and O’Mahony [2],
this method consists on sending the questionnaire to a initial
group of people with common attributes. The first group of
respondents complete the survey and then pass the survey on
to their network. The process repeats and gathers momen-
tum as the number of responses increases and the snowball
effect occurs [2]. For this survey, we sent the questionnaire
URL via email and published it on social networks (Twit-
ter
13
, Facebook
14
and Orkut
15
), addressed to some public
transportation users and communities. We requested them
to answer the questionnaire and forward the URL to their
contacts.
The data preparation activity was performed to categorize
the responses and standardize the open ended questions
11
http://www.limesurvey.org/
12
http://goo.gl/B3UJM
13
http://www.twitter.com
14
http://www.facebook.com
15
http://www.orkut.com
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 18 -
Table 3: Data preparation: discarded answers
Reason # of answers
Answerer from another country (Bel-
gium). Out of scope.
1
Incomplete questionnaire (respondent
did not finish answering).
11
City provided does not exist. 1
Table 4: Number of response by state
State Number of
replies
Bahia 140
Paran´ a 128
S˜ao Paulo 121
Rio de Janeiro 166
Santa Catarina 43
Cear´ a 36
Rio Grande do Sul 24
Goi´as 20
Para´ıba, Sergipe 17
Minas Gerais 15
Mato Grosso do Sul 12
Distrito Federal 10
Amazonas 9
Rio Grande do Norte 6
Acre, Amap´a, Espirito Santo,
Par´a, Pernambuco, Piau´ı 1
(questions 1 and 2 of group 1), which had different spellings
for the same answer. We have collected a total of 683 re-
sponses. During the data preparation, 13 responses were
dismissed as they presented some kind of inconsistency, re-
sulting in a total of 670 valid responses. The reasons of the
exclusions are presented in Table 3.
The data analysis activity was performed to verify the hy-
potheses. The results of this activity will be described in
next section.
4. DATA ANALYSIS AND RESULTS
To perform the data analysis activity, we considered the 670
valid responses, involving 94 cities in 21 different Brazilian
states. Six states appeared in the results with a single re-
sponse (Acre, Amap´ a, Esp´ırito Santo, Par´a, Pernambuco
and Piau´ı). States that had the most significant number of
responses were Bahia (140 responses, 132 from the city of
Salvador), Paran´a (128), S˜ ao Paulo (121 responses, 83 from
the state capital) and Rio de Janeiro (66 responses, 57 from
the state capital). The distribution of responses per state
can be found in Table 4.
When asked about how often they used public transporta-
tion, 61% of respondents said they use every day and 20%
reported that they use few days a week. Only 19% said they
occasionally use public transportation (Figure 1).
4.1 Analysis of Hypothesis 1
Regarding Hypothesis 1, we wanted to know if the pub-
lic transportation passengers have means to get information
about the lines they use. In addition, we intended to ver-
ify, when information are available, if they are sufficient and
complete.
We asked respondents how they become aware of the time
a vehicle will arrive at a given stop/station. It was possible
to check more than one choice among: (i) via Internet, (ii)
Figure 1: Frequency of public transportation usage
by telephone, (iii) printed timetables or guides, (iv) asking
other people, (v) there is no way to be aware, I go to the
stop and wait for the vehicle, and (vi) other. The number
of responses for each option is shown in Figure 2.
Figure 2: Ways users search for arrival time infor-
mation
Despite the apparent large number of people who reported
“There is no way to be aware”(47%), only 202 people (30% of
total) marked only this option. The remaining 114 respon-
dents checked this option in conjunction with other(s). This
may occur due to the fact that the information is not always
available in one way or another. Thus, when the information
is not found, the passenger go straight to the stop/station.
The other 468 respondents (70%) reported they have some
way to obtain this information.
Although people can get the timetables for the buses associ-
ated to a given stop, when we asked about the punctuality
of vehicles (Figure 3) only 32 respondents (5%) said that the
transportation always comes on time. Out of these 32, only
seven people live in capitals. We believe that the country-
side suffer less with the phenomena that cause delays, such
as accidents and traffic jams, due to the smaller number of
vehicles on the streets. Other 240 people said that the bus
rarely or never arrives at the stop on time. In addition, 180
people said they do not know if the bus is delayed because
they are not aware of the time it was expected to arrive.
This shows that information provided on the timetables are
not enough to make the passenger aware of the time the
vehicle should arrive at the stop.
We asked respondents what were the problems that often
cause delays in vehicles (Figure 4). The answers showed that
the major issues are traffic jams (506), car accidents (411)
and robbery (200). Flooding were reported 121 times and
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 19 -
Figure 3: Frequency of delayed vehicles
29 other people pointed to other security incidents. 106 peo-
ple reported that other (not listed) problems cause delays.
Among the cited problems, 33 refer to mechanical problems,
24 to uncommitted drivers, 17 to transportation companies
planning failures and 11 to the lack of transportation vehi-
cles.
Figure 4: Reasons of delays
As it can be noted, some of the problems can be solved by
administrative measures, such as planning issues and lack of
vehicles. However, most of them are unexpected events that
occur along the route and, therefore, should be communi-
cated to passengers who are waiting for the transportation.
To find out if this information is available, we asked the re-
spondents if they know ways to become aware of a delay
or event that cause a delay before the vehicle reaches the
stop (Figure 5). 648 people (97%) said“No”. We then asked
these people if they consider it important to have this in-
formation and 633 said “Yes”. It shows that the available
information about public transportation are generally based
on estimations and do not represent the current real-time
information. Furthermore, it shows that users require more
accurate information regarding public transportation.
Figure 5: Availability and importance of informa-
tion about delayed vehicles
We also asked if people seek for information about the lines
when they use them for the first time. And, if they do so,
what kind of information they are able to find (Figure 6).
Out of 670 responses, 510 said that they seek for informa-
tion on the their first time usage. Among them, 289 said
they can find the departure time from the line origin and
279 answered they can check the location of the interme-
diate stops. 139 people said they can find the arrival time
to the final destination. The other alternatives were the
timetables for intermediate stops (64 answers), statistics of
delays and other events (22 answers), and other information
(33 answers). Among other information, the most cited was
the line route or itinerary (18 answers). Other 40 respon-
dents said they cannot find any information, and 26 of them
marked only this option. This number can be explained be-
cause people are not aware of the available resources to ac-
cess these information. Therefore, it is not enough to make
the information available, but it is also necessary to make
them easily accessible to the different categories of people
who need it.
Figure 6: Types of information found when passen-
gers use a line for the first time
Based on the data discussed on this section, we can con-
clude that people generally seek for information about pub-
lic transportation. However, the information found is static,
taking into account estimations provided by the companies.
Most times this information does not match with what ac-
tually occurs, since 95% of respondents said that there are
recurring delays in the lines they use. This may occur due to
the lack of ways to assist users on being aware of the prob-
lems that cause delays in the lines. Therefore, this study
points out that public transportation users have very few
ways to get information about the lines they use and the
information obtained is incomplete and static.
4.2 Analysis of Hypothesis 2
The goal of the second hypothesis was to determine whether
passengers make use of the knowledge shared by other people
to obtain information about public transportation lines. We
aim to verify if there is a tendency of sharing and searching
this information via Internet.
In this regard, we asked about the way they get information
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 20 -
about bus timetables (Figure 2). 267 people (40%) said they
ask other people and 321 people (48%) reported they obtain
information via Internet. This shows that the Internet is the
most used way to obtain information, but collective knowl-
edge is also extensively used. By analyzing the people who
checked both options, we come to a total of 139 passengers
(21% of the total) who use the Internet and information from
others.
Another question that confirms the data presented above
concerns the way users look for information when using a
line for the first time (Figure 7). From the 510 people that
seek for information, 314 said they obtain it through ac-
quaintances who use the same line, and nine said they go to
the stop and ask other people. To the same question, 376
people answered they use the Internet as a way to obtain
information. Only 41 people seek for the company services
and other 30 reported other options. When analyzing the
group of people that ask acquaintances or other people and
use the Internet, we have a total of 197 people (39% of the
510 people that seek for information).
Figure 7: How users seek for information when using
a line for the first time
Among all 670 respondents, only 22 (3%) answered that
there are ways to become aware of delays before the vehicle
arrives at a stop. When asked about the way this infor-
mation is obtained, ten people said they check on terminals
available at the stops or ask the transportation company,
three of them answered they can check delays via Internet
and 10 people answered “other options” (ask relatives by
telephone, talk to other passengers at the stop, ask vehicle
conductors or traffic inspectors).
We also observed the tendency of using social networks to
share and seek for information about incidents that occurred
in public transportation (Figure 8). We asked if, currently,
they post events related to the traffic on their social net-
works. 225 respondents (34% of the total) said“yes”. Among
the 445 users who answered “no ”, 335 said they would re-
port if there was a specific application to do so. Only 110
people (16% of the total) said they do not report incidents
and would not report even though there was an application
to support this.
Regarding the use of information shared via Internet, we
Figure 8: Information sharing on social networks
asked passengers whether they would use an application that
displays information about bus lines in real time (dynami-
cally) (Figure 9). Most respondents - 646 (96%) - said“yes”,
they would use such an application.
Figure 9: About the use of an application to obtain
real time information
According to the presented data, it is possible to say that
most passengers get information by asking other people (i.e.
from the collective knowledge). In addition, there is a ten-
dency to share and search for information due to the high
amount of passengers that already use the Internet to do it.
Confirming this tendency, many passengers said that they
already inform events that occur in public transportation or
would inform it if there was an application to support this,
and also that they would use an application that displays
real-time information about bus lines.
4.3 Analysis of Hypothesis 3
The goal of the third hypothesis was to verify whether pas-
sengers trust on information provided by unknown sources
or if they have more trust on information provided by people
in their social network. To do so, respondents were asked
if they participate in any social network (Figure 10). Out
of all 670 responses, only 24 (4%) said “no”. Among the
646 who answered “yes”, 539 said they use Orkut social net-
work, 448 use Facebook, 408 use Twitter, 33 use FourSquare
and 55 reported they use other (LinkedIn, MySpace, Flickr,
Youtube, and others).
People were also asked about their trust on information
about bus lines posted on the Internet (Figure 11). From
670 responses, only 27 (4%) said they do not rely on in-
formation posted on the Internet. From the remaining 643
responses, 111 said they trust on the information, regard-
less of who posted it, without considering the information
source. 196 of the respondents only trust on information
posted by the transportation company. 56 only trust on in-
formation posted by people in their social network. And 280
people answered they trust on information posted on social
networks and on information posted by the company.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 21 -
Figure 10: Social Network usage
The analysis of these data shows that, in general, people
prefer to have information supplied by transportation com-
panies. However, if we consider the people who relies “only
on social networks” and those that indicated they trust both
on “social networks and transportation companies”, we have
a total of 336 respondents, which shows that the informa-
tion published on social networks has a high acceptability.
Moreover, these numbers indicate that some people do not
care about the information source (17 %), but most prefer
to know the entity that provided it.
Figure 11: Trust on information posted on social
networks
4.4 Analysis of Hypothesis 4
The focus of Hypothesis 4 was to check whether applications
for mobile devices can be used as a way to share information
about public transportation. To retrieve this infomation, we
firstly asked passengers if they make use of Mobile Internet.
246 of the respondents answered “yes” and 424 said “no”,
as presented in Figure 12. The amount of people who an-
swered “yes” is apparently small, but represents 37% of all
respondents.Considering the high cost of devices that sup-
port web applications and data packages offered by mobile
phone companies in Brazil, the proportion is very signifi-
cant. We further noted that 178 out of 246 people who said
“yes” live in the state capitals and other 34 live in cities with
more than 200.000 inhabitants, which totals 212 responses
of people living in big cities. This indicates that people us-
ing mobile technologies for Internet access live in cities that
present major traffic problems.
Another important aspect is that only 49 respondents who
answered “yes” are occasional public transportation users.
Figure 12: Amount of people that use mobile Inter-
net
The other 197 people use public transportation “some days
a week”or “every day”, showing that a substantial amount of
people that use mobile devices to access the Internet are fre-
quent public transportation users. It is estimated that over
the coming years, this scenario will be increasingly common,
as the cost of devices and data packages is reducing.
Thus, the answers indicate that the use of mobile applica-
tions is a trend and that, for this reason, it is important
to focus on the development of such applications. Eventu-
ally, more people that use public transportation will have
access to this technology and will take advantage of these
applications.
5. CONCLUSIONS
This paper presented the results of a survey applied to public
transportation users. The goal of this survey was to iden-
tify deficiencies, needs and trends related to providing in-
formation to passengers related to the public transportation
real-time conditions. We could conclude that:
• passengers need information about public transporta-
tion and, although there are several information avail-
able, they are, in general, static and based on estima-
tions. In most cases, information do not correspond to
the real conditions at the time users need it;
• people often feel the need to seek for information about
public transportation and they use more often the In-
ternet and other people to achieve that information.
Thus, it could be relevant to combine these methods
into a single application in the web, which enable peo-
ple to build a collective knowledge about public trans-
portation conditions, making it available to all inter-
ested parties;
• using social networks to share information is an in-
teresting alternative, since many people that use this
kind of social media, share and seek for information
through them;
• using mobile devices to access the Internet is a trend,
and it enables information about public transporta-
tion events to be shared in real time, due to passen-
gers’ ubiquity. This resource is interesting because it
increases the power of collective intelligence.
From the results of this research, we are able to elicit the
requirements that address the needs of the UbiBus project
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 22 -
end users. The users’ feedback indicate that it is desirable to
build systems that use collective intelligence and that enable
passengers to share and seek for information about public
transportation through social networks applications via In-
ternet. By using these applications, the citizens will be able
to use the Internet, mobile devices and social networks to
indicate, in real time, events that help to map the routes
situation and the public transportation conditions. From
the information provided by several passengers, the system
will present, for example, lines delays, vehicle problems, best
or worst routes at a given moment, the best or worst lines
and bus companies, more or less dangerous regions, and so
on. These requirements are being implemented and will be
integrated in the UbiBus system. The results of these appli-
cations will be presented to the community in future works.
A limitation of this paper is that the survey was answered
by people in a subjective way, and there may be inconsis-
tencies. It is not possible to certify the truthfulness of the
information provided.
Acknowledgments
Authors thanks CNPq (process 560135/2010-6) for the fi-
nancial support. This work was [parcially] supported by
National Institute of Science and Technology for Software
Engineering
16
(INES).
6. REFERENCES
[1] K. Barry. How smartphones can improve public
transit. Wired Magazine, April 2010.
[2] B. Caulfield and M. O’Mahony. An examination of the
public transport information requirements of users.
Intelligent Transportation Systems, IEEE
Transactions on, 8(1):21 –30, march 2007.
[3] A. A. de Castro Meirelles. Sistemas de transporte
inteligentes: aplica¸ c˜ao da telem´ atica na gest˜ao do
transito urbano. Revista Inform´ atica P´ ublica, 1(1),
June 1999.
16
http://www.ines.org.br
[4] S. Ezell. Explaining international it application
leadership: Intelligent transportation systems.
Technical report, The Information Tech. and
Information Foundation, Washington, USA, 2010.
[5] B. Ferris, K. Watkins, and A. Borning. Location-aware
tools for improving public transit usability. IEEE
Pervasive Computing, 9:13–19, 2010.
[6] V. Furtado, L. Ayres, M. D. Oliveira, E. V. Filho,
C. Caminha, J. D’orleans, and M. Belchior. Collective
intelligence in law enforcement - the wikicrimes
system. Information Sciences, 180:4–17, 2010.
[7] J. Howe. The rise of crowdsourcing. Wired Magazine,
14(6), June 2006.
[8] P. Levy. Collective Intelligence: Mankind’s Emerging
World in Cyberspace. Helix Books, 1 edition, 1999.
[9] R. Ogliari. Crowdsourcing, muito melhor com mobile.
Revista Esp´ırito Livre, 26:51–55, Maio 2011.
[10] S. Rasmussen, M. J. Raven, G. N. Keating, and M. A.
Bedau. Collective intelligence of the artificial life
community on its own successes, failures, and future.
Artificial Life, 9(2):207–235, April 2003.
[11] T. Segaran. Programming Collective Intelligence:
Building Smart Web 2.0 Applications. O’Reilly Media,
1 edition, 2007.
[12] J. S. Sussman. Perspectives on Intelligent
Transportation Systems (ITS). Springer, New York,
USA, 2005.
[13] V. Vieira, L. R. Caldas, and A. C. Salgado. Towards
an ubiquitous and context sensitive public
transportation system. In 4th International Conference
on Ubi-media Computing, S˜ao Paulo, SP, 2011.
[14] A. S. Vivacqua and M. R. Borges. Taking advantage
of collective knowledge in emergency response
systems. Journal of Network and Computer
Applications, In Press, Corrected Proof, 2011.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 23 -
Multidões: a nova onda do CSCW?
Daniel Schneider
PESC/COPPE/UFRJ
Ilha do Fundão
Rio de Janeiro, RJ, Brasil
schneider@cos.ufrj.br
Jano de Souza
PESC/COPPE/UFRJ
Ilha do Fundão
Rio de Janeiro, RJ, Brasil
jano@cos.ufrj.br
Katia Moraes
PESC/COPPE/UFRJ
Ilha do Fundão
Rio de Janeiro, RJ, Brasil
katia@cos.ufrj.br
ABSTRACT
Na opinião de alguns pesquisadores, a onda das multidões que
estamos presenciando nos ultimos anos é mais um exemplo dos
desaIios que se colocam para a comunidade de CSCW, uma linha
de pesquisa que luta contra o dilema da Iragmentação. O Iato de o
CSCW historicamente ter servido como um ambiente de discussão
dos trabalhos de pesquisadores de diversas areas e ter abrangido
diIerentes programas, por outro lado, para muitos implica a
principal virtude deste campo de pesquisa. Este trabalho Iornece
uma caracterização de sistemas de crowa computing proposta pelo
nosso grupo de estudos em multidões, apresenta uma agenda de
pesquisa em CSCW no contexto destes sistemas, e Iinaliza
discutindo possiveis implicações dos Ienômenos de massa sobre a
linha de atuação da comunidade de trabalho cooperativo
suportado por computador.
Categories and Subject Descriptors
H.5.3 |InIormation Systems| Group and Organization InterIaces
. .!!o/ . . o·. · . . . ¬ ¡ o·. - ¸
General Terms
Fatores humanos.
Keywords
Multidões, multidões virtuais, crowd computing, crowdsourcing,
computação humana, interação audiência-computador, Web 2.0,
Iragmentação do CSCW.
1. INTRODUÇÃO
Em janeiro de 2010 o jornal inglês The Guaraian pediu aos seus
leitores que votassem nas supostas especiIicações do até então
inédito tablet da Apple. Desde o tamanho e peso até o nome e
caracteristicas do dispositivo, uma multidão envolvendo mais de
10.000 pessoas enviou seus melhores palpites sobre o lançamento
do produto mais esperado do ano. Os resultados Ioram divulgados
posteriormente pelo jornal, e em mais da metade das categorias de
votação, a multidão previu com precisão o que Steve Jobs veio a
anunciar no Iinal do mesmo mês, incluindo o nome iPaa do
tablet.
Este exemplo ilustra uma maneira simples de explorar a chamada
sabeaoria aas multiaòes, conceito que popularizou-se
principalmente depois da publicação do livro homônimo pelo
jornalista americano James Surowiecki. Exemplos como estes
começam a se tornar cada vez mais Irequentes na midia e nos
Iazem reIletir e pensar sobre questões como: o Iuturo da
humanidade estara nas multidões? Quais as raizes deste Ienômeno
das multidões, e que prognosticos podem ser Ieitos para o Iuturo?
Nosso grupo de estudos em Computação envolvendo multidões
esta interessado em encontrar respostas para estas interrogações e
particularmente neste trabalho investigar as seguintes questões:
• Que papel tera a comunidade de CSCW - e particularmente
o grupo de pesquisa orientado a pratica de sistemas
colaborativos - no desenvolvimento de tecnologias de apoio
a colaboração de multidões?
• Seria então o caso de mudarmos o Ioco de estudar
individuos e pequenas equipes para pensarmos num
groupware para multidões? Até o momento a comunidade
de pesquisa em CSCW tem Ieito investimentos isolados
nesse sentido, demonstrando indecisão.
• A onda das multidões sera apenas um reIlexo dos novos
tempos ou mais um sinal de que o CSCW caminha para se
tornar em breve uma 'coisa do passado¨? Através da
metodologia de revisão da literatura Ioi possivel encontrar
algumas respostas para este questionamento.
• Finalmente, e não menos importante do que as anteriores:
qual a classe de sistemas computacionais que permitem
explorar o espaço mental de multidões? Nosso grupo Iez
progressos neste sentido.
A pauta de desaIios é longa, e devemos considerar que pouco ou
nada se sabe sobre a dinâmica social de multidões, por exemplo,
em aplicações que envolvem conceitos relativamente novos como
peer proauction |36|, crowasourcing |29|, colaboração em massa
|24|, persuasão em massa |42|, computação humana |6|,
inteligência coletiva |40| e interação multidão-computador |13|.
Os nomes são muitos mas em comum eles trazem multidões
dispostas a colaborar, se divertir, produzir conhecimento e
resolver problemas. Esta onaa ae multiaòes, no entanto, tem
levantado uma série de preocupações na comunidade do CSCW,
tradicionalmente Iocada em apoiar pequenos grupos no contexto
de trabalho.
O resto do artigo esta organizado da seguinte maneira. A seção 2
introduz o conceito de crowa computing e descreve os principais
elementos do espaço a ser investigado; a seção 3 apresenta uma
tipologia para multidões virtuais; na seção 4 são discutidos os
Iatores ou condições que motivam o sucesso ou o Iracasso de
aplicações que envolvem multidões; a seção 5 apresenta o
Permission to make digital or hard copies oI all or part oI this work Ior
personal or classroom use is granted without Iee provided that copies
are not made or distributed Ior proIit or commercial advantage and that
copies bear this notice and the Iull citation on the Iirst page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior speciIic permission and/or a Iee.
SBSC 2011, Outubro 57, 2011, Paraty, Rio de Janeiro, Brasil.
Copyright 2011 ACM.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 24 -
conceito de crowaware, na seção 6 são discutidas as implicações
da onda de multidões no processo de Iragmentação vivenciado
pela comunidade de CSCW e a seção 7 apresenta as conclusões
deste trabalho de pesquisa.
2. MULTIDÔES E CROWD
COMPUTING
Uma deIinição inIormal, encontrada na Wikipédia, sugere que
uma multidão representa 'um grupo granae ae pessoas aefiniao
atraves ae um obfetivo em comum ou confunto ae sentimentos¨
|10|. A deIinição tradicional de multidão é desaIiada por
tecnologias de comunicação emergentes. De acordo com
Roughton et al. |5|, a utilização de tecnologias baseadas em
nuvem como o Twitter em tempo real mostra que a co-localização
dos participantes não é mais necessaria para engendrar o
comportamento coletivo comumente associado com a Iorma
tradicional de multidão. Na opinião destes autores, multidões
oIerecem um espaço de problema unico para a implantação da
tecnologia em Iunção da organização e composição dos seus
membros, e a escala apresentada pelo possivel numero de
participantes |5|.
Ainda que não exista uma deIinição amplamente aceita e
diIundida na literatura de Computação para uma crowa
computing, algumas tentativas Ioram Ieitas nos ultimos anos. Na
visão de |27|, a crowa computing combina aparelhos moveis e
interações sociais para alcançar computação distribuida em larga
escala. Ha quem veja também a crowa computing como um
complemento a cloua computing (computação em nuvem), como
o pesquisador Srini Devadas do MIT. Na opinião de Devadas |8|,
a crowa computing seria uma nova aproximação a computação,
relativamente nova e descrita como bilhões de seres humanos
conectados a Internet, analisando, sintetizando, inIormando,
destilando e provendo opinião de dados, usando apenas a maquina
cerebral. Por outro lado, esta deIinição não é exatamente a mesma
encontrada em |5|, onde os autores estudam a inIluência de smart
phones e da inIra-estrutura da nuvem na experiência das
multidões.
Neste trabalho, lançaremos mão de uma deIinição mais
abrangente de crowa computing, descrita na Wikipédia |30|, que
sustenta-a como 'um termo abrangente para aefinir uma miriaae
ae ferramentas ae interação humana que permitem a troca ae
iaeias, tomaaa ae aecisão não-hierarquica e a plena utili:ação
ao espaço mental ao globo terrestre¨. A Iigura 1 ilustra nossa
proposta de caracterização de sistemas de crowa computing na
Iorma de um diagrama de Venn, mostrando as intersecções que
identiIicamos entre as diversas classes de aplicações.
Com base neste modelo, cumpre salientar os seguintes pontos
levantados pelo nosso grupo:
• O principal objetivo do diagrama é descrever a estrutura
do espaço a ser estudado e projetado, motivando
pesquisadores - não apenas do CSCW - a entender a
paisagem onde estão inseridos os sistemas de
computação envolvendo multidões.
• O espaço em questão é bem mais abrangente do que a
Web 2.0`, ou mesmo a esIera da 'Computação Social¨,
a qual a comunidade de CSCW ja vem dedicando
atenção nos ultimos anos.
• Todas essas elipses descritas incentivam a exploração do
espaço mental e da inteligência coletiva na escala de
multidões.
Figura 1. Sistemas de Crowd Computing
As sub-seções que se seguem discutem cada uma das elipses da
Iigura 1.
2.1 Web 2.0
O termo Web 2.0 é associado com aplicações da Web que
Iacilitam o compartilhamento de inIormação, a interoperabilidade,
o design centrado no usuario e a colaboração na Web |31|. Assim,
exemplos de aplicações da Web 2.0 incluem blogs, serviços de
rede social, wikis, Iolksonomias e outros exemplos do chamado
software social.
As principais conIerências e fournals do CSCW ampliaram seu
escopo nos ultimos anos e passaram a dar atenção as comunidades
virtuais e a toda Iorma de Computação Social no contexto da Web
2.0. Existe uma vasta literatura abordando não apenas as
tecnologias e aplicações da Web 2.0, como as sinergias entre esta
e o CSCW motivo pelo qual não investiremos nossos esIorços
na descrição desta seção.
2.2 Computação Humana
Na computação humana, ao invés de o ser humano Iazer uso do
computador para resolver problemas - como acontece na
computação 'tradicional' - o computador coloca uma pessoa ou
grupo de pessoas para resolver o problema, posteriormente
agregando os resultados e obtendo a solução Iinal. A deIinição
mais conhecida de Computação Humana é encontrada na
dissertação de doutorado de Luis von Ahn, deIendida em 2005, e
entitulada "Human Computation" |6|:
• "Um paraaigma para a utili:ação ao poaer ae
processamento humano para resolver os problemas que
os computaaores ainaa não poaem resolver" |6|.
Outras deIinições encontradas na literatura sugerem
explicitamente o envolvimento de multidões nos sistemas de
Computação Humana, como a deIinição que se segue:
• "Uma nova area ae pesquisa que estuaa o processo ae
canali:ação aa vasta população aa Internet para
reali:ar tarefas ou fornecer aaaos para resolver
problemas aificeis que nenhum algoritmo eficiente
computacional poae ainaa resolver" |7|
De acordo com |9|, porém, tais deIinições deixam claro que a
Computação Humana não abrange sistemas onde a iniciativa e
Iluxo de atividades são direcionados principalmente pela
inspiração dos participantes - ao contrario de um plano
predeterminado concebido para resolver um problema
computacional. Portanto, uma parcela razoavel das aplicações da
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 25 -
Web 2.0, como projetos criativos de co-criação, não são
considerados dentro da esIera da Computação Humana. A
inclusão ou não da Wikipédia no arcabouço da Computação
Humana é motivo de debate entre alguns pesquisadores, havendo
o consenso, porém, de que o trabalho dos wikipedianos não se
limita meramente a realizar uma computação`.
Embora seja plenamente possivel que uma computação seja
realizada por apenas uma pessoa, as aplicações descritas na
literatura até o momento envolvem um numero grande de pessoas,
sendo o turco mecânico da Amazon e o reCAPTCHA do Google
dois dos principais sistemas discutidos. Este ultimo consiste em
um serviço gratuito que usa o conhecido teste CAPTCHA para
ajudar na digitalização de livros, jornais e programas de radio
antigos, ao mesmo tempo que previne a invasão a sites por robôs
|35|. De acordo com a pagina do oIicial do produto, cerca de 200
milhões de CAPTCHAs são resolvidos diariamente por pessoas de
todo o mundo. A soma de cada esIorço humano resulta na
digitalização de obras completas. Este exemplo é um exemplo
tipico de sistema que encaixa-se perIeitamente na intersecção dos
sistemas de computação humana com os sistemas de
crowasourcing, que serão descritos na seção seguinte.
Acreditamos que muitos dos desaIios de suportar o trabalho
humano cooperativo no contexto destes sistemas são semelhantes
aos desaIios do crowasourcing. Por este motivo, adiaremos esta
discussão para a proxima seção.
2.3 Crowdsourcing
O termo crowasourcing Ioi cunhado em 2006 pelo jornalista JeII
Howe, editor da revista americana Wired. Howe Ioi o primeiro a
apontar a tendência, num artigo publicado na revista em 2006
|29|. E comumente deIinido como o ato de terceirizar tareIas,
tradicionalmente realizadas por um empregado de uma empresa, a
um grupo indeIinido e grande de pessoas (a "multidão"), através
de uma chamada aberta. Uma deIinição mais abrangente,
Iornecida em |9|, deIine o crowasourcing como 'o ato ae
explorar as habiliaaaes perceptivas, enativas e cognitivas ae
muitas pessoas para alcançar um resultaao bem aefiniao, como
resolver um problema, classificar um confunto ae aaaos, ou
proau:ir uma aecisão¨. Consideramos esta deIinição bem mais
abrangente, sem compromisso como o empregado` ou a
empresa`, e é com ela que trabalhamos nesta pesquisa. E
importante salientar também o descomprometimento da deIinição
com o computador` ou a tecnologia`, muito embora os exemplos
Irequentemente discutidos na literatura sobre o assunto envolvam
alguma Iorma de apoio computacional. E o caso, por exemplo, da
Wikipédia, do Linux, do Yahoo! Respostas, ou mesmo do turco
mecânico da Amazon. Segundo |2|, 'a Internet e o surgimento aa
Wikipeaia fi:eram com que a multiaão passasse a ser
iaentificaaa como aetentora ae uma sabeaoria capa: ae criar
soluçòes improvaveis¨.
Arthur |32| aIirma que muito esIorço esta sendo dirigido para o
desenvolvimento de sistemas de crowasourcing e este esIorço tem
sido reIerenciado através de diversos nomes, incluindo peer
proauction, conteudo gerado pelo usuario, sistemas colaborativos,
sistemas comunitarios, sistemas sociais, pesquisa social, midia
social, inteligência coletiva, wikinomics, sabedoria das multidões,
smart mobs, colaboração em massa, e computação humana. Essas
nomeações são, na verdade, temas distintos e com caracteristicas
proprias. Isso deixa evidente a dimensão dessa area e conIirma a
possibilidade de intersecções com outras areas - ja ilustradas na
Iigura 1 - e variedade de exemplos que podem ser listados dentro
destas intersecções.
Muitas empresas têm investido em plataIormas de crowasourcing
para promover a inovação nos ultimos anos. O Innovation Jam,
por exemplo, traz um conceito mais genérico, o Jam`, deIinido
como um gigantesco brainstorming virtual onde Iuncionarios,
clientes e mesmo Iamiliares de Iuncionarios contribuem
ativamente, e em tempo real, na geração de idéias |34|. E um
evento que tem sido promovido pela IBM anualmente desde 2006
como parte de um plano de projeto para engendrar a inovação. Em
2006, por exemplo, a IBM reuniu mais de 150.000 pessoas de 104
paises e 67 empresas, lançando 10 novas empresas IBM |35|.
Um dos desaIios identiIicados pelo nosso grupo de pesquisa aqui
inclui a investigação dos obstaculos ao envolvimento de
multidões em contexto de crowasourcing, e de que maneira o
CSCW - ou um groupware para multidões` - poderia contribuir
neste contexto. Muitos sustentam que a globalização da Iorça de
trabalho através da multidão pode aIetar a maneira como as tareIas
são realizadas, bem como os eIeitos sociais de oIerecer este tipo
de trabalho em outros sistemas de crowasourcing. Na opinião de
|28|, a magia` do crowasourcing em grande parte esta em como
permitir que muitas pessoas contribuam na execução de uma
tareIa - de diversas maneiras - sem desIazer o que outros Iizeram
antes deles, em sua maior parte. Ja Erickson |28| sugere que uma
dimensão Iundamental do crowasourcing diz respeito a nature:a
aas tarefas que os individuos de uma multidão irão executar.
TareIas simples com resultados bem deIinidos estão intimamente
ligadas a incentivos simples e são candidatas a serem
incorporadas em jogos - como o ESP GAME. Na nossa visão,
essas tareIas estarão associadas a entidade social do coletivo e, em
alguns casos, a multiaòes em reae |18|, conIorme descrição que
sera Ieita na seção III. Ja tareIas complexas em que os individuos
precisam desenvolver competências são mais adequadas aos
mecanismos de incentivo enraizados na dinâmica social das
comunidades - envolvendo explicitamente mecanismos de suporte
a colaboração. Tais tareIas estarão relacionadas a multidões
organizadas em grupos.
2.4 Interação Audiência-Computador
As audiências envolvem individuos e grupos desconhecidos, para
os quais a comunicação em massa é abordada, geralmente unidos
por sua participação no uso da midia |34|. Uma tendência recente
esta voltada exatamente para o apoio a interação com multidões.
Segundo |13|, as pesquisas em Interação Humano-Computador
(IHC) estão evoluindo para incluir interações onde multidões
podem colaborar para produzir algum tipo de saida em uma
maquina. A area que trata especiIicamente desse assunto é
conhecida como Interação Multidão-Computador (do inglês,
Crowa Computer Interaction) e é neste campo de pesquisa que se
encaixa a interação audiência-computador. Sistemas que permitem
a interação de grandes publicos trazem novas oportunidades para
o entretenimento, educação e Iormação de equipe |39|.
A Interação Multidão-Computador começou a se destacar em
1991, durante uma apresentação no teatro eletrônico do
SIGGRAPH da implantação do Cinematrix Interactive
Entertainment System |40|. O Cinematrix descreve o sistema
como um 'mouse para as massas¨ sem Iio, de Iorma que toda a
audiência possui um controle em tempo real sobre jogos de
computador exibidos em um display |39|.
Tecnologias de interação audiência-computador são utilizadas, em
sua maioria, para aumentar o engajamento do publico em eventos,
com o objetivo de estimular uma maior interação social entre os
integrantes e obter um Ieedback util. Os trabalhos desenvolvidos
voltam-se especialmente para grandes exposições publicas, como
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 26 -
eventos olimpicos e shows musicais. Uma gama de produtos se
destacam, incluindo:
• Displays interativos: Em geral, no contexto de
audiências, grandes telões são utilizados com o intuito
de Iornecer inIormação, prover interatividade e
aumentar a colaboração entre os membros. A interação
com o usuario vai desde a simples apresentação de uma
inIormação, passando pela capacidade de detecção de
publico, até Iormas mais soIisticadas que usam
reconhecimento de expressão Iacial e gestos.
• Sistemas de Resposta a Audiência (Audience
Response System): Ferramentas voltadas para a criação
de apresentações interativas, criando um vinculo entre o
apresentador e o publico, conectando a audiência nos
diversos tipos de eventos e ajudando a estimular a
participação. Estes sistemas são mais explorados em
contextos educativos e os dispositivos utilizados pelos
alunos para transmitir suas respostas as perguntas são
conhecidos como lecture clickers ou, simplesmente,
clickers |14|.
• Cheering meters: Proposto em |11| e |12|, Ioi resultado
de estudos em interação publico-artista onde os autores
analisaram as Iormas de interação do publico para criar
o prototipo apresentado. O prototipo desenvolvido usa
uma unica variavel, o som emitido pelo publico,
podendo distinguir diIerentes niveis de vibração da
platéia, ao invés de apenas a presença de aplausos |11,
12|.
Em geral, as pesquisas têm se voltado para a construção de
soluções que visam apoiar audiências em grandes eventos, tendo
destaque para os eventos esportivos, como as Olimpiadas. Em sua
maioria, os sistemas se baseiam em aplausos, aclamações da
platéia, e clickers. O SoMo |41|, por exemplo, é um sistema de
votação cujo objetivo é julgar grandes eventos esportivos, como
Olimpiadas. A solução é baseada na captura de som e animação
do publico, batendo palmas, aplaudindo ou acenando, para avaliar
o desempenho dos atletas de Iorma natural |41|. A captura de som
é Ieita através de microIones distribuidos ao longo do estadio e o
movimento é captado por meio de câmeras que gravam o
comportamento da platéia. Um telão é utilizado para mostrar as
repetições e os melhores momentos do evento, além de Iornecer
um Ieedback da votação para a platéia. Ja o Opnionizer, descrito
em |20|, é um display projetado com o objetivo de promover a
interação entre as pessoas em ambientes publicos.
Tendo em vista as categorias de crowasourcing listadas
anteriormente, observa-se um estreitamento deste com a interação
audiência-computador a partir de duas categorias:
- Crowd Wisdom: A expressão do publico, capturada em sistemas
como o Opnionizer e o Magic Board |10|, é muito bem
aproveitada em pesquisas de opinião ou mercados preditivos; o
lecture clicker também é um exemplo onde a participação dos
alunos pode ajudar a encontrar soluções otimas para um dado
problema.
- Crowdvoting: E um exemplo que se encaixa bem nessa
intersecção de interação audiência-computador com
crowasourcing. Embora isto não seja mencionado na literatura
investigada, os sistemas cujo objetivo principal é o julgamento do
publico representam uma Iorma de crowavoting, sendo o sistema
de votação das Olimpiadas de Inverno de 2010 |38| um exemplo
Iiel. O objetivo era envolver o publico nos eventos dos jogos,
dando oportunidade de participar da pontuação. Foram criados
três prototipos voltados para os seguintes espectadores: para o
publico participante do evento, dispositivos ARS Ioram instalados
no descanso de braço de cada assento; os telespectadores tinham a
oportunidade de votar utilizando um aplicativo para smart phone;
e para os espectadores online, uma interIace de votação Ioi
disponibilizada junto ao video.
3. TIPOLOGIA DE MULTIDÔES
VIRTUAIS
Fenômenos de massa são investigados desde o século XIX por
sociologos como Gustave Le Bon |23|, Sigmund Freud |22| e
outros. Desde então, diversas teorias Ioram desenvolvidas para
explicar o comportamento de multidões e diIerencia-lo do
comportamento individual de seus membros, como a psicologia
de multidões e a teoria do comportamento de multidões de Freud.
Alguns mitos sobre multidões reais também são reportados na
literatura |21|.
Russ |16| sustenta que as multidões virtuais têm suas origens nas
mesmas leis que regem as multidões reais, variando porém de
tamanho, velocidade e alcance. Carr |17| propôs recentemente
uma tipologia para melhor caracteriza-las, em um dos posts de seu
blog Rough Type. E importante observar que os tipos propostos
pelo autor não são mutuamente exclusivos, ou seja, uma mesma
aglomeração de pessoas pode apresentar caracteristicas de
diversos tipos, em determinado momento da interação ou ao longo
do tempo. Na opinião de Dron e Anderson |18|, uma conIusão é
Ieita na literatura quando se tenta explicar as varias Iormas de
organização social das multidões virtuais através de uma unica
lente. Segundo os autores, ha de Iato três entidades distintas - o
Grupo, a Reae, e o Coletivo - e a consciência dessas entidades
pode ser explorada pelos projetistas de soItware para melhor
atender aos usuarios das aplicações envolvendo multidões. A
Figura 2 ilustra a tipologia proposta por Carr, onde cruzamos os
tipos propostos no trabalho do autor com as entidades de Dron e
Anderson. Nosso grupo também descreveu algumas instâncias
representativas destas multidões ilustrando cada um dos tipos.
Figura 2. Tipologia de Multidões Virtuais ¡17]
A multiaão aa proaução social - primeira entidade identiIicada
por Carr representa um grande grupo de pessoas que emprestam
seus talentos distintos para a criação de produtos - como a
Wikipedia ou o Linux; ja a multiaão aa meaia atua como um
grupo de estudo, proporcionando um julgamento 'médio¨ que, em
alguns casos, é mais preciso que o de um individuo; a multiaão
aa mineração descreve um grande grupo de pessoas que, sem o
conhecimento explicito dos seus membros, produz um conjunto
de dados que podem ser coletados e analisados a Iim de obter
inIormações sobre os padrões de comportamento. O quarto tipo
identiIicado Ioi denominado multiaão aa reae e representa
qualquer grupo que negocie inIormações através de um sistema de
comunicação compartilhada como o Facebook. O autor
identiIicou ainda a multiaão aa transação Iomentando operações
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 27 -
ponto-a-ponto e, por sugestão de um leitor do seu blog, um sexto
e ultimo tipo chamado de multiaão ao evento, representando um
grupo que através das Ierramentas de comunicação virtual
organiza-se para eventos que podem acontecer no mundo real ou
virtual. A Iigura 3 ilustra as três Iormas de organização social de
multidões virtuais.
Multiaòes em grupos normalmente possuem papéis para seus
integrantes e raramente apreciam o anonimato. São os menos
escalaveis, uma vez que sua eIicacia diminui depois de atingir um
determinado numero de participantes. Isto ocorre porque os
mecanismos que garantem a eIicacia da colaboração como o
'social grounaing' e o a carga cognitiva compartilhada, so podem
ocorrer com poucos participantes. Multiaòes em Reae constituem
uma Iorma mais Iluida de entidade social em que os membros
aderem, criam e se retiram de conexões sociais e vinculos em
Iunção de alguns Iatores. Uma rede conecta individuos
distribuidos, que não necessariamente conhecem todos os outros a
quem estão conectados. Sua Iorma é mutavel. A terceira e ultima
entidade, o Coletivo, representa a Iorma mais escalavel de
multidão na qual os membros participam para o beneIicio
individual, mas suas atividades são colhidas e agregadas para
gerar a sabedoria das multidões`. No Coletivo, o conjunto de
ações dos membros é processado por algoritmos de agregação que
podem ser tão simples como uma contagem de votos, ou tão
complexos quanto um Iiltro colaborativo multi-camadas.
Individuos não têm conhecimento dos outros, não estão
conectados e nem comprometidos.
Figura 3. Organização Social de Multidões Virtuais
4. SUCESSO E FRACASSO DE
APLICAÇÔES ENVOLVENDO
MULTIDÔES
O sucesso das aplicações que tiram proveito do espaço mental de
multidões parece depender Iundamentalmente do conceito de
massa critica, como pode ser observado em serviços de redes
sociais virtuais como o Facebook, que se Iosse uma nação seria
uma das três mais populosas do mundo com mais de 750 milhões
de usuarios ativos em julho de 2011. Pensando nestas questões,
Russ |16| desenvolveu um modelo ou arcabouço de quatro Iases
cujo principal objetivo era entender as caracteristicas e o
comportamento de multidões reais e virtuais - para melhor
projetar e prever o sucesso ou Iracasso de serviços e comunidades
virtuais. A Iigura 4 ilustra graIicamente o modelo de Russ para
multidões virtuais.
Na Iase de iniciação, o Iator mais importante é o conteudo
valioso. Sem nenhum atrativo ninguém vai estar disposto a gastar
tempo com o serviço virtual. Além do conteudo, usabilidade e
simplicidade da interIace do usuario são essenciais. Na segunda
Iase - de propagação - os melhores membros são deIinidos. Os
usuarios começam a popular a plataIorma virtual e a decisão sobre
juntar-se ou não a comunidade depende dos membros existentes.
Esta transição é desencadeada pelo airecionamento nos outros`.
Em resumo, os membros ativos e que ocupam uma posição central
na multidão exercem sua inIluência: a) gerando conteudo novo; b)
minimizando o risco para os outros que querem entrar; e c)
ajudando os novatos nos problemas diarios do sistema (gerando
conIiança).
Figura 4. Modelo de Multidões Virtuais ¡16]
Todavia, os melhores` membros não são suIicientes para o
crescimento da multidão e Iormação de uma estrutura auto-
organizavel, sendo necessaria uma terceira etapa, a de
ampliIicação. Nesta Iase, é importante oIerecer aos usuarios não
apenas uma plataIorma estavel e escalavel, mas um ambiente
social saudavel. A transição de Iase é marcada pela massa
critica`. Nesta etapa, caracteristicas de Iacilitação social que
suportam as praticas cotidianas e comportamentos sociais são
essenciais para manter o serviço em expansão e viabilizar a
diIusão viral. Na quarta e ultima Iase - de terminação - alguns
serviços virtuais são descontinuados ou desmembrados, em
decorrência da saturação.
Para Iinalizar esta seção, cumpre salientar que a construção de
massa critica ja era uma preocupação antiga dos teoricos do
groupware. Da mesma Iorma, preocupações com avaliações dos
sistemas de groupware também ja Ioram reportadas na literatura, e
no contexto de multidões, elas se tornam ainda mais desaIiadoras.
5. MULTIDÔES E GROUPWARE
Embasados nos requisitos basicos de comunicação, coordenação e
cooperação, os sistemas colaborativos apoiam os grupos na
realização dos seus trabalhos, quebrando barreiras de tempo e
espaço. Produtos comerciais CSCW são Ireqüentemente
reIerenciados como Groupware |19|. Segundo |19|, groupware
pode ser visto como a classe de aplicações, para pequenos grupos
e para as organizações, resultante da Iusão entre computadores,
grandes bases de inIormação e tecnologia de comunicações;
podendo ou não apoiar especiIicamente a cooperação.
Embora o conceito induza um entendimento que se restringe a um
pequeno grupo de trabalho, CSCW passou a abranger
recentemente mais que isso. Pode-se pensar em aglomerações de
proporções maiores, onde os membros compartilham ou não
algum tipo de interesse, colaboram mesmo que
inconscientemente, podem ou não se conhecer, porém estão
inseridos em um contexto comum, quaisquer que sejam as
chances que os uniu. Dentro desse dominio maior, nosso grupo de
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 28 -
pesquisa esta interessado em estudar uma nova modalidade dentro
do CSCW: o crowaware.
Neste trabalho, crowawares são deIinidos como sistemas voltados
para o suporte a multidões virtuais e reais, herdando os
componentes principais do groupware, aliados a Web 2.0 e a
Computação em Nuvem; de Iorma a prover serviços avançados a
qualquer momento e em qualquer lugar, conectando individuos
inseridos em ambientes heterogêneos. Sendo assim, as classes de
sistemas esquematizadas na Figura 1 adquirem um espaço mais
Iormalizado dentro do CSCW como um crowaware.
Os sistemas de crowdware podem ser analisados da mesma Iorma
que os de groupware, categorizados na noção de tempo e espaço,
conIorme a matriz 2x2 proposta por |19|:
• Mesmo tempo e mesmo local: Trata-se de sistemas que
apoiam multidões reunidas em um mesmo local Iisico e
ao mesmo tempo. Os exemplos mais comuns desse tipo
de multidões são as audiências. Isso torna evidente que,
para determinados dominios de aplicação, a ubiqüidade
torna-se um requisito indispensavel em crowawares.
Como exemplos dessa categoria, pode-se destacar os
seguintes sistemas: Cinematrix, onde os membros se
encontram no mesmo espação Iisico; e o GoogleDocs,
no qual o mesmo espação virtual é compartilhado.
• Mesmo tempo e locais diferentes: Os membros podem
interagir compartilhando do mesmo espaço virtual (a
exemplo do Twiddla e GoogleDocs), como também
podem utilizar espaços de trabalho diIerentes, porém,
tendo a percepção da presença e atividade dos demais
membros (como ocorre em redes sociais). E importante
lembrar que, em certos casos, onde a multidão coopera
em prol de um trabalho comum, esses sistemas precisam
coordenar as atividades realizadas.
Figura 5. CROWDWARE
• Tempos Diferentes e Mesmo Local: Em geral,
multidões encaixadas nesta classe alcançam um grau de
anonimidade alto. A tecnologia pode interagir com uma
multidão que muda a todo momento, que compartilha de
interesses em comum (noticias em displays) ou que
colabora para um objetivo comum (uma pesquisa em
um terminal eletrônico), sem a necessidade da
percepção e de uma interação explicita. Como também
pode existir a necessidade de percepção em um contexto
onde o grau de anonimidade é baixo (Google Gocs).
• Tempos Diferentes e Locais Diferentes: Esta classe
inclui sistemas que vão de baixa (redes sociais) a alta
anonimidade (compra coletiva), pequenas
(comunidades, Google Docs) e grandes multidões
(crowavoting), com (Flick, Google Docs) ou sem
necessidade de percepção (compra coletiva),
compartilhando (Wikipédia, Google Docs) ou não
compartilhando (crowafunaing) de um espaço virtual
em comum.
Observamos que os quadrantes não são mutuamente exclusivos, e
que o crowasourcing se Iez presente em todos. A Figura 5,
analisada em conjunto com a Figura 1, revela a dimensão que
crowasourcing possui dentro da crowa computing. A maioria dos
sistemas estão inclusos nesta elipse e todas as regiões de
intersecção são crowasourcing. Isso leva a uma reIlexão e ao
seguinte questionamento: no Iuturo, o crowasourcing se
transIormara em um termo designando o arcabouço de todas as
modalidades da crowa computing?
6. MULTIDÔES E A FRAGMENTAÇÃO
DO CSCW
Como programa de pesquisa, o CSCW surgiu em resposta ao
desdobramento de duas crises do Iinal dos anos 80: a da
comunicação mediada por computador (CMC) e a da automação
do escritorio. Até a década de 80, a maioria dos trabalhos sobre
apoio a grupos e ao trabalho em equipe Iocavam em apoiar os
processos de decisão de grupos de pessoas Iisicamente juntas.
Com o advento da tecnologia de redes de computadores, o Ioco
mudou para o apoio ao trabalho em equipe a distância |37|.
Nos ultimos anos, a evolução dos soItwares, tecnologias de
hardwares incluindo as redes sem Iio e dispositivos de
posicionamento, somados ao continuo amadurecimento da
Internet e da computação ubiqua, proporcionaram o uso intensivo
de aplicações e serviços avançados, a qualquer momento e em
qualquer lugar, gerando graves implicações para a matriz do
CSCW. Em uma conIerência realizada em 2008 (COOP08),
muitos praticantes demonstraram preocupação com os novos
ventos, sobretudo com a popularização da midia social e dos
Ienômenos de colaboração de massas que começavam a proliIerar.
De la para ca, muitos pesquisadores da area, incluindo alguns
veteranos do CSCW e do Groupware, envolveram-se numa
disputa por posições, assumindo novos papéis, como Grudin e
Krault que publicaram recentemente na area de Wiki. As ultimas
duas conIerências anuais do CSCW promovidas pela ACM (2010-
2011) apresentaram trabalhos abordando todas as elipses
ilustradas na Iigura 1 deste artigo, da Web 2.0 a interação
audiência-computador. Alega-se que este tipo de pesquisa é
reativa no que se reIere a tecnologia e ao projeto, não
contribuindo de Iorma sistematica e construtiva para o
desenvolvimento tecnologico |25|. Dentro desse cenario, existe o
sentimento de perplexidade compartilhado por uma parcela da
comunidade do CSCW de que o programa de pesquisa não mais
oIerece direções conIiaveis |33|.
Em um recente trabalho de avaliação critica do cenario de
pesquisa atual do CSCW, Schmidt |25| sustenta que a pesquisa do
CSCW dos dias atuais representa uma vida apos a morte das
tecnologias de comunicação mediada por computador (CMC)
dentro do CSCW: "Onaa apos onaa (ae faciliaaaes ae
comunicação), aparentemente novas, chamaram a atenção
repetiaas ve:es aa miaia e ao publico em geral. mensagens
instantaneas, mensagens ae texto, chat, blogs, e assim por aiante.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 29 -
[...{ E agora, mais uma ve:, como resultaao aa super-
plataforma` forneciaa pelo navegaaor web, estas faciliaaaes
atingiram uma escala ae massa tambem" |25|. No mesmo
trabalho de pesquisa do autor, um espaço consideravel é dedicado
a critica aspera a alguns dos principais representantes do CSCW,
que lamenta o estagio avançado de Iragmentação` a que chegou o
mesmo. A esperança de Schmidt se perde quando aqueles que
poderiam Iazer algo para mudar esta situação, hesitam, ratiIicando
uma indecisão da comunidade de pesquisa desde os primeiros
anos de sua existência. Tal Iato é evidenciado quando ele comenta
o trabalho de revisão bibliograIica realizado em 2003 por Olson &
Olson |26| - dois veteranos do CSCW: "Ele associa o CSCW com
a area ae pesquisa ae CMC que o preceaeu por muitos anos. Mas
o mais notavel e que ele aeixa ae fora o corpo significativo ae
pesquisa ao CSCW que envolve investigaçòes ae praticas ae
trabalho cooperativo em ambientes profissionais [...{ Termos
como etnografia`, estuao ao local ae trabalho`, ou trabalho ae
campo`, nem mesmo aparecem no artigo" |25|.
E como se ele dissesse: 'Eles não sabem o que Iazem". Na
conclusão do trabalho, o autor enIatiza que as aplicações da Web
envolvendo colaboração de massas - nos ultimos anos - Iizeram
ressurgir um CSCW ja sem gas para prosseguir, levantando até
mesmo a possibilidade do campo de estudo como prejudicial` a
ciência. Todavia, o autor não Iornece nenhum indicativo dos
rumos que poderiam ser tomados, ou mesmo se as quatro letras
|1| teriam salvação. O trabalho do autor não Iaz nenhuma
reIerência aos Ienômenos mais recentes envolvendo massas como
o crowasourcing, os sistemas de computação humana e de
interação audiência-computador. Tal Ierramental seria tambem
apenas uma reedição das tecnologias de comunicação mediada por
computador nos tempos atuais do CSCW?
E Iato que o acrônimo do CSCW, pelo menos da Iorma como Ioi
concebido ha algumas décadas, não mais encontra lugar no
Mundo 2.0` da ubiquidade, da Web social, e das multidões. O
primeiro 'C' mudou bastante, ja que os tablets, smartphones e
outros dispositivos concorrem de igual para igual com os
computadores tradicionais; o 'S' do suporte mudou sensivelmente:
de Ierramenta de apoio a tecnologia essencial; o segundo 'C' - do
cooperativo - evoluiu dos grupos pequenos para as multidões; e
Iinalmente o 'W' do trabalho migrou dos ambientes proIissionais
das grandes corporações para contextos de trabalho inIormais, ou
mesmo outros contextos como o lazer e a educação. Resta agora a
duvida do que sera dito a nova geração de pesquisadores, pois
durante décadas vendeu-se a idéia de que o CSCW era uma Iesta
da qual todos poderiam participar - e ninguém pagaria a conta.
7. CONCLUSÔES
O principal objetivo deste artigo Ioi apresentar uma proposta de
caracterização de sistemas de crowa computing - deIinida como
uma miriade de Ierramentas de interação humana que permitem a
utilização do espaço mental de multidões - e investigar as
sinergias com o campo de pesquisa do CSCW. Na opinião dos
autores, esta miriade é representada atualmente pela união de
quatro classes de sistemas identiIicadas na Iigura 1 do artigo.
O estudo realizado pelo nosso grupo até aqui nos permite
enxergar a Web 2.0 apenas como ponto de partida para um
Mundo 2.0 no qual as multidões terão seu lugar garantido, e no
qual o arcabouço do CSCW precisa ser revisto. Para que se
viabilize a plena utilização do espaço mental de multidões e
exploração da inteligência coletiva, papel de destaque devera ser
exercido pelas tecnologias ubiquas, persuasivas, e também
colaborativas.
Para alguns pesquisadores mais otimistas do CSCW a onda das
multidões tende a ser vista apenas` como mais um exemplo dos
dilemas que historicamente vêm atormentando uma parcela da
comunidade. Outros alegam que o Iato de o CSCW abranger
diIerentes programas de pesquisa, o que para muitos implica uma
virtude dessa comunidade, impede que se crie uma contribuição
sistematica e cumulativa ao desenvolvimento de novas tecnologias
|25|. Apesar dessas divergências, descritas sobretudo em |25|, ha
uma opinião unânime no nosso grupo de pesquisa de que o
modelo de programa multidisciplinar e o sistema de quatro letras
em busca de um contexto chegaram a um impasse. Na luta para
superar esta situação, encontra-se em jogo o Iuturo do CSCW.
8. REFERÊNCIAS
|1| BANNON, Liam J.; SCHMIDT, Kjeld: CSCW: Four
characters in search oI a context. In ECSCW89, 13-15 Sept.
1989, Gatwick, London, London, 1989, pp. 358-372.
|2| DOAN, Anhai; RAMAKRISHNAN, Raghu; HALEVY,
Alon Y.. Crowdsourcing systems on the World-Wide Web.
Communications of the ACM 54.4 (2011): 86. Web.
|3| ANDERSON, Terry. Higher education evolution: Individual
Ireedom aIIorded by educational social soItware. In: M.
Beauaoin (Ea.), Perspectives on the Future of Higher
Eaucation in the Digital Age. (pp. 77-90). New York: Nova
Science Publishers.
|4| SUROWIECKI, James. A sabeaoria aas multiaòes. Rio de
Janeiro: Record, 2006.
|5| ROUGHTON, A. et al. The Crowd in the Cloud. In: 12th
Australasian User Interface Conference (AUIC2011), Perth,
Australia, January 2011.
|6| VON AHN, L. Human computation. In: Proceeaings of the
4th International conference on Knowleage capture, p.5-
6,October 28-31, 2007, Whistler, BC, Canada.
|7| CHANDRASEKAR, R.; CHI, E.; CHICKERING, M.;
IPEIROTIS, P. G.; MASON, W.; PROVOST, F.; TAM, J.;
VON AHN, L. Front matter. In: Proc. SIGKDD HCOMP
2010.
|8| DEVADAS, S. Especialista aefenae conceito ae crowa
computing. Disponivel em:
·http://computerworld.uol.com.br/tecnologia/2010/07/22/esp
ecialista-deIende-conceito-de-crowd-computing~. Acesso
em: jul. 2011.
|9| QUINN, A.; BEDERSON, B.B. Human Computation: A
Survey and Taxonomy oI a Growing Field. In: Proceeaings
of CHI 2011.
|10| WIKIPEDIA. Crowa. Disponivel em:
·http://en.wikipedia.org/wiki/Crowd~. Acesso em: jul. 2011.
|11| BARKHUUS, Louise. Engaging the Crowa at Concert
Events. Web. 14 Fev 2011.
|12| BARKHUUS, Louise; JORGENSEN, Tobias. Engaging the
crowd: studies oI audience-perIormer interaction. In: CHI
´08 extenaea abstracts on Human factors in computing
systems. New York, NY, USA: ACM, 2008. 29252930.
Web.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 30 -
|13| SETIADARMA, Katherine. Crowa computer interaction.
Disponivel em:
·http://www.cs.auckland.ac.nz/courses/compsci705s2c/assig
nments/SeminarReports09/crowdComputing¸kset010.pdI~.
Acesso em: jan. 2011.
|14| MURPHY, Trevor. Success and Iailure oI audience response
systems in the classroom. Proceeaings of the 36th annual
ACM SIGUCCS fall conference. moving mountains, bla:ing
trails. New York, NY, USA: ACM, 2008. 3338. Web.
|15| TANG, Anthony et al. Designing Ior bystanders: reIlections
on building a public digital Iorum. Proceeaing of the twenty-
sixth annual SIGCHI conference on Human factors in
computing systems. New York, NY, USA: ACM, 2008. 879
882.
|16| RUSS, C. Online Crowds - Extraordinary mass behavior on
the Internet. In: Proceeaings of i-Meaia ´07, Graz, Austria,
pp.65-76, October 2007.
|17| CARR, Nicholas. A typology of crowas. Disponivel em:
·http://www.roughtype.com/archives/2010/03/a¸typology¸oI
¸c.php~ . Acesso em: jul. 2011.
|18| DRON, J.; ANDERSON, T. How the crowd can teach. In: S.
Hat:ipanagos & S. Warburton (Eas.), Hanabook of
Research on Social Software ana Developing Community
Ontologies (pp. 1-17).
|19| ELLIS, Clarence A.; GIBBS, Simon J.; REIN, Gail.
Groupware - Some Issues and Experiences. Communications
of the ACM, v.34, p. 38-58, 1991.
|20| BRIGNULL, Harry; ROGERS, Yvonne. Enticing people to
interact with large public displays in public spaces. IN:
PROCEEDINGS OF THE IFIP INTERNATIONAL
CONFERENCE ON HUMAN-COMPUTER INTERACTION.
2003.
|21| SCHWEINGRUBER, David; WOHLSTEIN, Ronald T. The
Maaaing Crowa Goes to School. Myths about Crowas in
Introauctory Sociology Textbooks. Teaching Sociology
33(2):136-53. 2005.
|22| FREUD, S. Group Psychology ana Analysis of the Ego.
XVII (2nd ed.), Hogarth Press, 1955.
|23| LE BON, Gustav. The Crowa. A Stuay of the Popular Mina.
London: T. Fisher Unwin.
|24| TAPSCOTT, Don; WILLIAMS, Anthony D. (2007).
Wikinomics. como a colaboração em massa poae muaar o
seu negocio. Rio de Janeiro: Editora Nova Fronteira. 2006.
|25| SCHMIDT, K. Divided by a common acronym: On the
Iragmentation oI CSCW. In: Proceeaings of the European
conference on Computer Supportea Cooperative Work 2009,
Springer London: Viena, Austria. p. 223-242.
|26| OLSON, Gary M.; OLSON, Judith S. Groupware and
computer-supported cooperative work. In: The Human-
Computer Interaction Hanabook. Funaamentals, Evolving
Technologies ana Emerging Applications, Lawrence
Erlbaum, Mahwah, New Jersey, 2003, pp. 583-595.
|27| MURRAY, D.G.; YONEKI, E.; CROWCROFT, J.; HAND,
S. 2The Case Ior Crowd Computing. In: ACM MobiHela,
2010.
|28| ERICKSON, T. Some Thoughts on a Framework Ior
Crowdsourcing. In: CHI 2011 Workshop on Crowasourcing
ana Human Computation. IBM T. J. Watson Research
Center.
|29| HOWE, J. The Rise of Crowasourcing, Wired, 14.
|30| WIKIPEDIA. Crowa computing. Disponivel em:
·http://en.wikipedia.org/wiki/Crowd¸computing~. Acesso
em: jul. 2011.
|31| WIKIPEDIA. Web 2.0.
·http://pt.wikipedia.org/wiki/Computação¸social~. Acesso
em: jul. 2011.
|32| ARTHUR, Edgard. Crowasourcing. Quanao a multiaão
supera o especialista. Disponivel em:
·http://www.crowdlabore.com.br/blog/~. Acessado em: Iev.
2011.
|33| SCHMIDT, Kjeld. Cooperative Work ana Coorainative
Practices. Contributions to the Conceptual Founaations of
Computer-Supportea Cooperative Work. 1º ed. Springer,
2011. Print.
|34| IBM. Software, Open Source, SOA, Innovation, Open
Stanaaras, Trenas. Disponivel em:
·https://www.ibm.com/developerworks/mydeveloperworks/b
logs/ctaurion/entry/innovation¸jam¸2008?lang÷en~. Acesso
em: jul. 2011.
|35| IBM. The history of Jams. Disponivel em:
·https://www.collaborationjam.com/~. Acesso em: jul. 2011.
|36| BENKLER, Y. Coase´s Peguin, or, Linux and the Nature oI
the Firm. In: Yale Law vol. 112.
|37| TERKEN, Jacques; SUBRAMANIAN, Sriram;
ZANCANARO, Massimo. Special issue on user-centred
design and evaluation oI ubiquitous groupware. In: Personal
ana Ubiquitous Computing 12 (2008): 179180. Web.
|38| LAM, Christopher; LANG, Phun; SOO, JeII; BOND, Tim;
HAGGMAN, Lindsay. 2010 Winter Olympics Crowd
Voting. In: CHI 2009, April 4 9, 2009, Boston.
|39| Maynes-Aminzade, Dan; PAUSCH, Randy; SEITZ, Steve.
Techniques Ior Interactive Audience Participation. In:
Proceeaings of the 4th IEEE International Conference on
Multimoaal Interfaces. Washington, DC, USA: IEEE
Computer Society, 2002. 15. Web. 14 Fev 2011.
|40| CARPENTER, L. Cinematrix, viaeo imaging methoa ana
apparatus for auaience participation. US Patent, Nos.
5210604 (1993), 5365266 (1994).
|41| VAN BEUSEKOM, Marcelle; BIGNERT, Jakob; TASAR,
Özgür. SoMo: an automatic sound & motion sensitive
audience voting system. In: CHI ´04 extenaea abstracts on
Human factors in computing systems. New York, NY, USA:
ACM, 2004. 16801684. Web.
|42| FOGG, BJ. Mass interpersonal persuasion. An early view of
a new phenomenon.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 31 -

S E S S Ã O 2
Inteligência Coletiva
Um modelo para o suporte computacional da inteligência
coletiva na web
Straus Michalsky
Departamento de Ciência da Computação
Instituto de Matemática e Estatística (IME)
Universidade de São Paulo (USP)
straus@ime.usp.br
Marco Aurélio Gerosa
Departamento de Ciência da Computação
Instituto de Matemática e Estatística (IME)
Universidade de São Paulo (USP)
gerosa@ime.usp.br

ABSTRACT
The web 2.0 is collaborative. From the interactions between
people, emerges what has been called collective intelligence.
There are several algorithms to support collective intelligence in
web systems, but their use is often complicated, making it difficult
to exploit their potential. Since the concept of collective
intelligence is very broad, we performed a domain analysis in
existing systems to create a computational model for the
collective intelligence in the web.

RESUMO
A web 2.0 é caracterizada por ser colaborativa. Das interações
entre pessoas, emerge o que vem sendo chamado de inteligência
coletiva. Há vários algoritmos para dar suporte à inteligência
coletiva em sistemas web, porém muitas vezes seu uso é
complicado, dificultando a exploração do seu potencial em
aplicações web. Como o conceito de inteligência coletiva é muito
amplo e mal definido, foi realizada uma análise de domínio, uma
classificação das técnicas e seus usos nos sistemas atuais de forma
a criar um modelo para o suporte computacional da inteligência
coletiva na web.
Categories and Subject Descriptors
H.5.3 [Group and Organization Interfaces]: Web, H.5.3
[Group and Organization Interfaces]: Web-based interaction
General Terms
Algorithms, Design, Human Factors.
Keywords
Collective Intelligence, Domain analysis, Web, collaborative
systems.
Palavras-Chave
inteligência coletiva; análise de domínio; web 2.0; sistemas
colaborativos.
1. INTRODUÇÃO
De 2000 a 2010 a quantidade de usuários da internet subiu 440%
1
,
atingindo quase dois bilhões de pessoas. Essa quantidade de
indivíduos navegando e gerando informações, direta ou
indiretamente, produz uma quantidade de dados inimaginável há
algumas décadas. Anderson [1] caracteriza essa situação como
Era do Petabyte.
A web 2.0 é colaborativa. Sites que possibilitavam apenas
interações monousuário passaram a incorporar recursos voltados
para colaboração direta e indireta entre os usuários. Sites de
comércio eletrônico, como a Amazon
2
, por exemplo, passaram a
oferecer para cada produto suporte à avaliação, resenha, troca de
mensagens, wiki, compartilhamento de fotos, filtragem
colaborativa, recomendação. Os sistemas web 2.0 ficam melhores
na medida em que mais usuários interagem e contribuem [2], [3].
A inteligência coletiva (IC) é comumente entendida com um
comportamento que emerge da colaboração em um grupo de
indivíduos. Uma das razões do sucesso dos sites na web 2.0 é
justamente aproveitar a inteligência coletiva [4]. Assim, um
desafio para os sites da web 2.0 consiste em oferecer ferramentas
que fomentem a inteligência coletiva.
A fim de simplificar o suporte à inteligência coletiva, este
trabalho apresenta uma modelagem do suporte computacional
para a inteligência coletiva em aplicações web 2.0. Para que tal
modelagem seja avaliada, será executada uma análise de domínio
a fim estudar como a inteligência coletiva é explorada na web 2.0,
utilizando uma abordagem baseada no método Feature-Oriented
Domain Analysis (FODA) [6].
2. INTELIGÊNCIA COLETIVA NA WEB
Apesar de ser um tema muito comentado atualmente, a
inteligência coletiva já vem sendo estudada desde o início do
século XX. As primeiras ligações do termo inteligência coletiva
com computadores foram feitas em 1980 por Johnson-Lenz &
Johnson-Lenz [7] em um trabalho chamado 'Groupware. the
emerging art of orchestrating collective intelligence`. A
capacidade de coletar informações de milhões de pessoas na web
abriu novas possibilidades adicionando assim uma nova dimensão
a esse tema. O conceito web 2.0 e suas características foram
definidas durante uma conferência realizada com a participação de
Tim O`Reilly e Dale Dougherty. Nela Ioram observados que
varias das empresas que sobreviveram ao estouro da 'bolha ponto
com¨ que aconteceu em 2001 possuiam características em
comum, dentre essas características está a utilização da
inteligência coletiva. Essa inteligência vem recentemente

1
http://www.internetworldstats.com/stats.htm.
2
http://www.amazon.com.

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference10, Month 12, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010.$10.00.

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 33 -
ganhando notoriedade de sociólogos e teóricos [5] e [8], nos
negócios [9] e [10] e na ciência da computação [2] e [3].
O termo inteligência coletiva ainda é amplo e mal definido. A
seguir são apresentadas algumas definições encontradas na
literatura. [8] descreve a inteligência coletiva como uma
'inteligência distribuida por toda a parte, incessantemente
valorizada, coordenada em tempo real, que resulta em
mobilização eIetiva das competências¨. De acordo com Alag [3]
quando um grupo de indivíduos colabora ou compete entre si,
surge uma inteligência ou um comportamento que de outra forma
não existiria; isto é conhecido como inteligência coletiva. Já no
Handbook of Collective Intelligence [11], produzido
colaborativamente e organizado pela equipe do MIT Center for
Collective Intelligence, a inteligência coletiva é definida como
sendo grupos de indivíduos fazendo coisas coletivamente que
parecem ser inteligentes. Eles também caracterizam a inteligência
coletiva como grupos enfrentando ou tentando novas situações ou
grupos aplicando o conhecimento para se adaptar a um ambiente
em mudança. Normalmente tecnólogos usam o termo inteligência
coletiva no sentido de que a combinação de comportamento,
preferências ou ideias de um grupo cria novas percepções [2]. Em
analogia à inteligência individual, Woolley et al. [12] definem
inteligência coletiva em um grupo como a habilidade geral do
grupo de executar uma ampla variedade de tarefas. Em resumo, as
definições encontradas na literatura colocam a inteligência
coletiva como um comportamento ou 'inteligência¨ resultante da
colaboração em um grupo.
3. SUPORTE COMPUTACIONAL DA
INTELIGÊNCIA COLETIVA
A inteligência coletiva pode emergir como um resultado natural
da colaboração e, portanto, recursos computacionais para suporte
à colaboração podem ser vistos como suporte computacional à
inteligência coletiva. Entretanto, neste trabalho daremos o
enfoque na inteligência coletiva que é fomentada em um grupo de
pessoas por informações derivadas por meio do processamento de
dados proveniente da interação social e individual com o sistema.
Dessa forma, é importante salientar a diferença entre um
mecanismo de inteligência coletiva e um mecanismo de
colaboração. Enquanto um mecanismo de colaboração fornece
meios diretos de colaboração, os mecanismos de inteligência
coletiva apresentam as informações derivadas dos dados
coletados. Um exemplo de mecanismo de colaboração é um bate-
papo, que facilita a comunicação em tempo real entre os usuários
do sistema. Já um exemplo de mecanismo de inteligência coletiva,
do ponto de vista deste trabalho, é uma lista de recomendações de
objetos de interesse do usuário, apresentado na página cujo objeto
está sendo visualizado e que é construída com base nas ações dos
usuários.
Alag [3] apresenta uma divisão para o suporte computacional à
inteligência coletiva em três partes: a primeira consiste nos meios
de coleta de dados, a segunda, nas formas de derivação de
inteligência coletiva, e a terceira, nas aplicações nos sistemas web
2.0. Baseado nessa divisão foi criado um modelo (Figura 1) de
como a inteligência coletiva é fomentada computacionalmente em
um grupo de usuários que estão interagindo em um sistema web
2.0. Para que a inteligência coletiva seja fomentada é necessária a
coleta de dados das interações dos usuários, a derivação da
inteligência coletiva desses dados e a apresentação dos resultados
na forma de mecanismos de inteligência coletiva.
A coleta de dados é efetuada capturando-se ações realizadas na
colaboração ou mesmo durante a interação de um indivíduo com o
sistema (representada pelo termo interação individual na Figura
1). A coleta é explícita ou implícita [3]: a coleta explícita
acontece quando o usuário está ciente que ele está adicionando
informação ao sistema. São exemplos de coleta explícita:
votações, criação de revisões, produção de conteúdo, inserção de
tags ou mesmo adição de comentários. Já a coleta implícita
acontece sem o usuário ter ciência da sua ocorrência e os dados
dessa coleta normalmente são originados de uma interação
individual. A navegação, os cliques em uma página, a ação de
salvar o conteúdo, a geração de versão de impressão e a efetivação
de uma compra são exemplos de coleta implícita.









Figura 1. Modelo para suporte computacional da IC

A etapa de coleta de dados engloba também a estruturação dos
dados. Para se atingir a estruturação dos dados é necessário seu
mapeamento e tratamento para que possam ser utilizados por
algoritmos que derivem a inteligência coletiva. No mapeamento,
os dados são organizados em dicionários previamente definidos
pelos algoritmos. Alguns dados necessitam também de tratamento
para representar as interações dos usuários computacionalmente.
Um exemplo é o processamento de textos para geração de vetores
de termos [3].
O passo de derivação da inteligência coletiva executa a
derivação das informações que irão fomentar a inteligência
coletiva. Esse passo utiliza os dados estruturados e algoritmos de
recuperação de informação, inteligência artificial, mineração de
dados, entre outros. Um exemplo simples de derivação da
inteligência coletiva é o uso de um algoritmo que verifica a
quantidade de acessos de cada objeto do sistema e entrega ao
mecanismo de inteligência coletiva de listagem dos objetos mais
populares, a lista dos objetos mais acessados.
Um mecanismo de inteligência coletiva é um elemento de
interface cujo objetivo é fomentar a inteligência coletiva. Como
citado anteriormente um exemplo de mecanismo de inteligência
coletiva é uma lista de recomendações de objetos de interesse.
Outro exemplo de mecanismo de inteligência coletiva é uma
nuvem de tags que apresenta as tags mais utilizadas pelos usuários
do sistema.
4. ANÁLISE DE DOMÍNIO
A análise do domínio é uma das etapas da engenharia de domínio
e possibilita que características comuns e variáveis sejam
identificadas e organizadas utilizando um processo sistemático
[13]. São identificadas, coletadas e organizadas informações
relevantes do domínio, utilizando para tal o conhecimento
existente e técnicas para modelagem de informação [6].
Inteligência coletiva
Interação social/Interação individual
Coleta de
Dados
Mecanismos
de IC
Derivação
da IC
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 34 -
Foi escolhida neste trabalho a técnica Feature-Oriented Domain
Analysis (FODA). A modelagem FODA é orientada a
características (features). De acordo com Kang et al.[6] essas
características são atributos do sistema que afetam diretamente os
usuários finais. Assim, as informações obtidas na análise
determinam os limites que norteiam o domínio, as características
comuns e variáveis de aplicações.
Para classificar as características levantadas foi utilizado o modelo
3C de colaboração [14] de forma similar ao trabalho feito por
Oliveira & Gerosa [15], no qual foi feita a análise de domínio
tendo como domínio a colaboração em redes sociais de
compartilhamento na web 2.0. No modelo 3C, a comunicação está
relacionada com a troca de mensagens e informações entre
pessoas; a coordenação é relacionada ao gerenciamento de
pessoas, suas atividades e recursos; e a cooperação é a produção
que acontece em um espaço compartilhado.
Para avaliar a utilização da análise de domínio com o modelo 3C
de colaboração para inteligência coletiva na web 2.0, foi feito
anteriormente um estudo piloto utilizando como domínio o
jornalismo online na web 2.0[16]. Na análise de domínio final
foram consideradas aplicações diversas da web 2.0. Essas
aplicações foram analisadas e foram levantadas características que
possibilitam a coleta de dados para derivação da inteligência
coletiva e características que sirvam como mecanismos de
inteligência coletiva. Como os sites avaliados normalmente não
disponibilizam os algoritmos utilizados para derivar a inteligência
coletiva, não foi possível averiguar qual algoritmo foi utilizado na
derivação da inteligência coletiva.
Os sites que foram utilizados para a análise são os 10 mais
acessados globalmente listados pelo Alexa
3
que atendam as
seguintes características: segue os conceitos da web 2.0 e possui
versões em inglês ou português.
5. RESULTADOS
Os resultados obtidos na Análise do domínio bem como
discussões sobre os mesmos são encontrados nesta sessão. A lista
de sites obtidos utilizando os critérios definidos na seção 4 dia
20/05/2011 é a seguinte: Google, Facebook, YouTube, Yahoo,
Blogger, Wikipédia, Windows Live, Twitter e MSN.
A lista de características que são possíveis fontes de dados no
domínio proposto levantada a partir dos sites selecionados
juntamente com a lista de características já levantada por
Michalsky et al. [16] é: comentário, enquete, lista de discussão,
denúncia, seguir tópico, compartilhamento, avaliação, produção
que possibilita aos usuários adicionarem novas notícias no
sistema, indicação, upload, busca, tags, versão de impressão,
salvar que possibilita aos usuários salvarem objetos para próximos
acessos ao sistema, login, dados de outras redes que possibilita
aos usuários definirem outros sistemas que participam para uma
possível integração, publicar status, favoritos, localização, pré-
visualização. Já a lista de mecanismos de IC contem as seguintes
características: resultados de busca, recomendações, tendências,
lista de atualizações, objetos em destaque, tag cloud, tags do
sistema.
5.1 Análise das Características
A avaliação das características foi feita visualmente, em imagens
capturadas de cada site avaliado. Cada característica encontrada
foi marcada como ilustrado na Figura 2.

3
http://www.alexa.com.

Figura 2 - Avaliação das características
Na Tabela 1 é apresentada a lista de sites avaliados com a lista de
características que são possíveis fontes de dados. Essas
características foram classificadas de acordo com sua função no
modelo 3C .
Tabela 1 ± Possíveis fontes de dados

Os mecanismos de IC não foram classificados no modelo 3C pois
como eles são elementos de interface podem ser colocados em
diferentes funções de acordo com sua aplicação. Esses
mecanismos têm uma função direta de manter a awareness dos
usuários. A Tabela 2 apresenta a lista de sites avaliados bem como
a lista de mecanismos de IC encontrados.
5.2 Discussão
O mecanismo de IC recomendações foi encontrado em todos sites
avaliados, não é possível descrever qual a forma que as
recomendações são executadas e nem quais dados são utilizados.
Mas é possível verificar sua importância nas aplicações.
A possível fonte de dados busca foi encontrada em todos os sites
avaliados. Não se pode afirmar se ele é utilizada durante a
derivação da IC em todos os sites, mas em alguns sites avaliados,
como a Wikipédia, ela é umas das poucas formas de coleta de
dados disponíveis para serem utilizadas neste momento.

C
a
r
a
c
t
e
r
í
s
t
i
c
a
s

Comunicação
Coorde-
nação
Cooperação Interação Individual
C
o
m
e
n
t
á
r
i
o

E
n
q
u
e
t
e

L
i
s
t
a

d
e

D
i
s
c
u
s
s
ã
o

D
e
n
ú
n
c
i
a

S
e
g
u
i
r

T
ó
p
i
c
o

C
o
m
p
a
r
t
i
l
h
a
m
e
n
t
o

A
v
a
l
i
a
ç
ã
o

P
r
o
d
u
ç
ã
o

I
n
d
i
c
a
ç
ã
o

U
p
l
o
a
d

B
u
s
c
a

P
u
b
l
i
c
a
r

S
t
a
t
u
s

F
a
v
o
r
i
t
o
s

T
a
g
s

V
e
r
s
ã
o

I
m
p
r
e
s
s
ã
o

S
a
l
v
a
r

L
o
g
i
n

D
a
d
o
s

P
r
é

v
i
s
u
a
l
i
z
a
ç
ã
o

L
o
c
a
l
i
z
a
ç
ã
o

Sites
Google x x x x x x
Facebook x x x x x x x x x x x x
Youtube x x x x x x x x x x x x
Yahoo x x
Blogger x x x x x x x x x
Wikipedia x x x
Windows
Live
x x x x x
Twitter x x x x x x x x
MSN x x x x
Linked In x x x x x x x x x
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 35 -

As seguintes características levantadas por Michalsky et al. [16]
não foram encontradas: versão de impressão, lista de discussão e
salvar. Esse fato pode ter ocorrido devido à diferença nos
domínios avaliados, pois enquanto o domínio da primeira
avaliação abrangia o jornalismo online essa segunda avaliação foi
caracterizada por mecanismos de busca e redes sociais em sua
maioria.
Tabela 2 ± Mecanismos de IC
















6. CONSIDERAÇÕES FINAIS
Este artigo apresentou a análise de domínio da Inteligência
Coletiva na web 2.0 por meio do FODA, realizando uma
classificação das características dentro das formas de colaboração
apresentadas e das formas de Inteligência Coletiva que podem ser
exploradas. Com os resultados obtidos temos um guia para o
desenvolvimento de novos sistemas web 2.0 e reavaliação dos
existentes. Espera-se com isso um maior suporte à inteligência
coletiva e consequentementente uma melhor iteração do usuário
com o site.
De todos os sites avaliados foram encontrados uma media de 7
possíveis fontes de dados e 3,8 Mecanismos de IC por site.
Lembrando que não foram avaliadas todos as funcionalidades do
sites apenas as que estão diretamente relacionadas com o a
funcionalidade principal do site descrita no Alexa.
As etapas, coleta de dados, derivação da IC e apresentação dos
resultados por meio de um mecanismo de IC, apresentadas no
modelo da Figura 1, estão presentes em todos os sites avaliados.
As características levantadas serão implementadas na forma de
componentes para o Groupware Workbench
4
. Com estes
componentes prontos à criação de aplicativos para web 2.0 é
facilitada uma vez que a complexidade encontrada na derivação
da Inteligência Coletiva fica encapsulada dentro dos componentes
criados e quem desenvolve a aplicação pode manter o foco nas
funcionalidades do sistema.

4
http://www.groupwareworkbench.org.br.
7. REFERÊNCIAS
[1] ANDERSON C. The end of theory: The data deluge makes the
scientific method obsolete - Wired Magazine: 16.07. Disponível em:
<http://www.wired.com/science/discoveries/magazine/16-
07/pb_theory>.
[2] SERAGAN, T. Programming Collective Intelligence: Building
Smart web 2.0 Applications, O`Reilly. 2007.
[3] ALAG, S. Collective Intelligence in Action. Manning Publications,
2008.
[4] O`REILLY, T. What is web 2.0: Design patterns and business
models for the next generation of software, 2005. Disponível em:
<http://oreilly.com/web2/archive/what- is-web-20.html>. Acesso
em: 17 de Janeiro de 2011.
[5] SUROWIECKI, J. The Wisdom of Crowds, Anchor. 2005.
[6] KANG, K. C. et al. Feature-Oriented Domain Analysis (FODA)
Feasibility Study. : CMU/SEI. 1990.
[7] JOHNSON-LENZ, P.; JOHNSON-LENZ, T. Groupware: The
Emerging Art of Orchestrating Collective Intelligence. In: Global
Conference on the Future, 1., Toronto, Canada, 1980.
[8] LEVY, P. A Inteligência Coletiva: por uma Antropologia do
Ciberespaço. CIDADE: Loyola, 2003.
[9] SHIRKY, C. Here Comes Everybody: The Power of Organizing
Without Organizations, Penguin Press HC, 2008.
[10] TAPSCOTT, D.; WILLIAMS, A.D. Wikinomics: How Mass
Collaboration Changes Everything. 2008.
[11] HANDBOOK of collective intelligence (2011) Disponível em:
<http://scripts.mit.edu/~cci/HCI/index.php>. Acesso em: fevereiro
2011.
[12] WOOLLEY, A. W.; CHABRIS, C. F.; PENTLAND, A.; HASHMI,
N.; MALONE, T. W. Evidence for a collective intelligence factor in
the performance of human groups. Science , v. 330, p. 686-688,
2010.
[13] PRIETO-DIAZ, R.; ARANGO, G. Domain Analysis Concepts and
Research Directions. In: PRIETO-DIAZ, R.; ARANGO, G. (ed.).
Domain Analysis and Software Systems Modeling: IEEE
Computer Society Press. 1991.
[14] FUKS, H.; RAPOSO, A.; GEROSA, M.A.; PIMENTEL, M.;
LUCENA, C.J.P. (2007) 'The 3C Collaboration Model¨ In: KOCK,
Ned (org.). The Encyclopedia of E-Collaboration, p. 637-644,
2007.
[15] OLIVEIRA, L. S.; GEROSA, M. A. Uma engenharia de dominio
baseada em padrões de interação e no modelo 3c de colaboração para
redes sociais de compartilhamento na Web 2.0. In: SIMPOSIO
BRASILEIRO DE SISTEMAS MULTIMIDIA E WEB, 2010, Belo
Horizonte, MG. Anais do WebMedia, 2010, v. 2, p. 4952.
[16] MICHALSKY, S.; MAMANI, E.Z.S.; GEROSA, M. A. A
Inteligência Coletiva na Web: Uma Análise de Domínio para o
Jornalismo Online. In: SIMPÓSIO BRASILEIRO DE SISTEMAS
MULTIMÍDIA E WEB, 2010, Belo Horizonte. Anais do
WebMedia, 2010.





C
a
r
a
c
t
e
r
í
s
t
i
c
a
s

R
e
s
u
l
t
a
d
o

d
e

B
u
s
c
a

R
e
c
o
m
e
n
d
a
ç
ã
o

T
e
n
d
ê
n
c
i
a
s

L
i
s
t
a

d
e

a
t
u
a
l
i
z
a
ç
õ
e
s

O
b
j
e
t
o
s

e
m

d
e
s
t
a
q
u
e

T
a
g

C
l
o
u
d

T
a
g
s

d
o

s
i
s
t
e
m
a

Sites
Google x x
Facebook x x x
Youtube x x x x x
Yahoo x x x x
Blogger x x x x x
Wikipedia x x x
Windows Live x x x
Twitter x x x x
MSN x x x x
Linked In x x x
Amazon x x
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 36 -
Predição de falhas em projetos de software baseado em
métricas de redes sociais de comunicação e cooperação
Vidal D. da Fontoura
UTFPR – Universidade
Tecnológica Federal do Paraná
– Campus Campo Mourão
vidalfontoura@hotmail.com
Igor Fabio Steinmacher
UTFPR – Universidade
Tecnológica Federal do Paraná
– Campus Campo Mourão
igorfs@utfpr.edu.br
Igor Scaliante Wiese
UTFPR – Universidade
Tecnológica Federal do Paraná
– Campus Campo Mourão
igor@utfpr.edu.br
Marco Aurélio Gerosa
IME/USP – Universidade de
São Paulo
gerosa@ime.usp.br
ABSTRACT
This paper presents an approach to predict failures in open source
projects based on social networks metrics. Social networks will be
created by mining conversations from developers mailing list and
from the comments provided on the issue manager. Cooperation
social networks will be extracted from the log of versioning
management system, enabling the identification of developers that
worked on the same class. Matrices that represent the social
networks will keep the degree of interaction among developers in
each social network. Social Network Analysis (SNA) metrics will
be used to calculate and identify patterns on these interactions.
These values will be used as input to a Bayesian model which,
after being trained, will enable build failure prediction.
RESUMO
Este trabalho apresenta uma abordagem de predição de falhas em
projetos de software livre baseado em métricas de redes sociais da
comunicação e cooperação entre os desenvolvedores. Serão
construídas redes sociais de comunicação extraídas a partir das
conversas na mailing list de desenvolvedores e nos comentários
realizados no sistema gerenciador de tarefas. Para a cooperação
serão extraídos dados do log do sistema gerenciador de versão,
possibilitando identificar quando desenvolvedores trabalharam em
uma mesma classe. Matrizes que representem as redes sociais
serão criadas para armazenar o grau de interação em cada rede
social. Métricas de Análise de Redes Sociais (Social Network
Analysis) serão utilizadas para calcular e identificar padrões
existentes na interação. Estes valores serão utilizados como
entrada no modelo bayesiano, que depois de treinado, possibilitará
a predição de falhas em uma build.
Keywords
predição de falhas, análise de redes sociais, cooperação e
comunicação.
1. INTRODUÇÃO
Pesquisadores de engenharia de software têm uma variedade de
abordagens para criar redes sociais e estudar fenômenos da área.
Dentre elas, Meneely et al [5] menciona aquelas baseadas em
mineração de logs de sistemas gerenciadores de versão
[2],[7],[9],[11],[16],[8] e mineração de mensagens de diferentes
meios de comunicação. [7],[16],[1].
Dentre os diversos fenômenos que podem ser estudados na
engenharia de software, destacam-se aqueles relacionados à
comunicação e cooperação entre os membros de uma ou mais
equipes de software no desenvolvimento de suas tarefas. Para
analisar aspectos de cooperação e comunicação pode-se utilizar
recursos relacionados a criação e geração de redes sociais [5]. O
uso de Análise de Redes Sociais (SNA-Social Network Analysis)
possibilita descrever, caracterizar e entender redes sociais por
meio da exploração de suas propriedades. [4]
Diante deste cenário este trabalho pretende estudar a comunicação
e a cooperação, considerando as métricas e redes sociais utilizadas
nos trabalhos relacionados, com o objetivo de verificar se é
possível melhorar a predição de falhas em projetos de software
livre. Os projetos selecionados para o estudo empírico serão
minerados do repositório da Apache Software Foundation (ASF).
Esta escolha foi feita a partir de uma investigação prévia, que
permitiu identificar que é possível minerar informações sobre
falhas, comunicação e cooperação.
Este trabalho está organizado da seguinte forma: a Seção 2
apresentará os conceitos de comunicação, cooperação e métricas
de SNA comparando as abordagens dos trabalhos relacionados. A
Seção 3 descreve a metodologia de coleta de dados para a
realização do estudo empírico, as redes sociais que serão criadas e
como será realizada a predição de falhas e sua validação. A Seção
4 apresenta os próximos passos da pesquisa e as conclusões do
trabalho parcial já realizado.
2. CONTEXTO
Com o objetivo de predizer falhas em projeto de software livre
com base nas estruturas de comunicação e de cooperação dos
desenvolvedores, foi realizada uma revisão bibliográfica. Nesta
Seção serão abordados conceitos de cooperação, comunicação e
métricas SNA.
2.1 Cooperação
Esta subseção apresentará como os trabalhos relacionados que
utilizam dados de cooperação entre os desenvolvedores criam
redes sociais e utilizam métricas de SNA para interpretar dados
destas redes e predizer falhas.
Fuks et al [3], define cooperação como membros de um grupo que
operam em conjunto para manipular e organizar informações,
construindo e refinando objetos. Segundo Steinmacher et al [12]
identifica a cooperação quando um ou mais desenvolvedores
interagem com artefatos compartilhados de maneira síncrona ou
assíncrona.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference’10, Month 1–2, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010…$10.00.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 37 -
Wolf et al [16] desenvolveu um estudo que tem por objetivo
predizer falhas utilizando SNA. No projeto de software estudado
as tarefas e os objetivos de cada release são agrupados em itens de
trabalho (work items) e atribuídos a equipes de desenvolvimento.
Os itens de trabalho são desenvolvidos de forma paralela por mais
de uma equipe sendo necessária a sua integração para a definição
de uma build do projeto. Desta forma as equipes tem que cooperar
entre si para concluírem os objetivos das releases. Assim,
conexões são criadas em uma rede social considerando aqueles
desenvolvedores que trabalharam em um mesmo item de trabalho.
Já Meneely et al [5] analisou o histórico dos arquivos de um
projeto verificando os responsáveis pelas atualizações de cada
arquivo. Identificando todos os desenvolvedores que atualizaram
um determinado arquivo (classe), são criadas conexões entre esses
desenvolvedores. Estas conexões indicam quais foram os
desenvolvedores que cooperaram para o desenvolvimento de um
artefato.
2.2 Comunicação
Esta subseção apresentará como os trabalhos relacionados
consideram a comunicação no seu contexto, e como ela será
considerada neste trabalho.
Wolf et. al [16] observou os comentários deixados pelos
desenvolvedores nos commits dos itens de trabalho. No seu estudo
ele considera somente esta forma de comunicação para criar as
redes sociais.
Biçer et, al [1] minerou os comentários feitos por desenvolvedores
em um gerenciador de tarefas (issues). Ele optou por esta
comunicação porque considera que os desenvolvedores
expressavam suas opiniões quando estes têm relações com tarefas.
2.3 Métricas de SNA
Esta seção apresentará os trabalhos relacionados que consideram o
uso de SNA com intuito de predizer falhas. Como visto nas
subseções 2.1 e 2.2, a literatura indica que estudos podem ser
realizados analisando a comunicação e cooperação para predizer
falhas. O Quadro 1 relaciona os estudos e as métricas de SNA
utilizadas nos trabalhos descritos nas seções 2.1 e 2.2. A definição
de cada uma das métricas pode ser encontrada nos trabalhos
correlatos e também são apresentadas em [14].
Observa-se no Quadro 1 que diferentes métricas foram utilizadas
para medir as propriedades extraídas das redes sociais dos
trabalhos relacionados identificados. Em todos os trabalhos estes
valores calculados a partir da SNA foram utilizados como entrada
para o modelo de predição.
Métricas SNA [16] [5] [1]
Centralidade X X X
Densidade X X
Structural Hole X
Diametro X
Coeficiente de Clustering X
Bridge X
Characteristic Path Lenght X
Quadro 1: Comparação das métricas de SNA
2.4 Considerações finais
Este trabalho pretende utilizar a combinação das métricas
identificadas nos trabalhos relacionados para verificar a
possibilidade de melhoria da predição de falhas utilizando SNA.
Outro diferencial encontra-se nos dados que serão minerados a
partir da comunicação e cooperação, oferecendo uma maior
quantidade de dados para criação das redes sociais. O Quadro 2
apresenta as redes sociais criadas nos trabalhos relacionados e
quais serão construídas nesta proposta.
Redes Sociais [16] [5] [1] Esta proposta
Comunicação em
Issues
X X
Comunicação em
Mailing list
X
Comunicação em
Commits
X X
Mineração de
Cooperação em
SVN
X X X X
Quadro 2: Comparação das redes sociais utilizadas para
cálculo das métricas de SNA.
3. Modelo de Predição de Falhas baseado
em métricas de SNA para redes sociais de
comunicação e cooperação
Três questões de pesquisa serão utilizadas para guiar a
metodologia deste trabalho.
D (Q1) Métricas de SNA aplicadas a redes sociais
extraídas de mecanismos de comunicação dos desenvolvedores
podem auxiliar a predição de falha em projetos de software?
D (Q2) Métricas de SNA aplicadas a redes sociais
extraídas de mecanismos de cooperação dos desenvolvedores
podem auxiliar a predição de falha em projetos de software?
D (Q3) Resultados combinados a partir da analise das
redes sociais criadas podem melhorar os resultados de predição?
Para responder estas questões um experimento será realizado. A
subseção 3.1 apresentará como se pretende realizar a coleta de
dados. A subseção 3.2 apresenta os passos para criação das redes
sociais de comunicação e cooperação. A subseção 3.3 explica
como será realizado o treinamento da rede bayesiana utilizada no
modelo de predição e por fim, a subseção 3.4 discute as métricas
para validação da predição realizada.
3.1 Coleta de dados
Será realizada a coleta de dados de projetos armazenados nos
repositórios da ASF.
Neste repositório a comunicação será minerada de diferentes
fontes de discussão, tais como: comentários em tarefas (issues),
comentários feitos por um desenvolvedor no instante em que ele
realiza commits e das discussões realizadas nos mailing lists de
desenvolvedores. A cooperação será minerada a partir do conjunto
de arquivos modificados por um desenvolvedor (commits).
A mineração de dados referentes à comunicação e dados
referentes à cooperação nos garantirá uma diversidade maior de
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 38 -
redes sociais em relação aos trabalhos relacionados que serão
apresentados na subseção 2.2 e 2.3.
Uma vez mineradas estas informações serão geradas redes sociais,
que analisadas com SNA resultarão em valores para as métricas,
que serão utilizadas como entrada para o modelo de predição de
falhas.
Os projetos escolhidos serão aqueles que possibilitem a
identificação de builds que obtiveram sucesso ou falha e que
utilizem mailing lists e gerenciadores de tarefas (issues).
Para a coleta de dados será construído um minerador capaz de
extrair as informações dos projetos e salvá-las em um banco de
dados local.
3.2 Construção das redes sociais
A partir dos dados minerados e armazenados no banco de dados
local, será gerada uma matriz desenvolvedor versus
desenvolvedor com o grau da interação capturada. O grau de
interação representa a quantidade de trocas de mensagem
existente entre dois desenvolvedores, ou a quantidade de vezes
que eles trabalharam em um arquivo compartilhado. Este último
será obtido a partir do número de commits realizados por dois
desenvolvedores que alteraram uma mesma classe.
Para cada build de um projeto ASF serão criadas quatro redes
sociais:
D Rede social de mailing list: As conversas
realizadas dentro do intervalo de uma build serão
mineradas e uma matriz com a quantidade de troca de
mensagens entre os desenvolvedores será criada.
D Rede social de comunicação de tarefas:
Serão identificadas as tarefas que compõe uma build. A
partir das tarefas serão minerados todos os comentários
realizados pelos desenvolvedores, formando uma nova
matriz.
D Rede social de cooperação a partir dos
arquivos (classes) compartilhados: Serão minerados a
partir do log do sistema gerenciador de versão, todos os
commits realizados pelos desenvolvedores para
implementar as tarefas que compõe uma build.
D União das redes sociais anteriores: é a
soma das matrizes anteriores, representa o grau total de
comunicação versus cooperação que inclui todos os
relacionamentos entre os desenvolvedores.
Pretende-se com estas redes sociais, melhorar a qualidade do
conjunto de dados que será utilizado para treinamento da rede
bayesiana no modelo de predição. A utilização de dados mais
abrangentes e da união de todas as métricas encontradas nos
trabalhos relacionados pode proporcionar uma melhora na
predição, uma vez que a melhoria da performance dos modelos de
predição não esta associado a implementação de novos
algoritmos, mas sim, da qualidade do conjunto de dados
minerados ou até mesmo, de métricas que ainda não foram
utilizadas para predição. [1]
Para criação das redes sociais será utilizada a ferramenta UCINet
[13], que permite importar as matrizes criadas e calcular as
métricas apresentadas no Quadro 1.
3.3 Predição de Falhas
No experimento deste estudo também serão identificadas falhas
baseando-se no resultado de builds. Considera-se como premissa
que as builds podem resultar em dois estados: o de falha ou de
sucesso. Obtêm-se os valores das métricas de SNA para cada rede
social criada a partir de uma build conforme subseção 3.2. os
valores obtidos com as métricas de SNA serão utilizados como
entrada de dados para o treino do classificador bayesiano.
Para o treinamento serão definidos quatro conjuntos de dados. O
primeiro é referente às métricas extraídas das redes sociais de
comunicação de mailing list e comentários feitas sobre as tarefas,
outro referente a rede social de cooperação extraída a partir dos
commits e um último conjunto referente à união das redes sociais.
Para avaliar a predição outro conjunto de validação será utilizado.
Este conjunto ficará fora da etapa de treinamento. Para executar a
predição de falhas será utilizada a ferramenta WEKA
Software[15].
O WEKA (“Waikato Environment for Knowledge Analysis”) é
uma ferramenta que implementa uma coleção de algoritmos de
aprendizagem de máquina para tarefas de mineração de dados. Ela
oferece suporte para pré-processamento de dados, treinamento e
classificação de redes bayesianas, oferecendo opções de escolha
de diferentes algoritmos.
Para este trabalho serão comparados os treinamentos com
proporções de 80/20 e 66/34 utilizando o algoritmo nayve bayes
que também foi utilizado nos trabalhos relacionados. A
comparação das proporções de treinamento será feitas porque não
houve consenso nos trabalhos relacionados da proporção de builds
que foram utilizadas para treinamento e validação, assim,
pretende-se testar esta abordagem com as duas medidas.
3.4 Avaliação do modelo de predição
Para avaliar as predições serão utilizadas medidas de Recall e
Precision. No entanto, será adicionada uma nova medida de
Accuracy. Estas métricas definem a qualidade de dados
recuperados.
Precision é definida como o número de dados relevantes
recuperados, dividido pelo número total de dados recuperados
[10], por exemplo, suponha que existam 50 builds que falharam
realmente, e o classificador bayesiano respondeu (predisse) que
30 builds falharam, e apenas 20 destas builds realmente falharam.
A Precision é calculada da seguinte forma: 30 builds que o
classificador respondeu dividido pelas 20 builds que o
classificador respondeu corretamente, resultando em um
coeficiente de Precision de 1,5% e 66% expresso em
porcentagem. Recall é definido como o número de dados
relevantes recuperados divididos pelo número total de dados
relevantes [10], por exemplo, suponha que 50 builds falharam
realmente, e o classificador respondeu (predisse) que 38 builds
falharam, e apenas 20 destas builds realmente falharam, o Recall é
calculado da seguinte forma: 50 builds que falharam realmente
divididos por 20 builds que o classificador respondeu
corretamente, resultando em um coeficiente de Recall de 2,5% e
40% expresso em porcentagem.
Os trabalhos relacionados [16],[5],[1] utilizaram Recall e
Precision para avaliar o modelo de predição proposto. Este
trabalho além de utilizar Recall e Precision também utilizará a
métrica de Accuracy para avaliação do modelo de predição. Esta
métrica é medida pelo resultado da taxa de acerto positivo
calculado com base nas classificações corretas e taxa de acerto
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 39 -
negativo calculado com base nas classificações incorretas. Para
calcular a taxa de acerto positivo (TAP) e a taxa de acerto
negativo (TAN) utilizam-se as seguintes formulas:
TAP = SP / (SP + FN); TAN = FP/ (FP + SN).
D SP é o numero de builds que obtiveram sucesso, preditas
corretamente;
D FN o numero de builds que falharam realmente;
D FP é o numero de builds que obtiveram falha, preditas
corretamente;
D TN é o numero de builds que obtiveram sucesso
realmente.
Ao final do experimento, será verificado, analisando os valores
resultantes para Recall, Precision e Accuracy, se esta abordagem
poderá predizer com maior taxa de acerto quando um build terá
sucesso ou falha, utilizando matrizes de comunicação e
cooperação.
4. Conclusão e Próximos Passos
Espera-se com este trabalho oferecer um modelo de predição mais
preciso para predizer falhas em projetos de software livre. O uso
de mais métricas e de uma quantidade maior de informações para
criação de redes sociais pode possibilitar esta melhora.
Um primeiro experimento com o projeto Geronimo da ASF esta
sendo conduzido para mineração dos dados referentes a
comunicação e cooperação.
Testes preliminares de criação de matrizes que representam as
redes sociais já foram realizados. Os testes mostraram que é
possível importar as matrizes que representam as redes sociais
para a ferramenta UCINet para cálculo das métricas de SNA.
Os próximos passos compreendem a criação de redes sociais para
um conjunto de builds que permita testar o uso da ferramenta
Weka para treinamento e predição das builds.
Por fim será replicado o experimento para outros projetos da ASF
para testar a validade da abordagem e assim comparar os
resultados obtidos com os trabalhos relacionados.
5. REFERÊNCIAS
[1] BIÇER, Serdar; BENER, Ayse; CAGLAYAN, Bora. Defect
Prediction Using Social Network Analysis on Issue
Repositories. In ICSSP '11 Proceedings of the 2011
International Conference on on Software and Systems
Process. New York, NY, USA, 2011.
[2] BIRD, Christian; PATTISON, David; D'SOUZA, Raissa;
FILKOV, Vladimir; DEVANBU, Premkumar. Latent Social
Structures in Open Source Projects. In SE, Atlanta, GA,
2008, p.p24-36.
[3] FUKS, Hugo; RAPOSO, Alberto; GEROSA, Marco. Do
Modelo de Colaboração 3C à Engenharia de Groupware. In
WEBMIDIA 2003 -Simpósio Brasileiro de Sistemas
Multimídia e Web, Trilha especial de Trabalho Cooperativo
Assistido por Computador, Novembro 2003, Salvador-BA,
pp. 445-452
[4] MAGDALENO, Andréa; WERNER, Cláudia; Araujo,
Renata. Estudo de Ferramentas de Mineração, Visualização e
Análise de Redes Sociais. Rio de Janeiro, ES-735/10, 2010.
[5] MENEELY, Andrew; WILLIAMS, Laurie; SNIPES, Will;
Osborne, Jason. Predicting failures with developer networks
and social network analysis. In Proceedings of the 16th ACM
SIGSOFT International Symposium on Foundations of
software engineering (SIGSOFT '08/FSE-16). ACM, New
York, NY, USA, 2008.
[6] MENEELY, Andrew; WILLIAMS, Laurie. Socio-technical
developer networks: should we trust our measurements?. In
Proceeding of the 33rd international conference on Software
engineering (ICSE'11). ACM, New York, NY, USA, 281-290.
DOI=10.1145/1985793.1985832, 2011.
[7] MENEELY, Andrew; WILLIAMS, Laurie; CORCORAN,
Mackenzie. Improving Developer Activity Metrics with Issue
Tracking Annotations. In Workshop on Emerging Trends in
Software Metrics (WETSoM), Cape Town, South Africa,
2010.
[8] MENZIES, Tim; GREENWALD, Jeremy; FRANK, Art. Data
Mining Static Code Attributes to Learn Defect Predictors. In
Ieee Transactions On Software Engineering, West Virginia
Univ., Morgantown, WV, Jan. 2007.
[9] NIA, Roozbeh; BIRD, Christian; DEVANBU, Premkumar;
FILKOV, Vladimir. Validity of Network Analyses in Open
Source Projects. In Mining Software Repositories, Cape
Town, South Africa, 2010.
[10] SARR M. Improving precision and recall using a
spellchecker in a search engine. Royal Institute of
Technology, Sweden, 2003.
[11] SHIN, Yonghee; MENEELY, Andrew; WILLIAMS, Laurie;
OSBORNE Jason. Evaluating Complexity, Code Churn, and
Developer Activity Metrics as Indicators of Software
Vulnerabilities. In IEEE Transactions in Software
Engineering (TSE), vol. to appear, no. p. 2010.
[12] STEINMACHER, Igor; CHAVES, Ana; GEROSA, Marco.
Awareness Support in Global Software Development: A
Systematic Review Based on the 3C Collaboration Model.
In: 16th CRIWG Conference on Collaboration and
Technology, 2010, Maastricht. Lecture Notes in Computer
Science, 2010. v. 6257. p. 185-201
[13] Ucinet is a social network analysis program. Disponível em
http://www.analytictech.com/ucinet/
[14] WASSERMAN, Stanley; FAUST, Katherine; Social Network
Analysis: Methods and Applications. 1 ed. Cambridge,
United Kingdom, Cambridge University Press. 1994.
[15] Weka Software is a collection of machine learning
algorithms for solving real-world data mining problems.
Disponível em http://sourceforge.net/projects/weka/
[16] WOLF, Timo; SCHROTER, Adrian; DAMIAN, Daniela;
NGUYEN, Thanh. Predicting build failures using social
network analysis on developer communication. In
Proceedings of the 2009 IEEE 31st International Conference
on Software Engineering, 2009.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 40 -
Um aplicati vo baseado em inteligência coletiva para
compartilhamento de rotas em redes sociais
Luiz Philipe Serrano Alves
Coordenação de Tecnologia em
Sistemas para Internet
Universidade Tecnológica
Federal do Paraná (UTFPR)
Campo Mourão - Brasil
luizphilipe02@gmail.com
Ana Paula Chaves
Coordenação de Tecnologia em
Sistemas para Internet
Universidade Tecnológica
Federal do Paraná (UTFPR)
Campo Mourão - Brasil
anachaves@utfpr.edu.br
Igor Steinmacher
Coordenação de Tecnologia em
Sistemas para Internet
Universidade Tecnológica
Federal do Paraná (UTFPR)
Campo Mourão - Brasil
igorfs@utfpr.edu.br


ABSTRACT
This paper presents a social network application that enables
users to create routes on maps that can be edited collaborative-
ly. Collaboration on maps is a result of collective intelligence,
which combines the knowledge of many people to accomplish a
goal. This proposal presents one feature of a system called
UbiBus, which aims to combine many applications that aim to
help public transportation users.
RESUMO
Este artigo propõe um aplicativo para rede social que permite a
criação de rotas em mapas que possam ser editados colaborati-
vamente. A colaboração em mapas é um fruto da inteligência
coletiva, que une a sabedoria de várias pessoas para cumprir
com um objetivo. Essa proposta apresenta uma das funcionali-
dades de um sistema denominado UbiBus, que une uma varie-
dade de aplicações que tem o objetivo de ajudar e aproximar os
usuários de transporte público.
Palavras-chave
Rotas colaborativas, mapas colaborativos, redes sociais, inteli-
gência coletiva, colaboração.
1. INTRODUÇÃO
A população com acesso a internet tem aumentado cada vez
mais nos últimos 10 anos, segundo pesquisas do Instituto Brasi-
leiro de Geografia e Estatística [1]. Com os avanços tecnológi-
cos e a disseminação da internet, uma nova cultura de produção
de conteúdo e compartilhamento está sendo criada [2]. Essa
cultura envolve blogs, wikis, fóruns e redes sociais.
As redes sociais são ambientes de colaboração muito utilizados.
Hoje em dia, grande parte das pessoas que acessam a internet,
tem um perfil ativo em pelo menos uma rede social. Os dados
da Pesquisa Nacional de Amostras por Domicílio (Pnad) apon-
tam que a quantidade de usuários de todas as faixas etárias
aumentou em cerca de 12 milhões de 2008 a 2009 [3]. O suces-
so das redes sociais tem facilitado o compartilhamento de in-
formações entre as pessoas, pois elas frequentemente utilizam
essa tecnologia para relatar o que passaram e é possível utilizar
esses dados de forma inteligente e colaborativa [4].
A participação de um grande grupo de pessoas em um objetivo
comum pode gerar resultados muito melhores do que os feitos
por uma só pessoa. Essa participação é denominada inteligência
coletiva. A inteligência coletiva parte do princípio de que as
inteligências individuais são somadas e compartilhadas por toda
a sociedade. O conceito foi potencializado com o advento das
novas tecnologias de comunicação, como a Internet [5]. Gran-
des exemplos são os sites wikis, formados pelo compartilha-
mento das informações dos próprios usuários, e podem ser
considerados frutos da Web 2.0 [6].
Algumas ferramentas que a Web 2.0 proporcionou facilitam a
inteligência coletiva. Um exemplo disso é o serviço de pesqui-
sa, visualização de mapas e imagens de satélite do Google
Maps
1
. Com ele é possível que um usuário comum crie seu
próprio mapa ou rota e compartilhe como desejar. Porém, esse
compartilhamento disponível pode não ser interativo o suficien-
te, pois as pessoas precisam ser convidadas para ver o seu con-
teúdo e esse mapa não fica disponível a todos os usuários que
possam estar interessados, o que ocorreria se ele fosse publica-
do em uma rede social.
Paralelo a esse cenário de compartilhamento de informações e
colaboração online, existem setores da sociedade que ainda
sofrem com a escassez de informações importantes, como é o
caso dos passageiros de transportes públicos no Brasil. Com o
trânsito nas grandes cidades cada vez mais caótico, utilizar
transportes públicos pode ser uma alternativa para reduzir o
tráfego e melhorar as condições de mobilidade urbana. De
acordo com Barry [19], as pessoas estão dispostas a deixar os
seus carros, ou motos, desde que possam obter informações em
tempo real a respeito dos meios de transporte público. Aliado a
isso, o Brasil receberá vários grandes eventos esportivos nos
próximos anos. Esse fato pode agravar a situação dos transpor-
tes e, além disso, pode gerar mais demanda por transportes
públicos de qualidade.
Dentre as informações que as pessoas podem necessitar no dia a
dia das grandes cidades, uma delas está relacionada ao caminho
mais adequado para realizar um determinado percurso. Com
isso, é interessante que as pessoas consigam criar rotas, sejam
elas para compartilhar os locais que pretendem ir ou para com-
partilhar locais turísticos para visitação. Nesse contexto, rota é
qualquer percurso ou trajeto que uma pessoa pode utilizar para
se deslocar entre duas ou mais localidades. É importante que
essas rotas possam ser editadas colaborativamente para, dessa
forma, aproveitar o poder da inteligência coletiva na criação de
percursos que atendam aos interesses dos colaboradores. Essas
rotas podem ter objetivos diversos, como caminhos que sejam
mais rápidos ou mais seguros até um destino, ou ainda cami-
nhos mais completos com relação à quantidade de lugares para
visitar. Ainda não existem aplicações que possibilitam esta
interação.
Diante desse contexto, o sistema UbiBus foi proposto com o
objetivo de oferecer um conjunto de soluções tecnológicas para
facilitar o acesso a informações de transporte público aos usuá-
rios, em tempo real, baseado em informações dinâmicas de
contexto, integrados em um sistema de transporte público inte-
ligente, ubíquo e sensível ao contexto [7].
O projeto UbiBus prevê o desenvolvimento de diferentes apli-
cações, que vão desde aplicações web e de redes sociais a apli-

1
http://maps.google.com/
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 41 -
cações para dispositivos móveis, terminais (e.g. nos pontos de
ônibus) e quiosques (e.g. estações rodoviárias). Uma das aplica-
ções que esse projeto propõe envolve aplicativos de redes soci-
ais com o objetivo de aproximar os passageiros do transporte
público. Ao acessá-las, os usuários poderão indicar rotas de sua
preferência, visualizar rotas criadas por outros usuários, atribuir
reputação (ou comentários) para uma rota que utilizou e até
mesmo criar rotas colaborativamente com outros usuários. Esse
artigo propõe os primeiros passos em direção a esse fim.
O objetivo deste artigo é propor um aplicativo para rede social
que permita aos usuários criarem rotas colaborativamente, de
forma que essas rotas fiquem disponíveis para os contatos na
rede social e possam ser alteradas por eles. O aplicativo apro-
veita o poder da inteligência coletiva, repassando para os conta-
tos da rede social a tarefa de construir uma rota que atenda os
interesses do grupo que dela se utiliza.
Este artigo está organizado da seguinte forma: a Seção 2 discute
os conceitos de inteligência coletiva, mapas colaborativos e
redes sociais. A Seção 3 apresenta o aplicativo proposto e a
Seção 4 traz as conclusões e trabalhos futuros.
2. REFERENCIAL TEÓRICO
2.1 Inteligência coletiva
A inteligência coletiva é uma inteligência distribuída por toda a
parte, continuamente valorizada, coordenada em tempo real e
resulta na mobilização efetiva de competências. A base e o
objetivo da inteligência coletiva é o enriquecimento mútuo das
pessoas. Ninguém sabe tudo, todos sabem alguma coisa, desse
modo todo saber está na humanidade [5]. Este conhecimento
pode ser compartilhado por meio da interatividade que é encon-
trada facilmente em comunidades virtuais, fóruns e wikis. Desse
modo, as produções intelectuais não seriam exclusivas de uma
só pessoa, mas sim dos apoios coletivos crescentes.
A inteligência coletiva proporcionou o surgimento de um novo
modelo de negócio conhecido como crowdsourcing [8]. O
termo, criado por Jeff Howe e Mark Robinson, descreve um
modelo que aproveita as soluções criativas que várias pessoas
podem criar por meio de um convite aberto a sugestões. Devido
aos avanços tecnológicos, a diferença entre profissionais e
amadores foi diminuída e com isso qualquer pessoa está apta a
realizar certos tipos de trabalho [9].
O site Amazon.com
2
lançou em 2005 o Amazon Mechanical
Turk, um sistema que possibilita às empresas ter acesso à mão
de obra sob demanda. Nesse site, é possível buscar pessoas
interessadas em realizar pequenos trabalhos, assim como inserir
ofertas de tarefas simples a serem executadas. Os indivíduos
que colaboram são remunerados, normalmente com alguns
centavos de dólar.
A principal característica da inteligência coletiva é aproveitar a
interatividade para melhorar e disseminar os conhecimentos
globais e com isso ela está sendo utilizada em vários contextos.
Um deles é sob a forma de colaboração em mapas, que será
visto na próxima sessão.
2.2 Mapas Colaborativos
O mapeamento colaborativo é uma iniciativa da produção cole-
tiva. Por meio dele, é possível que um conjunto de pessoas
produza modelos do mundo real para que outras pessoas tam-
bém acessem e contribuam anotando localizações no espaço
[10]. O mapeamento colaborativo ocorre quando mais de uma
pessoa tem a iniciativa de ajudar, mapeando algum fenômeno
ou acontecimento em um mesmo local, de forma com que todas
as colaborações se comuniquem e contribuam.

2
http://www.amazon.com
O valor do mapeamento colaborativo é determinado pela pro-
ximidade física e social que o grupo de pessoas que ajudaram se
encaixa. Assim, a informação não é apenas filtrada com base na
proximidade geográfica, mas também classificada de acordo
com a confiança que uma pessoa tem em outra através de redes
sociais, que é chamado de 'Web of Trust¨ [10].
A invenção dos mapas colaborativos também fornece uma
solução para o problema da mobilidade nas grandes áreas urba-
nas [11]. Com o desenvolvimento das tecnologias móveis (celu-
lares, smartphones e GPS) e a liberação de mapas via satélite
como o Google Maps, a possibilidade das pessoas criarem suas
próprias rotas tem se tornado cada vez mais viável.
Vários exemplos disso podem ser destacados. O OpenStreet-
Map
3
é um projeto colaborativo para criar um mapa livre e
editável. Ele permite visualizar, editar e usar dados geográficos
de maneira colaborativa em qualquer lugar do mundo. Já o
TrackSource
4
tem por objetivo produzir mapas do Brasil para
disponibilizar em aparelhos GPS. Através do site, os usuários
contribuem com informações que são encaminhadas para os
desenvolvedores que atualizam os mapas. Periodicamente as
novas versões dos mapas são disponibilizadas para serem bai-
xados pela comunidade.
O WikiMapps
5
é um sistema para a criação de aplicações cola-
borativas baseadas em mapas. A principal característica que o
difere de outros mapas colaborativos, é que ele possui funções
que inserem o conceito de redes sociais. As pessoas podem criar
um mapa com marcadores, rotas, imagens, áreas e ícones. As-
sim outras pessoas são capazes de comentar, votar, identificar
marcadores de amigos, adicionar usuários como amigos e con-
sequentemente gerar interação entre integrantes da rede social.
O WikiCrimes [12] é um software que permite a pesquisa,
visualização e registro de ocorrências criminais em uma mapa
digitalizado. Todos podem participar e mapear colaborativa-
mente os crimes, assim todos terão o benefício de ter acesso às
informações criminais no mapa. Para confirmar a veracidade de
uma ocorrência, os usuários têm a opção de confirmar positi-
vamente ou negativamente as informações encontradas.
Como pode ser observado, há vários projetos que utilizam
mapas colaborativos e sugerem que expressar o seu conheci-
mento em um mapa é interessante. Em aplicativos como o
WikiMapps, é possível aproveitar a inteligência coletiva através
de recursos de uma rede social. Existem inúmeras redes sociais
em que isso é possível. Esse assunto será abordado na próxima
sessão.
2.3 Redes Sociais
Uma rede social é composta por indivíduos (ou organizações)
conectados através de laços sociais [13]. Esses laços partilham
valores e objetivos em comum, como amizade, parentesco,
crenças, conhecimentos ou prestígio.
Define-se uma rede social como um sistema baseado na Web
em que (a) os usuários possam construir um perfil público ou
semipúblico dentro de um sistema limitado, (b) adicionar uma
lista de outros usuários com quem eles compartilhem uma
conexão, (c) visualizar e percorrer suas listas de conexões,
assim como outras listas criadas por outros usuários [14].
Existem vários tipos de redes sociais disponíveis na Internet,
que variam de acordo com seus objetivos primários. Há redes
sociais genéricas, baseadas principalmente em fazer novas
amizades, que apresentam diversos tipos de conteúdos textuais
ou multimídia e provêm várias funcionalidades para que os
usuários possam interagir com seu conteúdo. Pode-se dizer que

3
http://www.openstreetmap.org
4
http://www.tracksource.org.br
5
http://wikimapps.com
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 42 -
o foco dos conteúdos e das funcionalidades encontradas estão
orientados a um contexto lúdico, pois promovem nas pessoas
uma interação informal e recreativa [15]. Algumas redes sociais
dessa categoria são o Facebook, Orkut e Twitter. Há também a
categoria de redes sociais especializadas, que fornecem ferra-
mentas para um trabalho específico, tratando uma temática em
particular e cobrindo necessidades de um determinado tipo de
usuário [15]. Essas redes, são utilizadas com propósito específi-
co, como é o caso do LinkedIn
6
e Xing
7
que são voltadas a
adquirir contatos profissionais.
As redes sociais também são usadas por empresas que aprovei-
tam a inteligência coletiva através da comunicação livre e hori-
zontal que ela possibilita [16]. É possível que as empresas
monitorem o comportamento dos seus clientes em relação aos
produtos oferecidos, identifiquem tendências de mercado e
divulguem a empresa, já que a opinião das pessoas é relevante
no processo de compra de outras pessoas.
Algumas redes sociais como Orkut e Facebook oferecem apli-
cativos que reúnem pessoas para que elas possam interagir com
um objetivo em comum. Essas interações podem ser feitas por
meio de jogos, em que as pessoas jogam com os contatos da
rede social. Exemplos disso são o Colheita Feliz (Orkut), um
jogo cujo objetivo é plantar e colher em sua fazenda, e do City-
Ville (Facebook), que tem por objetivo administrar uma cidade;
Também é possível outros tipos de interação, como marcar em
um mapa um lugar que você pretende ir no verão, ver onde seus
amigos pretendem ir e ver os lugares mais populares, como é o
caso do aplicativo Verão Coca-Cola (Facebook).
O TravelMap é um aplicativo em que é possível criar rotas de
viagem de onde você deseja ir ou já foi. É possível adicionar
fotos da sua viagem, adicionar mais locais no caminho e com-
partilhar com seus amigos. Também é possível criar um blog
sobre sua viagem, em que é possível compartilhar todas as
informações sobre ela. Porém, não é possível interagir colabora-
tivamente nos mapas criados por seus amigos.
Um aspecto importante das redes sociais está relacionado ao
tráfego de conteúdo gerado pelos usuários. Existe uma diferen-
ça entre publicar conteúdos na Web tradicional ou em uma rede
social online. Quando as pessoas publicam conteúdo na Inter-
net, a intenção é que usuários do mundo inteiro possam acessar.
Por outro lado, quando usuários publicam em redes sociais
online, eles possuem uma audiência específica em mente, ge-
ralmente, seus amigos [17]. Isso acontece porque usuários
adjacentes em uma rede social tendem a confiar uns nos outros
[18].
3. EDIÇÃO COLABORATIVA DE ROTAS
Como pode ser observado em [7], o sistema UbiBus tem por
objetivo reunir um conjunto de solução que possam ser utiliza-
das para melhorar o dia a dia das pessoas que utilizam o trans-
porte público nas cidades brasileiras. A Figura 1 representa a
arquitetura deste conjunto de soluções.
Dentro dessa arquitetura, a Camada de Aplicações concentra as
diferentes aplicações que serão desenvolvidas para compor o
UbiBus. A proposta desse artigo é a criação de um aplicativo
dessa camada que possibilite aos usuários de uma rede social
criar, editar colaborativamente, visualizar e compartilhar rotas.
O aplicativo proposto fará parte da rede social Facebook e seu
acesso será disponibilizado a partir do sistema UbiBus.
O Facebook foi escolhido pela sua crescente popularização no
Brasil. Dados do site Alexa.com, que mostra o ranking dos sites
mais visitados de cada país, mostram o Facebook em 3º lugar,
enquanto o Orkut aparece em 6º (consulta realizada em abril de

6
http://www.linkedin.com
7
http://www.xing.com
2011). Além disso, pesquisas realizadas entre março de 2010 a
março de 2011 pela ComScore.com, empresa especializada em
medir a evolução do mundo digital, aponta para uma estabiliza-
ção no uso do Orkut em cerca de 70% dos usuários da Internet,
enquanto o Facebook teve uma expansão de 159% (de 15,7%
dos usuários da internet em 2010 para 40,8% em 2011).

Figura 1. Arquitetura do sistema UbiBus [7]
O aplicativo será desenvolvido por meio de uma API Java
disponibilizada especificamente para o Facebook, que fornece
as Iuncionalidades de publicação em mural, de 'curtir¨, de
compartilhar e outras disponíveis na rede social. O aplicativo
utilizará também uma API do Google Maps para oferecer a
funcionalidade de edição das rotas. A arquitetura do aplicativo
pode ser observada na Figura 2.

Figura 2. Arquitetura do Aplicativo
O Facebook se comunicará com a sua base de dados interna,
onde salvará os dados das rotas criadas pelos usuários. As
configurações sobre esta base de dados podem ser feitas pela
interface visual da página de criação do aplicativo no Facebook.
O usuário poderá interagir na aplicação por meio da criação de
uma rota, que será exibida dentro de um mapa gerado pelo
Google Maps. Será possível escolher o local de origem, ou
ponto de partida, e adicionar pontos intermediários na rota,
assim como editar esses pontos, adicionar novos pontos e exclu-
ir pontos. Depois de adicionar todos os pontos a rota será arma-
zenada e os pontos serão exibidos como pode ser visualizado na
Figura 2-1.
Após o usuário criar uma rota, este poderá compartilhá-la com
os seus amigos da rede social. O aplicativo pedirá autorização
para a rota ser publicada no mural (Figura 2-2). Dessa forma,
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 43 -
todos os 'amigos¨ (contatos na rede social) desse usuário terão
acesso rápido à rota criada (Figura 2-3).
Os 'amigos¨ do usuário dono da rota podem 'curtir¨ a rota e
compartilhar com outros amigos (Figura 2-3), dessa forma será
possível que a rota fique visível para 'amigos de amigos¨ (con-
tatos de 'amigos¨ que não são meus contatos). Porém, 'amigos
de amigos¨ não terão permissão para colaborar (editar a rota).
Essa funcionalidade estará disponível apenas para os contatos
do criador da rota.
A Iuncionalidade de colaborar permite que 'amigos¨ do dono
da rota adicionem novos pontos, excluam pontos desnecessá-
rios, ou ainda alterem o local de pontos existentes (Figura 2-4).
Qualquer pessoa que visualize ou edite uma rota pode comparti-
lhar o link para a rota com seus amigos (Figura 2-2).
4. CONCLUSÃO
Este artigo apresentou a proposta de um aplicativo para Face-
book que permite a criação e edição colaborativa de rotas. Esse
aplicativo será integrado posteriormente ao sistema UbiBus,
para facilitar que os usuários de transporte público tenham
acesso a informações referentes a rotas.
Após o desenvolvimento do aplicativo, uma prova de conceito
será realizada para verificar a viabilidade das funcionalidades
propostas. A prova de conceito será realizada por um grupo de
pessoas selecionadas para utilizar o aplicativo. Essas pessoas
responderão a um questionário, com o objetivo de oferecer
feedback sobre o aplicativo. O objetivo, inicialmente, não é
realizar um experimento formal, mas sim demonstrar como a
utilização do aplicativo contribui para o compartilhamento de
rotas, e descobrir pontos fortes e fracos da abordagem proposta
[20].
O aplicativo apresentado neste artigo é apenas o primeiro passo
em direção à solução envolvendo inteligência coletiva e edição
colaborativa de rotas para o sistema UbiBus. Depois do desen-
volvimento das funcionalidades básicas para edição colaborati-
va de rotas, recursos serão acrescentados para direcionar o foco
para usuários de transporte público. Para isso, pretende-se
incluir nesse aplicativo dados relacionados a linhas de ônibus,
para indicar quais linhas são necessárias para cumprir um per-
curso criado por um usuário. Deseja-se ainda incluir funcionali-
dades para votação do melhor percurso, para permitir que as
pessoas que realizaram o percurso informem sua opinião sobre
o trajeto, para classificar e promover as rotas de acordo com a
popularidade, entre outras funcionalidades que possam aumen-
tar a colaboração entre usuários do transporte público.
Agradecimentos
Os autores agradecem ao CNPq (processo 560135/2010-6) pelo
apoio financeiro. Este trabalho foi parcialmente apoiado pelo
Instituto Nacional de Ciência e Tecnologia para Engenharia de
Software (INES).
5. REFERÊNCIAS
[1] IBGE - Instituto Brasileiro de Geografia e Estatística.
(2009). Disponível em: http://www.ibge.gov.br/home/presidenc
ia/noticias/noticia_visual iza.php?id_noticia=1517, 2009
[2] A. Vivacqua and M. Borges, "Collective Intelligence for
the Design of Emergency Response," Computer Supported
Cooperative Work in Design (CSCWD), pp. 623-628, 2010.
[3] Microsoft. MSN Tecnologia. [Online].
http://tecnologia.br.msn.com/noticias/artigo.aspx?cp-
documentid=25499097, 2010
[4] T. Segaran, Programming Collective Intelligence: Build-
ing Smart Web 2.0 Applications, 1st ed. O'Reilly, 2007.
[5] P. Lévy, A inteligência coletiva: por uma antropologia do
ciberespaço, 3rd ed. São Paulo: Loyola, 2000.
[6] T. O'Reilly. (2006) O'Reilly Radar. [Online].
http://radar.oreilly.com/2006/12/web-20-compact-definition-
tryi.html, 2006.
[7] V. Vieira, L. R. Caldas, and A. C. Salgado, "Towards an
Ubiquitous and Context Sensitive Public Transportation Sys-
tem," International Conference on Ubi-Media Computing, Jul.
2011.
[8] J. Howe, "The Rise of Crowdsourcing," Wired Magazine,
vol. 14, Jun. 2006.
[9] D. C. Brabham, "Crowdsourcing as a Model for Problem
Solving: An Introduction and Cases," Convergence: The Inter-
national Journal of Research into New Media Technologies, pp.
75-90, 2008.
[10] E. M. Gillavry. (2003) webmapper - what the map can be.
[Online]. http://www.webmapper.net/carto2003/
[11] M. Drodzynski, S. Edelkamp, A. Gaubatz, S. Jabbar, and
M. Liebe, "On Constructing a Base Map for Collaborative Map
Generation and its Application in Urban Mobility Planning,"
10th International IEEE Conference on Intelligent Transporta-
tion Systems, pp. 678-683, 2007.
[12] V. Furtado, et al., "Collective intelligence in law en-
forcement - The WikiCrimes system," Information Sciences: an
International Journal, vol. 180, no. 1, pp. 4-17, Jan. 2010.
[13] D. Watts, Six Degrees: The Science of a Connected Age,
1st ed. New York: W. W. Norton & Company, 2003.
[14] D. Boyd and N. Ellisson, "Social Network Sites: Defini-
tion, History and Scholarship," Journal of Computer-Mediated
Communication, pp. 210-230, 2008.
[15] V. F. d. Santana, D. S. Melo-Solarte, V. P. d. A. Neris, L.
C. d. Miranda, and M. C. Baranauskas, "Redes Sociais Online:
Desafios e Possibilidades para o Contexto Brasileiro," XXIX
Congresso da Sociedade Brasileira de Computação (CSBC), pp.
339-353, 2009.
[16] M. Castells, A Galáxia da Internet: reflexões sobre a
Internet, os negócios e a sociedade, 1st ed. Rio de Janeiro:
Zahaar, 2003.
[17] B. Krishnamurthy, "A measure of online social net-
works," Conference on Communication Systems and Networks
(COMSNETS), pp. 190-199, 2009.
[18] R. d. Costa, "Por um novo conceito de comunidade: redes
sociais, comunidades pessoais, inteligência coletiva," Interface -
Comunicação, Saúde, Educação, vol. 9, pp. 235-248, 2005.
[19] K. Barry, How Smartphones Can Improve Public Transit.
Wired Maganize, Londres, abr. 2011. Disponível em
<http://www.wired.com/autopia/2011/04/how-smartphones-
can-improve-public-transit/>. Acesso em: 01 jul. 2011.
[20] P. Tonella, M. Torchiano, Bart Du Bois, and Tarja Systä;.
2007. Empirical studies in reverse engineering: state of the art
and future trends. Empirical Softw. Engg. vol. 12, n. 5, pp. 551-
571, 2007.

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 44 -

S E S S Ã O 3
Colaboração em Micromundos e Através
de Dispositivos Móveis
Using Microworlds to Study Teamwork
at the Cognitive Level
Cláudio Sapateiro
Polytechnic Institute of Setúbal
Campus do IPS, Estefanilha
2914-508 Setúbal, Portugal
+351 265 790 000
csapateiro@est.ips.pt
António Ferreira
LASIGE, University of Lisboa
Campo Grande
1149-016 Lisboa, Portugal
+351 21 750 00 00
asfe@di.fc.ul.pt
Pedro Antunes
LASIGE, University of Lisboa
Campo Grande
1149-016 Lisboa, Portugal
+351 21 750 00 00
paa@di.fc.ul.pt
ABSTRACT
This paper studies teamwork using a Microworld: a synthetic en-
vironment that allows analyzing the cognitive behavior of teams
in the laboratory. We developed a Microworld supporting the fol-
lowing functionality: control the experimental conditions; mediate
collaboration; integrate testable technological affordances; execute
experimental protocols; and collect experimental data. An exten-
sive study with the Microworld involving critical incident re-
sponse management is described in the paper. The study demon-
strates that the Microworld supports analyzing teamwork at the
cognitive level and facilitates the overall laboratorial set up.
Categories and Subject Descriptors
H.4.2 [Information Systems Applications]: Types of Systems—
Decision Support. H.5.3 [Information Interfaces and Presentation]:
Group and Organization Interfaces—Computer-Supported Co-
operative Work, Synchronous Interaction, Evaluation/Methodology.
General Terms
Measurement, Performance, Design, Experimentation, Human
Factors.
Keywords
Situation Awareness, Mobile devices, Microworlds.
1. INTRODUCTION
This paper discusses teamwork from a cognitive perspective. The
distinction between teamwork and other terms like collaboration,
cooperation and coordination is somewhat faint. We may take the
propositions discussed by Oravec [1] to point out that our research
addresses interdependent work teams “who share responsibility
for outcomes of their organization.” The focus on the cognitive
perspective also underscores that our aim is to understand how the
cognitive processes of the mind support teamwork. Within this
context we may account for important phenomena such as infor-
mation sharing, sensemaking [2, 3], decision-making [4], attention
[5, 6], situation awareness [7, 8] and information overload [9].
The selected application area concerns Critical Incident Response
Management (CIRM), a collaborative task performed by highly
focused teams who often make complex decisions in dynamic
contexts, facing emerging events, constant time pressure, and the
need to recover normal operational levels without severe losses
[10-12]. Critical incidents (CI) are characterized as unwanted,
unexpected, and to some extent unprecedented problems. Instead
of one single event, CI often involve chains of events, making the
course of action even more uncertain [13]. Examples of CI range
from common failures of key organizational resources to extreme
natural hazards and industrial disasters.
CIRM assumes a collaborative dimension because teams can lev-
erage expertise, information processing, flexibility, decision-
making and confidence. Under extreme circumstances, CIRM
teams must lead the organizations beyond pre-established struc-
tures, rules and behaviors. CIRM is strongly dependent on the
team’s knowledge and experience. Furthermore, as largely empha-
sized by the related literature [14, 15], Team Situation Awareness
(TSA) constitutes a critical asset for high performance teams
working in emergency situations. Therefore the role of cognitive
processes (considering a broader perspective of cognition) on es-
tablishing TSA is a fundamental dimension of teamwork analysis.
Our main research objective is studying - at the cognitive level -
teams performing CIRM activities. More specifically, we have
been trying to understand how teams use technology to communi-
cate, coordinate and collaborate under the demanding conditions
raised by CIRM. The adopted research approach relies on Mi-
croworlds.
Microworlds are real-time, task-oriented and synthetic environ-
ments used to study human behavior in simulated scenarios [16-
18]. Furthermore, a key characteristic that distinguishes a mi-
croworld environment regarding other simulation approaches is
the fact that it implements an autonomous dynamic of the evolv-
ing situation. In other words, the effects from users interaction
with the environment are not linear. The research literature has
been gathering evidence that Microworlds are capable to support
behavioral studies in challenging scenarios such as the ones pre-
sented by CIRM [19]. Microworlds must be carefully designed to
support experimental manipulation and control of the task envi-
ronment without removing many of the naturalistic conditions
faced by teams. One important challenge posed to Microworlds is
engaging teams in synthetic scenarios up to the point that their
behavior becomes natural and can therefore be analyzed as if in a
naturalistic setting [20]. A number of reasons impelled us to adopt
Microworlds to analyze CIRM scenarios:
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
Conference’10, Month 1–2, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010…$10.00.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 46 -
1. Incidents and their response have unexpected courses of action
therefore are difficult to set up in traditionally highly controlled
experiments. The inherent microworlds dynamic characteristics
allow specifying quasi-realistic scenarios and still preserve
some degree of control;
2. The ways teams address incidents are context dependent,
which often makes it difficult to generalize the findings. Mi-
croworlds can control the experimental context across multiple
scenarios and thus ease the definition of generalizable causal
interpretations;
3. Due to the nature of their work, the access to CIRM teams op-
erating in critical scenarios is typically difficult. Microworlds
accomplish two main purposes: training and unveiling team
processes dynamics.
Of course Microworlds also exhibit some limitations that should
be recognized beforehand. One that has been raised by several
researchers is the lack of ecological validity, i.e. results that are
significant beyond the laboratory. [21, 22] also present two other
concerns: (1) the need to design experimental scenarios that pro-
vide trustworthy representations of the problem domain; and (2)
the need to specify dependent and independent variables that fo-
cus on the naturalistic aspects and overcome the artificial traits of
the laboratorial scenarios. The research described in this paper
delves into these problems, proposing a Microworld that stream-
lines the construction of experimental scenarios and management
of experimental variables.
The paper is organized in the following way. We start with a re-
view of the related work. In Section 3 we present the main re-
quirements for developing a Microworld. Section 4 briefly de-
scribes the developed Microworld. In Section 5 we provide
experimental data from one extensive study done with the Mi-
croworld. Finally, Section 6 discusses the obtained results and
provides some concluding remarks.
2. RELATED WORK
The study of teamwork at the cognitive level has been evolving
over the past 20 years [23, 24]. Broadly speaking, the main focus
of research has been centered on understanding how teams: detect
salient cues in the environment; assimilate and combine infor-
mation; solve problems and make decisions; remember significant
information; plan courses of action; and develop high-
performance abilities.
Team cognition is deeply rooted on the traditional constructs of
individual cognition, including perception, interpretation, plan-
ning, and execution [25], memory storage and retrieval, and filter-
ing mechanisms [26]. Still, team cognition encompasses more
than the sum of individual cognitions, namely it covers team pro-
cesses such as communication, which has been regarded as a criti-
cal function [27-29].
The most recent research is converging towards understanding
how teams operate in naturalistic settings, that is, in realistic tasks
that require collaboration in the real world [30, 31]. This area of
concern is known as Macrocognition [32].
One major concern of Macrocognition is preserving the real-world
context while doing laboratory studies. This raises considerable
challenges, particularly when teams have to operate in complex
settings like CIRM. Cognitive phenomena such as emergence,
sensemaking, and attention must therefore be studied closer to
natural settings as much as possible [33].
Reinforcing this perspective, the research on Naturalistic Deci-
sion-Making (NDM) has been trying to understand how teams
make decisions in time-pressured environments [34]. One funda-
mental assumption of NDM is that teams diverge from the typical
rationalistic approach in which problems are analyzed in detail
and options are thoroughly evaluated until the best one is selected
[35]. According to NDM, decision makers tend to experience,
recognize, classify, and react in fast cycles.
The Macrocognition and NDM bodies of research extend cogni-
tion beyond the traditional information-processing paradigm [25]
considering the role of collaboration, pro-activity, and continuous
interaction in shaping decision making and action. Such perspec-
tive shares the ground of ecological psychology. Ecological psy-
chology relies on the concept of affordances as properties of the
interaction between the individual and the environment to unveil
opportunities/possibilities for action [36]. The dynamic, continu-
ous, and exploratory nature of affordances thus provides the con-
ceptual basis for understanding decision and action [37].
The development of this “ecological” perspective raises some
epistemological implications. By acknowledging affordances, we
must recognize that cognition extends beyond the human towards
the material setting. Thus team cognition is distributed across hu-
man and material settings, involving group interaction and embod-
iment [38, 39]. Based on this ecological perspective, Macrocogni-
tion studies may therefore focus on observable interactions, taken
in a broad sense, encompassing human-human, human-
technology, and human-environment interactions.
In [40], the authors distinguish internalized and externalized men-
tal processes employed by teams during one-of-a-kind problem-
solving situations. The internalized mental processes can only be
analyzed through indirect measurements, typically based on quali-
tative methods such as questionnaires and think-aloud protocols,
and also via surrogate quantitative metrics like pupil size and skin
response. On the other hand, externalized mental processes are
associated with actions that are analyzed through methods such as
process tracing and communication analysis.
Bringing collaborative technology to this fore raises many meth-
odological concerns [41], The analysis must be multidimensional,
since it must consider the individual, the group, and the technolog-
ical affordances as units of analysis that mutually influence each
other. Several models such as TAM [42] and TTM [43] have been
developed to address these problems. One common characteristic
of these models is the notion that both the technological af-
fordances and the needs experienced by individuals and teams
should be confronted.
TAM states that perceived usefulness and perceived ease of use
are instrumental to determine the users’ behavioral intentions and
consequently predict the human-technology interactions. TTM
builds on TAM to incorporate other cognitive factors such as per-
ceived frequency of net value and perceived magnitude of net
value. Both models highlight the importance of the group in the
construction of a positive or negative attitude towards the techno-
logical affordances.
According to several authors, two complementary research para-
digms have been guiding the study of technological affordances:
Behavioral Science and Design Science [44-46]. Behavioral Sci-
ence develops models and theory explaining and predicting how
humans and organizations behave. Causal models, and controlled
laboratory experiments contribute to develop rigorous studies of
team cognition. Nevertheless, the relevance of these results may
vary, as pointed out by [47].
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 47 -
The Design Science paradigm has its roots on engineering and is
primarily a problem-solving endeavor. It seeks to understand how
technology may solve specific problems in particular domains.
Thus, theory is subsumed by technology development. In this
view, the Design Science paradigm emphasizes a cyclic approach
where iterative developments followed by evaluation actions con-
tribute to understand complex cognitive phenomena.
The Design Science paradigm targets practical knowledge con-
struction. As such, its rigor has been questioned, mostly because it
frequently relies on common sense and heuristics [48]. When con-
trasted with the Behavioral Science paradigm, the Design Science
approach often lacks a commonly accepted reference model.
The strengths and weaknesses of these paradigms lead to their
complementary use in technology development. Each paradigm
may be viewed as one particular phase of the technology devel-
opment lifecycle. The Behavioral Science studies contribute to
establish the theoretical grounds for understanding human-human,
human-technology and human-environment interactions, while the
Design Science studies contribute with substantive test cases for
the claims brought by behavioral studies [49].
Hevner [50] proposed a research framework that combines these
two paradigms into three cycles: 1) the relevance cycle establishes
that relevance is attained through the identification of require-
ments and field-testing of concrete technological affordances; 2)
the rigor cycle posits that rigor is achieved by grounding the tech-
nological developments in solid conceptual foundations, including
methodologies, models, and theory; and 3) the design cycle is
responsible for the conception and implementation of technologi-
cal affordances. We adopted this framework in our research.
2.1 Microworlds as a Design-Evaluation Tool
The emphasis on naturalistic environments to study team cogni-
tion and the interplay between the behavioral and design sciences
in the development of technology that we identified earlier can be
combined in microworlds.
Microworlds are carefully crafted to support the laboratorial ma-
nipulation of the task environment without removing its natural-
istic characteristics [20]. An important feature is they explicitly
handle the dynamic and emergent aspects of the task, a long-time
prime concern of many decision-making studies, to the point that
microworlds are also known as “management flight simulators”
[51], which implies a degree of realism and engagement in the
“games managers play” [52].
Microworlds have also been adopted in scenarios such as naval
warfare [53], industrial process control [54], air traffic control
[55], naturalistic decision-making [16], fire fighting [19], and
other complex problem solving situations [17, 56], mostly for
training purposes. The potential to deal with unpredictable events
has also been investigated, uncovering many intricacies of cogni-
tive behavior [21]. Thus, microworlds definitively address the
relevance cycle.
A key aspect of microworld engagement is the dialog between
mental models and the running simulation [57]. This is because
disparities can happen between the beliefs people have about the
environment and team behavior: the former is described by com-
plex cause/effect networks, while the latter is oftentimes dysfunc-
tional, unpredictable, and yet naturally emergent, revealing, for
instance, contradictions in team strategies [52]. Consequently,
microworlds enable teams to learn from empirical experimenta-
tion, and allow them to evaluate and redesign existing policies.
This kind of practical knowledge construction reflects the design
cycle, which has also been applied to identify and resolve situa-
tion awareness problems in automation systems [58], to examine
how human behavior varies with the design of the human-
computer interface [22], and particularly, to augment the function-
ality of a preliminary tool for crisis response [59].
Furthermore, since microworlds can capture large amounts of
data, which are necessary for hypothesis testing, they also defi-
nitely contribute to the rigor cycle. We may therefore hypothesize
that microworlds may be excellent design-evaluation tools.
3. A CONCEPTUAL FRAMEWORK FOR
MICROWORLD DEVELOPMENT
We define a set of requirements for the development of a Mi-
croworld supporting teamwork studies at the cognitive level:
1. User engagement elements. In order to experience realistic
teams’ behavior the microworld environment must accommo-
date elements that promote engagement regarding the task and
environment (these elements may range from representations
that mimic real situation affordances to more sophisticated user
immersion elements)
2. Control the experimental conditions. This requirement is at
the core of any laboratory approach, on which Microworlds are
grounded. It assumes that the experimental setting must be
controlled to ensure precision and generalizability [60]. The
Microworld should provide experimental control while at the
same time preserving some degree of realism. For instance,
controlling the chain of events while reproducing real-world
incidents.
3. Mediate interaction, communication and collaboration.
These are the foundational elements of team cognition. They
emerge from the externalized mental processes and provide the
outputs necessary to analyze team cognition. The Microworld
should operationalize these outputs using a number of measur-
able metrics about human interaction, communication and col-
laboration.
4. Accommodate testable technological affordances. This re-
quirement meets the fundamental tenet of supporting the de-
sign-evaluation cycle. The Microworld should smoothly inte-
grate new technological designs in a way that ease innovation
but also model building and rigorous testing.
5. Execute experimental protocols. The Microworld should be
able to execute experimental protocols in accordance with a
domain specification. The domain specification should account
for the roles, tasks, messages, affordances and actions that con-
stitute the teamwork setting.
6. Collect experimental data. The Microworld must capture and
preserve data regarding interaction, communication and col-
laboration. This data should be kept in context with the envi-
ronmental and task conditions that influenced teamwork. The
granularity may range from the keystroke level to voice con-
versations. The flexibility handling various levels of detail is
essential to feed teamwork analysis.
We note that exploratory studies may have to be conducted before
starting a design-evaluation action using the Microworld. These
exploratory studies generate the contextual information necessary
to define the above-mentioned experimental protocols. These ex-
ploratory studies are also crucial to reproduce the application do-
main with some degree of realism.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 48 -
Figure 1 highlights the main concepts underlying the Microworld
development. It positions the exploratory study as a first step lead-
ing to subsequent design-evaluation actions. The dashed arrows
emphasize the iterative nature of the Microworld approach.
4. THE DEVELOPED MICROWORLD
4.1 Architecture
The developed Microworld adopts the client-server architecture
shown in Figure 2. The client consists of four different applications:
1. VoIP (Voice over IP) application, which allows two team
members to communicate with each other, emulating typical
phone and walkie-talkie conversations;
2. Task environment application, which loads a set of rules and
actions that the operators may accomplish in the environment,
e.g. move around;
3. Mobile Emulator, which emulates a mobile device delivering
the technological affordances under evaluation; and
4. Freeze-probe Questionnaires, which periodically freezes the
task to inquire the team about a set of cognitive factors, e.g.
situation awareness and sensemaking.
The server was developed as an application proxy that integrates
the required server components of the client applications. The
VoIPServer, manages the VoIP communications and the Mo-
bileServer, synchronizes clients running in the mobile emulator.
Complementarily, the server uses the applications supportive da-
tabases to maintain a coherent state between all applications (e.g.
to know when to trigger the freeze probes and provide contextual-
ly bounded questions). The supportive databases accomplish two
main goals: support the necessary data management to provide
proper application functioning and persist relevant data for results
analysis (e.g. task environment performed operations, freeze
probes answers). The complete description of the databases struc-
ture is outside the scope of this work, nevertheless one may out-
line that the Task database holds the exercises description com-
prehending network structures, allowed operations, existing roles
and respective operational profile.
4.2 Experimental set up and management
The major purpose of the developed Microworld is supporting
laboratory experiments with collaborating teams while facilitating
data collection and experimental control. We overview the main
requirements previously discussed and briefly describe how they
have been addressed in the developed Microworld in Table 1.
5. EXPERIMENT
5.1 Research goals
The research scenario involved helpdesk teams performing
maintenance tasks on a network infrastructure after an unknown
event had disrupted connectivity in some network links. These
operations are typically distributed on the physical space and the
teams rely on phone communications to coordinate their work. For
a previous study on the requirements of help desk teams operating
in CIRM scenarios see [11].
The main research goal was assessing the impact on team perfor-
mance and TSA caused by using a collaborative application
providing data sharing and task coordination. The hypothesis was
that the application would improve performance and TSA. Two
main collaborative settings should then be evaluated: one based
solely on phone communications, and another combining phone
communications with the collaborative application.
5.2 Experimental design
The experiment engaged 33 students from the final year of an
undergraduate programme in Informatics and they had already
completed a computer networks course. These students were
knowledgeable about the task setting and goals. They were orga-
nized in 11 teams with three elements. A consent form was signed
stating their commitment to the task and authorizing data collec-
Figure 1. Microworld development framework
Figure 2. Microworld architecture
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 49 -
tion. Prize money and extra course credits were offered to the best
performers to encourage deeper task engagement.
The Microworld was configured to support three different roles: 1)
Team Member 1 (TM1) has high-level credentials, allowing op-
erations on servers, routers, and computers; 2) Team Member 2
(TM2) has middle-level credentials, allowing operations on rout-
ers and computers, but not on servers; and 3) Team Member 3
(TM3) can only operate computers.
Before the experiment, the teams received a manual describing the
experiment goals, roles, and tools. Briefing sessions were orga-
nized to clarify any doubts regarding the experiment.
Four exercises were designed and loaded into the Microworld
environment. The odd teams accomplished two exercises without
the collaborative application support (W/O condition). The first
one was for training purposes, while the second one was effective
experimental data collection.
After the first two exercises, the odd teams were subject to two
more exercises with the collaborative application support (W/
condition). Again, the first one was for training purposes while the
second one was for data collection. Even teams performed in the
reverse order.
Figure 3a depicts one of the network infrastructures loaded in
microworld, which is operated through the task environment ap-
plication component (screenshot in Figure 3b). Table 2 presents a
sample exercise to be performed over the network. The questions
used in the freeze probes during the data collection exercises are
presented in Table 3. These questions are focused on evaluating
situation awareness. Finally, Table 4 presents the set of measure-
ments used to evaluate the research hypothesis.
a. Network Architecture
b. Screenshot of the task environment user interface
Figure 3. Example of a network loaded in microworld
5.3 Results
Concerning performance, [P1] in the W/ condition was signifi-
cantly longer than with the W/O condition. Considering the data
distribution, we used the non-parametric Wilcoxon signed-rank
test for pairwise comparisons to evaluate the statistical signifi-
cance of the results (Table 5). The analysis of [P2] and [P3] did
not reveal any statistically significant differences. [C] is on the
threshold of statistical significance urging that teams in the W/
condition perform fewer VoIP calls.
Three freeze probes were accomplished during the data collection
exercises. [IA] was analyzed for each team role (TM1, TM2 and
TM3) and regarding the three questions prompted by the freeze
Table 1. Experimental set up and management
Requirements
Issues
addressed Implementation
User
Engagement
Elements pro-
moting team
commitment
with the task
Two counts were provided to
team members expressing: the
total number of team actions and
the total moves of team members
through the environment (Team
score was maximized with min-
imal counts)
Task environ-
ment representa-
tion
A representation of the task envi-
ronment is provided to teams.
Experimental
control
Team size
Currently supports teams with
three elements
Team composi-
tion and struc-
ture
Different roles may be defined
for each team element, distin-
guishing technological and also
environmental actions
Task complexity
Various tasks and operational
environments, with different
complexity levels (variety of
actions and goals), may be up-
loaded in the Microworld
Location of
team members
The location of team elements in
the physical environment may be
emulated by the task environ-
ment application
Mediation
Human-human
VoIP application supports one-
to-one voice communications
Human-
environment
A predefined set of actions that
may be executed on the operat-
ing environment is uploaded in
the Microworld
Human-
technology
The prototype component may
be configured to emulate the
user-interfaces and the function-
ality offered by collaborative
applications
Technological
affordances
Application
design
Various application designs may
be emulated by the prototype
component
Experimental
protocols
Practice task
The Microworld may instantiate
a practice task, so that the opera-
tors may get familiar with the
experimental environment
Task completion
time
The task duration may be de-
fined in the task environment
Freeze probes
Define moments when the task is
frozen and the questions deliv-
ered to the operators
Data
collection
Record opera-
tions
Support three main dimensions of
analysis: performance, team pro-
cesses and situation awareness
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 50 -
probes (Table 2). The collected data did not reveal any significant
statistical differences between the two experimental conditions.
Table 2. Exercise Description
Reported problem
Connectivity lost in rooms B, C, E
and Computers connected to Router
D1
Problem source
Broken link between Router A1 and
Server
Required operations
(to optimal solution)
Connect Router A1 to Router A2,
Update Router B, Restart Router C
and Restart Router D1
Table 3. Questions used in the freeze probes
ID Question
[Q1] What are the states of the devices linked to the last oper-
ated device?
[Q2] In what room are the team members currently located?
[Q3] Which devices are currently constraining the network
connectivity?
Table 4. Measurements
ID Metric Description
[P1] Completion Time Time to complete the exercise
[P2] Efficiency
ideal number of operations to solve the exercise
numbei of opeiations in the viitual netwoik
[P3] Efficacy
numbei of woiking uevices
achievable number of working devices
[C] Communication numbei of voIP communications
[IA] Individual
Awareness
number of correct items in freeze probes
number of questioned items
[ShA] Shared Awareness
Overlap:


כ͓୮ୟ୧୰ୣୢ ୟ୬ୱ୵ୣ୰ୱ ା ͓୲୰୧୮୪ୣ ୟ୬ୱ୵ୣ୰ୱ
୬୳୫ୠୣ୰ ୭୤ ୡ୭୫୫୭୬ ୧୲ୣ୬ୱ ୧୬ ୲୦ୣ ୯୳ୣୱ୲୧୭୬
Precision:
୬୳୫ୠୣ୰ ୭୤ ୡ୭୰୰ୣୡ୲ ୟ୬ୱ୵ୣ୰ୱ
୬୳୫ୠୣ୰ ୭୤ ୡ୭୫୫୭୬ ୟ୬ୱ୵ୣ୰ୱ
[DA] Distributed
Awareness
Team average of individual scores in the freeze
probes
Table 5. Performance
Metric W/O W/ p value
[P1] 8.23 10.55 0.016
[P2] 0.78 0.76 0.56
[P3] 0.97 0.98 0.51
[C] 10.09 7.73 0.05
Regarding [ShA] we defined two dimensions of analysis: the
overlap of answers between team members (common knowledge)
and the precision of the answers (the extent that such knowledge
is correct). Table 6 summarizes the achieved scores regarding the
three questions during the three freeze probe iterations.
[Q1] scores exhibit a growing knowledge overlap between the
first freeze probe and the second and then maintain similar scores
at the final freeze probe. The precision scores indicate that the
existing overlap is highly accurate regarding the real situation.
Nevertheless, no significant differences are observed between the
two experimental conditions.
Overlap scores and particularly precision regarding [Q2] decay as
exercise evolves. Besides the first freeze probe overlap score and
the precision scores in the two first freeze probes reveal slightly
better in the W/ condition, no statistically significant differences
were found.
[Q3] exhibited the lower overlap scores of the three questions and
had kept low through all the freeze probes. Despite the poor com-
mon knowledge achieved regarding [Q3] it was accurate, consid-
ering the precision scores. Particularly, although without yielding
a statistically significant difference, in the W/ condition teams
achieved better precision as exercise evolve.
The analysis of distributed awareness [DA] was based on the av-
erage scores of individual answers to the freeze probes of [Q1,
Q2, Q3], constituting an aggregated measure of team knowledge
considering the team as the unit of analysis (actionable knowledge
existing in the team). Despite the results again not revealing any
statistically significant differences between conditions, a more
detailed analysis provides interesting insights about the evolution
of [DA] over time.
[Q1] shows a slight improvement from the first to the second
freeze probe, and then reached a plateau in the third iteration (Fig-
ure 4). The answers to [Q2] reveal that as the exercise unfolds the
teams loose awareness of where the others are located. However,
the W/ condition obtains better scores than the W/O condition
(Figure 4). Finally, [Q3] shows that the teams improved their ag-
gregated situation awareness throughout the freeze probes, with a
slightly advantage obtained by the W/ condition.
6. CONCLUDING REMARKS
Grounded on previous research streams emphasizing the im-
portance of studying human action in naturalistic settings, i.e. as
closer as possible to real operating environments, we have re-
searched the adoption of Microworlds in the study of teamwork at
the cognitive level. We have specifically focused on the challeng-
ing context of CIRM, where access to real operating environments
often reveals difficult or even impossible.
We defined a set of requirements these Microworlds should ac-
complish to support teamwork studies. Based on these require-
ments, we developed a Microworld. The capacity of the Mi-
croworld to capture experimental data at the cognitive level was
evaluated. Along the development process, we also assessed the
Microworld’s capacity to control the experimental setting and to
facilitate the experimental set up and management.
The extensive study briefly reported in this paper demonstrates the
relevance of the Microworld approach. In the one hand, it serves
to collect large amounts of varied cognitive-level information. In
Table 6. Shared awareness scores
Iteration 1 Iteration 2 Iteration 3
Overlap Precision Overlap Precision Overlap Precision
w/o w/ w/o w/ w/o w/ w/o w/ w/o w/ w/o w/
Q1 0.26 0.25 1.00 1.00 0.57 0.63 0.95 1.00 0.62 0.60 0.99 0.98
Q2 0.75 0.81 0.78 0.93 0.68 0.63 0.61 0.71 0.65 0.63 0.42 0.41
Q3 0.09 0.06 0.96 0.86 0.10 0.09 0.75 1.00 0.14 0.13 0.86 0.93
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 51 -
the other hand, it also facilitates de definition and execution of the
several experimental conditions necessary to obtain the experi-
mental data.
As it is often the case, the concrete experiment reported in the
paper does not reveal a breakthrough technological solution to
improve the teams’ performance (considering the tested collabora-
tive application). It nevertheless allowed us to analyze at the cog-
nitive level how the collaborative application was used by the
teams, and also why significant differences do not actually occur.
We therefore conclude that the Microworld environment proved to
be a rich and systemic data collection medium and provides solid
grounds for consistent data collection and analysis.
7. ACKNOWLEDGMENTS
This research was partially funded by the Portuguese Foundation
for Science and Technology (PTDC/EIA/102875/2008).
8. REFERENCES
[1] Oravec, J. 1996. Virtual Individuals, Virtual Groups: Human
Dimensions of Groupware and Computer Networking.
Cambridge University Press.
[2] Zurita, G., et al. 2007. Mobile sensemaking: Exploring
proximity and mobile applications in the classroom. Journal
of Universal Computer Science, 13(10), 1434-1448.
[3] Weick, K., K. Sutcliffe, and D. Obsfeld 2005. Organizing
and the process of sensemaking. Organization Science,
16(4), 409-421.
[4] Antunes, P., et al. 2010. Integrating spatial data and decision
models in a e-planning tool. In Proceedings of the 16th
CRIWG Conference on Collaboration and Technology
(Maastricht, The Netherlands). Springer-Verlag, 97-112.
[5] Ferreira, A., P. Antunes and V. Herskovic 2011. Improving
group attention: An experiment with synchronous brain-
storming. Group Decision and Negotiation, 20(5), 643-666.
[6] Ferreira, A. and P. Antunes 2008. An attentive groupware
device to mitigate information overload. In Proceedings of
the 2008 Conference on Design, Specification, and
Verification of Interactive Systems (Kingston, Canada).
Springer-Verlag, 29-42.
[7] Antunes, P. and A. Ferreira 2011. Developing collaboration
awareness support from a cognitive perspective. In
Proceedings of the 44th Hawaii International Conference on
System sciences (Hawaii, HI, USA). IEEE Press.
[8] Endsley, M., B. Bolté, and D. Jones 2003. Designing for
Situation Awareness. Taylor & Francis.
[9] Ferreira, A. and P. Antunes 2008. Tackling information
overload in electronic brainstorming. In Proceedings of the
2008 GDN (Coimbra, Portugal).
[10] Antunes, P., et al. 2011. Development of a mobile situation
awareness tool supporting disaster recovery of business
operations. In Supporting Real Time Decision-Making: The
Role of Context in Decision Support on the Move. Springer,
337-360.
[11] Sapateiro, C., et al. 2011. Developing a mobile collaborative
tool for business continuity management. Journal of
Universal Computer Science, 17(2), 164-182.
[12] Sapateiro, C. and P. Antunes 2009. An emergency response
model toward situational awareness improvement. In
Proceedings of the 2009 ISCRAM (Göteborg, Sweden).
[13] Rosenthal, U., A. Boin, and L.K. Comfort 2001. Managing
Crises: Threats, Dilemmas, Opportunities. Charles Thomas.
[14] Milis, K. and B.V.d. Walle 2007. IT for Corporate Crisis
Management: Findings from a Survey in 6 different
Industries on Management Attention, Intention and Actual
Use. In Proceedings of HICSS.
[15] Kanno, T. and K. Futura 2006. Resilience of Emergency
Response Systems.2
nd
Symposium on Resilience Engineering
(Juan-les-Pins, France)
[16] Chapman, T., et al. 2006. Investigating the construct validity
associated with microworld research: A comparison of
performance under different management structures across
expert and non-expert naturalistic decision-making groups.
Australian Journal of Psychology, 58(1), 40-47.
[17] Jobidon, M.E., et al. 2006. Team response to workload
transition: The role of team structure. In Cognition: Beyond
the Brain. 22-32.
[18] Brehmer, B. and D. Dörner 1993. Experiments with
computer-simulated microworlds: Escaping both the narrow
straits of the laboratory and the deep blue sea of the field
study. Computers in Human Behavior, 9(2), 171-184.
[19] Omodei, M.M. and A.J. Wearing 1995. The Fire Chief
microworld generating program: An illustration of computer-
simulated microworlds as an experimental paradigm for
Figure 4. Distributed awareness [DA]
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 52 -
studying complex decision-making behavior. Behavior Research
Methods, Instruments, and Computers, 27(3), 303-316.
[20] Gray, W. 2002. Simulated task environments: The Role of
high-fidelity simulations, scaled worlds, synthetic
environments, and laboratory tasks in basic and applied
cognitive research. Cognitive Science Quarterly, 2(2) 205-
207.
[21] Gonzalez, C., P. Vanyukov, and M.K. Martin 2005. The use
of microworlds to study dynamic decision making.
Computers in Human Behavior, 21(2), 273-286.
[22] Sauer, J., D.G. Wastell, and G.R.J. Hockey 2000. A concep-
tual framework for designing micro-worlds for complex
work domains: a case study of the Cabin Air Management
System. Computers in Human Behavior, 16(1), 45-58.
[23] Cooke, N.J., et al. 2001. Advances in Measuring Team
Cognition.
[24] Cuevas, H.M., et al. 2007. Augmenting Team Cognition in
Human-Automation Teams Performing in Complex
Operational Enviornments. Aviation, Space, and
Environmental Medicine, 78(5).
[25] Card, S., T. Moran, and A. Newell 1983. The Psychology of
Human-Computer Interaction. Lawrance Elrbaum.
[26] Reason, J. 1990. Human Error. Cambridge University Press.
[27] Kiekel, P.A., et al. 2001. Automating measurement of team
cognition through analysis of communication data. Usability
Evaluation and Interface Design. Lawrence Erlbaum.
[28] Keyton, J., S.J. Beck, and M.B. Asbury 2010. Macro-
cognition: a communication perspective. Theoretical Issues
in Ergonomics Science, 11(4), 272-286.
[29] Kennedy, D.M. and S.A. McComb 2010. Merging internal
and external processes: Examining the mental model
convergence process through team communication.
Theoretical Issues in Ergonomics Science, 11(4), 340-358.
[30] Salas, E., et al. 2010. Emerging multi-disciplinary theoretical
perspectives in team cognition: an overview. Theoretical
Issues in Ergonomics Science, 11(4), 245-249.
[31] Wallace, D.M. and V.B. Hinsz 2010. Teams as technology:
applying theory and research to model macrocognition
processes in teams. Theoretical Issues in Ergonomics
Science, 11(4), 359-374.
[32] Cacciabue, P.C. and E. Hollnagel 2005. Simulation of cognition:
Applications. In Expertise and Technology: Issues in Cognition
and Human-Computer Cooperation. Lawrance Elrbaum.
[33] Klein, G., et al. 2003. Macrocognition. IEEE Intelligent
Systems, 18(3), 81-85.
[34] Klein, G. 1993. A recognition-primed decision (RPD) model
of rapid decision making. In Decision Making in Action:
Models and Methods. Ablex Publishing.
[35] Wallace, B. and A. Ross 2006. Beyond Human Error. CRC
Press, London UK. ISBN 0849327180.
[36] Gibson, J.J. 1966. The senses considered as perceptual
systems. Houhton Mifflin.
[37] Turvey, M.T. and R.E. Shawn 1995. Toward an ecological
physics and physical psychology. In The Science of the
Mind: 2001 and Beyond. Oxford University Press, 144-169.
[38] Dourish, P. 2011. Where the Action Is. MIT Press.
[39] Suchman, L. and R. Trigg 1993. Artificial Intelligence as
Craftwork. In Understanding Practice, Cambridge Uni-
versity Press.
[40] Fiore, S.M., et al. 2010. Towards an understanding of
macrocognition in teams: developing and defining complex
collaborative processes and products. Theoretical Issues in
Ergonomics Science, 11(4), 250-271.
[41] Antunes, P., et al. (to appear). Structuring dimensions for
collaborative systems evaluation. ACM Computing Surveys.
[42] Davis, F. 1986. A technology acceptance model for
empirically testing new end-user information systems:
Theory and results. PhD Thesis. Sloan School of
Management, Massachusetts Institute of Technology.
[43] Briggs, B., J. Nunamaker, and D. Tobey 2001. The
technology transition model: A key to self-sustaining and
growing communities of GSS users. in Proceedings of the
34th Hawaii International Conference on System Sciences
(Hawaii, HI, USA).
[44] Hevner, A., et al. 2004. Design science in information
systems research. Management Information Systems
Quarterly, 28(1), 75-105.
[45] Niehaves, B. and B. Stahl 2006. Criticality, epistemology,
and behaviour vs. design: Information systems research
across different sets of paradigms. Leicester, England.
[46] Cleven, A., P. Gubler, and K.M. Hüner 2009. Design
alternatives for the evaluation of design science research
artifacts. In Proceedings of the 4th International Conference
on Design Science Research in Information Systems and
Technology. (Philadelphia, PA, USA). ACM Press, 1-8.
[47] Winter, R. 2008. Design science research in Europe.
European Journal of Information Systems, 17(5), 470-475.
[48] Briggs, R.O. 2006. On theory-driven design and deployment
of collaboration systems. International Journal of Human-
Computer Studies, 64(7), 573-582.
[49] March, S.T. and G.F. Smith 1995. Design and natural science
research on information technology. Decision Support
Systems, 15(4), 251-266.
[50] Hevner, A. 2007. A three cycle view of design science
research. Scandinavian Journal of Information Systems,
19(2), 87-92.
[51] Sterman, J.D. 2000. Business Dynamics: Systems Thinking
and Modeling for a Complex World. McGraw-Hill.
[52] Keys, J.B., R.M. Fulmer, and S.A. Stumpf 1996.
Microworlds and simuworlds: Practice fields for the learning
organization. Organizational Dynamics, 24(4), 36-49.
[53] Arthur, W., et al. 2010. The effect of distributed practice on
immediate posttraining, and long-term performance on a
complex command-and-control simulation task. Human
Performance, 23(5), 428-445.
[54] Sauer, J., et al. 2008. The effects of heuristic rule training on
operator performance in a simulated process control
environment. Ergonomics, 51(7), 953-967.
[55] O'Brien, K.S. and D. O'Hare 2007. Situational awareness
ability and cognitive skills training in a complex real-world
task. Ergonomics, 50(7), 1064-1091.
[56] Funke, J. 2001. Dynamic systems as tools for analyzing
judgment. Thinking and Reasoning, 7, 69-89.
[57] Morecroft, J.D.W. 1988. System dynamics and microworlds
for policymakers. European Journal of Operational
Research, 35(3), 301-320.
[58] Itoh, M. and T. Inagaki 2004. A microworld approach to
identifying issues of human-automation systems design for
supporting operator's situation awareness. International
Journal of Human-Computer Interaction, 17(1), 3-24.
[59] Schraagen, J.M. and J. van de Ven 2008. Improving decision
making in crisis response through critical thinking support.
Journal of Cognitive Engineering and Decision Making, 2,
311-327.
[60] McGrath, J. 1984. Groups: Interaction and performance.
Prentice-Hall.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 53 -
SLMEETINGROOM: UM MODELO DE AMBIENTE PARA SUPORTE A
REUNIÕES REMOTAS, ORIENTADAS A TAREFAS, COM GRUPOS
PEQUENOS PARA O SECOND LIFE
Cintia Ramalho Caetano da Silva
Instituto de Computação (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
ccaetano@ic.uff.br
Ana Cristina Bicharra Garcia
Instituto de Computação (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
bicharra@ic.uff.br

Abstract²This research investigates the use of
SLMeetingRoom model, an environment model to support
collaborative activities in Second Life
®
that occur in meetings
where participants are geographically distant. The
SLMeetingRoom model is composed of the a set of ten
components that supports collaborative activities including
communication between participants, coordination of tasks
and people, cooperation between participants and awareness of
work and group. This work hypothesizes that the use of
SLMeetingRoom model to support meetings, provides results
closest to face to face interactions. A comparative experimental
study with groups of graduate students, enrolled in the
discipline of Interface and Multimedia of the Fluminense
Federal University (UFF) was conducted. Results show that a
group using the SLMeetingRoom model has less cognitive
effort and a greatest sense of presence to realize the meetings,
that a group using Second Life without the SLMeetingRoom
model and a group using videoconferencing systems.
Keywords-component; CSCW, Second Life, SLMeetingRoom
model, work meetings.
I. INTRODUÇÃO
Quando as pessoas atuam em grupos, em geral, a
sinergia produz resultados melhores do que trabalhando
individualmente, pois, juntas, podem buscar ideias e
informações para auxiliar na resolução dos problemas. Ao
realizar uma tarefa, um grupo pode utilizar determinados
modos de trabalho [1], como, por exemplo, uma reunião,
definida por [2] e [3] como um ponto de encontro para um
determinado grupo estabelecer comunicação e interagir,
conjuntamente, para atingir determinados objetivos.
Com o surgimento da Web 3.0 e das tecnologias de
ambientes virtuais 3D, novas possibilidades para a realização
de reuniões virtuais tem sido propostas [2][4][5]. O Second
Life (SL) tem despontado como ambiente para interação
entre pessoas geograficamente distribuídas, despertando o
interesse de organizações como IBM, Intel e NASA, para
realizar reuniões virtuais entre funcionários, filiais ou
clientes distribuídos, reduzindo os custos de alocação de
espaço e tempo de viagem [2][6]. A comunidade acadêmica
utiliza o SL como ferramenta educacional, facilitando a
imersão dos alunos e professores [7][8]. Já a comunidade de
pesquisa acredita na possibilidade de desenvolvimento de
uma postura profissional dentro de ambientes virtuais 3D [9].
A problemática deste trabalho se concentra no fato de
que, mesmo com tantas plataformas existentes no mercado
(chats, videoconferência, EMS
1
), falta uma solução satisfató-
ria para o suporte das reuniões remotas. Ambientes virtuais
3D, como o SL, são uma boa proposta, mas ainda não
possuem as funcionalidades necessárias para apoiar as
atividades vitais de reuniões remotas. Segundo [12][24][43],
as atividades vitais em uma reunião de trabalho remota, que
necessita de suporte, são: agendamento de compromissos e
eventos, acompanhamento das tarefas, tomada de decisões,
votação, armazenamento de informações e percepção.
Com o objetivo de resolver o problema desta pesquisa,
propomos a criação de um modelo de ambiente para suporte
às atividades básicas que ocorrem em reuniões de trabalho.
Posteriormente, levantamos a hipótese de que, ao enriquecer
o Second Life com o modelo SLMeetingRoom, a qualidade
das reuniões serão mais próximas a das reuniões face-a-face
('padrão ouro¨). Consideramos que a qualidade das reuniões
pode ser medida pelos seguintes critérios: grau de
completude das tarefas ao final da reunião, nível de
participação de cada integrante do grupo, esforço cognitivo
para a interação entre os participantes e senso de presença
percebido pelos participantes do grupo.
O método de pesquisa adotado foi o estudo experimental
comparativo, que visa à comparação entre grupos
experimentais e controle, através da alocação aleatória dos
participantes [10]. O estudo experimental comparativo foi
realizado em duas etapas: estudo piloto e experimento.
Na análise das medidas objetivas foram utilizadas
técnicas estatísticas como medidas-resumo (média, variância,
desvio padrão e porcentagem), regressão e correlação. O
teste de hipóteses foi utilizado como um mecanismo para
fornecer evidência estatística de diferenças entre os grupos
experimentais. Com o objetivo de comparar os grupos, foi
utilizado o teste de Jonckheere-Terpstra JT [11], um teste
não-paramétrico que verifica as diferenças entre tratamentos
ordenados.
II. FUNDAMENTAÇÃO TEÓRICA
A utilização de computadores para apoio ao trabalho em
conjunto deu origem a área de pesquisa conhecida como
CSCW (Computer Supported Cooperative Work), que visa
entender como a tecnologia atua na execução de trabalhos e

1
Eletronic Meeting System ou Sistemas de Reunião Eletrônica
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 54 -
tarefas em conjunto, abrangendo o suporte computacional a
atividades que envolvem mais de uma pessoa [12]. Segundo
[12], a tecnologia virtual tem a capacidade de afetar,
profundamente, a natureza do trabalho em grupo, através da
utilização de plataformas dedicadas, que dão o suporte,
devidamente adequado, ao processo de interação do grupo.
A maioria das pessoas considera as reuniões face-a-face
como a forma ideal de comunicação. Estas reuniões são
avaliadas por muitos como o 'padrão ouro¨ para as
interações em um grupo [9][24]. É possível notar os
benefícios do espaço de trabalho comum, como o aumento
da aprendizagem, motivação, coordenação e produtividade
[25], quando pessoas interagem em reuniões presenciais. A
facilidade da utilização do olhar, gestos e posturas, assim
como o acesso mútuo a artefatos compartilhados (telas,
modelos, paineis, etc.) reforçam as vantagens das reuniões
presenciais [24]. Porém, há, também, alguns problemas,
como: custos elevados associados ao tempo e à alocação de
espaço; atenção excessiva a questões menores;
apreensividade sobre como as ideias serão recebidas [3];
nervosismo associado ao fato de ocupar a condição de
falante (dificuldades na eloquência e exposição de
ideias)[26]; falta de um bom registro; etc. Estes problemas
podem resultar, muitas vezes, em reuniões menos
participativas [3].
A utilização da tecnologia, por muitas vezes, organiza e
realiza reuniões eficazes, no entanto, mesmo depois de uma
preparação intensa, não há garantias de que a reunião vai
progredir sem qualquer problema e alcançar as metas
desejadas. Além disso, a avaliação de uma 'boa¨ reunião é
algo subjetivo e embora as reuniões mal sucedidas ocorram,
frequentemente, suas causas exatas são, em grande parte,
não-documentadas e não-compreendidas. Torna-se
necessário, certa quantidade de estrutura para garantir o
sucesso da reunião, para que o grupo permaneça concentrado
e realize a tarefa necessária com o mínimo de interrupção.
A comunicação mediada por vídeo, também conhecida
como videoconferência, foi apontada por inúmeros autores
como a substituta para a comunicação face-a-face [27][28]
[29]. Os sistemas de videoconferência são excelentes
ferramentas para CSCW, pois facilitam a comunicação,
aumentam o nível de participação [30] e reduzem custos com
deslocamento físico [24]. Essas vantagens tornam a
videoconferência um meio rico para a comunicação. No
entanto, é considerada uma solução invasiva, que, de certa
forma, tira a privacidade durante as interações [31]; com alto
custo para configuração e manutenção das tradicionais salas
de reuniões [32]; e não permite a configuração de um
contexto real de sala de reunião, com participantes remotos
atuando sentados em uma mesa de trabalho [29].
O lento crescimento e as limitações dos sistemas de
videoconferência para a realização de reuniões distribuídas
[33][34], possivelmente, fortaleceram o aparecimento dos
sistemas de reunião eletrônica (EMS) - que surgiram na
tentativa de preencher a falta de sistemas que apoiassem,
especificamente, a colaboração entre participantes de um
grupo em reuniões virtuais, melhorando, consequentemente,
a eficácia, eficiência e satisfação [3]. Os sistemas EMS
apresentam vantagens como: apoio à comunicação, através
de ferramenta de brainstorming, organização de ideias e
votação; apoio à coordenação das tarefas, através de
ferramentas para facilitadores de reuniões, agendas e
cronogramas; apoio à cooperação, através de ferramentas de
compartilhamento de área de trabalho; e apoio à percepção,
através de ferramentas de feedback das atividades dos
participantes. Apesar dos sistemas EMS cobrirem todos os
requisitos essenciais para a colaboração, estudos indicam que
a adoção dos EMS tem sido bastante restrita. As limitações
são inúmeras, como alto consumo de banda de Internet,
complexidade de manutenção e instalação, resistência às
mudanças, dificuldade em mensurar os benefícios, etc. [35].
Após o advento dos EMS, surgiram os ambientes virtuais
3D, que estão, gradualmente, se tornando mais comuns como
ferramentas cotidianas para a comunicação, socialização e
realização de reuniões [2][4][5]. Nos ambientes virtuais 3D
disponíveis para interação social e comunicação,
encontramos, dentre outros, o There [36], o Active World
[37] e o Second Life (SL) [38]. O mais popular representante
dos metaverso
2
interativos é o SL, um ambiente de realidade
virtual, compartilhado entre usuários remotos, que se
assemelha ao universo real.
Segundo [4], o SL cobre a maior parte dos aspectos
essenciais da comunicação síncrona tão importante na área
de CSCW, como chat direto, mensagens instantâneas,
conversas de voz, gestos, grupos internos, etc. Ele também
permite alargar os limites da interação remota, através de
modelos 3D, que oferecem um excelente potencial para
novas formas de interação, cooperação e socialização. A
imersão do participante no contexto da interação é o ponto
forte do SL, que gera um sentimento de co-localização,
simulando a sensação de estar fisicamente co-localizado,
tornando um ambiente possível e favorável para a realização
de reuniões de trabalho, tendo em vista a apresentação das
características de reuniões face-a-face e remotas.
O Second Life tem se mostrado um excelente potencial
para o desenvolvimento de atividades colaborativas, uma vez
que suas características de mundo real permitem que o
usuário esteja imerso nas atividades e sinta-se parte do
ambiente. Assim como os EMS, o SL consegue atingir,
positivamente, os requisitos essenciais para a colaboração,
isto é, as atividades de comunicação são bem desenvolvidas,
a percepção e cooperação são apoiadas pela qualidade das
interações 3D e, em menor escala, garante a coordenação
através dos grupos internos.
Tais vantagens afirmam o escopo desta pesquisa
utilizando o SL como um groupware para suporte a reuniões
distribuídas, no intuito de verificar se a criação de um
ambiente de reuniões, composto por um conjunto de
componentes essenciais para a colaboração, permitirá obter
resultados mais próximos das interações face-a-face.
III. MODELO SLMEETINGROOM
A colaboração pode ser vista como a combinação das
atividades de comunicação, coordenação, cooperação,
aliadas a percepção. Esse tripé de atividades é conhecido

2
Terminologia para indicar um mundo virtual. A palavra metaverso é uma
junção do preIixo 'meta¨ (que signiIica 'além¨) e 'universo¨ [39].
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 55 -
como modelo 3C de colaboração. Um modelo que determina
os requisitos essenciais para que possa existir uma
colaboração efetiva entre os membros de uma equipe e é
visto como o objetivo do groupware [12]. Dessa forma,
utilizamos o modelo 3C de colaboração para implementar e
avaliar os componentes que compõe nosso modelo.
O modelo SLMeetingRoom é um modelo de trabalho em
grupo em reuniões onde os participantes estão
geograficamente distribuídos. Para desenhar o modelo, nos
inspiramos na representação dos modelos de sistemas
distribuídos organizados em camadas. A Figura 1 apresenta a
representação do modelo SLMeetingRoom.


Figure 1. Modelo SLMeetingRoom
O Second Life é a camada mais externa do modelo. Ele
oferece a infraestrutura de sistema distribuído para apoiar o
processo de reunião, através de espaços compartilhados para
interação do grupo. Os usuários, que ingressarem na sala de
reuniões apoiada pelo modelo SLMeetingRoom, terão acesso
a todas as camadas. Cada camada, por sua vez, representa os
serviços disponibilizados pelo modelo. Os componentes
atuam como provedores de serviços nas camadas, podendo
atuar em várias camadas ao mesmo tempo.
Da mesma forma como no modelo de sistemas
distribuídos em camadas, existe um relacionamento de
dependência entre as camadas do modelo SLMeetingRoom.
A comunicação gera compromissos para a coordenação. A
coordenação eficiente facilita as atividades de cooperação. E
a percepção, por sua vez, apoia a comunicação e a
coordenação. De um modo geral, cada camada é separada
para fins de análise, porém elas atuam de forma integrada
durante o trabalho em grupo.
Os componentes que compõe o modelo SLMeetingRoom
foram propostos, a partir de três experimentos utilizando o
SL para realização de reuniões. Através desses experimentos,
notamos que a maior dificuldade em utilizar o SL, para
realizar reuniões, foi a falta de um ferramental mínimo para
apoiar as reuniões de trabalho, de forma a conduzir as
atividades, visando atingir os objetivos do grupo.
Tendo em vista que um componente pode atuar em mais
de uma camada, apresentamos a Tabela 1 com um resumo
dos componentes, as camadas para a qual ele foi criado e as
camadas que ele também apoia.
TABELA 1: COMPONENTES DO MODELO SLMEETINGROOM.
COMPONENTE
CRIADO
PARA APOIAR
TAMBÉM APOIA
Whiteboard Cooperação Comunicação
Agenda de reunião Coordenação Comunicação
Cronograma Coordenação Percepção
Repositório Cooperação Comunicação
M. Argumentação Cooperação Comunicação
Social Proxy Percepção Comunicação/Coordenação
Urna de votação Cooperação Comunicação/Coordenação
Painel de gestos Comunicação Percepção
Lista de presença Coordenação Percepção
Cronômetro Coordenação Percepção
IV. ESTUDO EXPERIMENTAL COMPARATIVO
A. Estudo Piloto
1) Visão geral: O estudo piloto caracterizou-se por um
conjunto de reuniões de trabalho continuadas, com grupos
atuando em quatro condições de trabalho (Face-a-Face,
Videoconferência, SL sem o SLMeetingRoom e SL com o
SLMeetingRoom), a fim de avaliar se o modelo proposto
atende à hipótese que orienta essa pesquisa.
2) Participantes: Doze alunos do curso de Mestrado em
Computação da UFF, matriculados na disciplina de
Interface e Multimídia. A participação foi uma das
exigências para o término da disciplina, conforme revisto e
aprovado pela professora responsável. Os alunos já se
conheciam, mas nunca tinham executado trabalhados juntos.
Os participantes não receberam qualquer remuneração, mas
a nota atuou como um incentivo a participação.
3) Tarefa: Projeto em grupo de uma interface web para
uma Ótica, assim como, todas as etapas para o
desenvolvimento do protótipo do sistema web da Ótica.
4) Duração: Os grupos foram acompanhados em um
período de quinze dias. Cada grupo realizou quatro
reuniões, com duração máxima de uma hora. Apenas um
dos grupos ultrapassou dois minutos do tempo estipulado.
Cada grupo participou de quatro reuniões (totalizando
dezesseis) e utilizou um dos quatro cenários propostos.
5) Configuração dos Grupos e Espaços de Trabalho:
Quatro grupos foram formados com três participantes em
cada grupo, de forma aleatória (por meio de sorteio). Na
condição Face-a-Face`, o grupo atuou em uma sala de
reuniões disponibilizada no Laboratório ADDLabs
(Laboratório de Documentação Ativa e Design Inteligente)
da UFF. Na condição VideoconIerência` os participantes
utilizaram um cliente de videoconferência, chamado ooVoo
(http://www.oovoo.com). Na condição SL sem o
SLMeetingRoom`, Ioi construida uma sala de reuniões no
SL (na Ilha ADDLabs), onde o grupo atuou sem qualquer
componente para apoiar a realização das reuniões. Na
condição SL com o SLMeetingRoom`, também Ioi
construída uma sala de reuniões no Second Life, na Ilha
ADDLabs, onde o grupo atuou utilizando o modelo
SLMeetingRoom para apoiar o processo de realização das
reuniões. Todas as conversas foram videogravadas,
audiogravadas e, os logs de chat, registrados.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 56 -
6) Processo: Antes de iniciar as reuniões do estudo
piloto, os participantes Ioram submetidos ao Questionario
de PerIil do Participante`, baseado em [13]. Também foi
solicitado o preenchimento e assinatura do Termo de
Consentimento Livre e Esclarecido` (TCLE), adaptado de
[14], que visa à obtenção do consentimento para
participação dos experimentos. Em seguida, os participantes
Ioram submetidos ao Termo de Autorização de Uso de
Imagem e Depoimentos`, adaptado de [15], que visa à
autorização para o uso das imagens e depoimentos
capturados durante os experimentos. Ao final de cada
reunião, os participantes Ioram submetidos ao Questionario
de pós-reunião`, baseados na escala Likert de 5 pontos (0-
discordo totalmente a 4-concordo totalmente), onde foram
aferidos sobre suas impressões durante a utilização do
cenário para a realização das reuniões. Todas as reuniões
contaram com a presença de um observador para as
filmagens, os registros de tempo, e as anotações, etc. O
observador, no entanto, não teve qualquer comunicação com
os participantes do grupo.
7) Dados Coletados: As variáveis coletadas, em cada
critério de avaliação, foram:
x Completude das tarefas: medida objetiva: NTA
r

(número de tarefas da agenda de uma reunião), NTR
r

(número de tarefas da agenda realizadas durante uma
reunião r) e T
r
(tempo gasto para realizar a reunião); e
medida subjetiva: questionário de pós-reunião
baseados em [16].
x Participação: medida objetiva: NTC
i
(número total de
turnos de conversa de um participante i durante a
reunião r) e DTC
i
(duração total dos turnos de
conversa de um participante i); e medida subjetiva:
questionário de pós-reunião baseado em [16] e [17].
x Esforço cognitivo: medida subjetiva: questionário de
pós-reunião baseado no NASA-TLX MANUAL [18].
A aplicação da ferramenta NASA-TLX é baseada em
seis subescalas, a partir da análise da demanda mental
e física exigida dos indivíduos, da exigência temporal
feita pela tarefa, bem como pelo desempenho, esforço
exercido e nível de frustração atingido.
x Senso de presença: medida objetiva: quantidade de
pronomes eu, nós, você e ele/ela, quantidade de
verbos na 1ª pessoa do plural, quantidade de dêixis
3

locais e remotas; e medida subjetiva: questionário
pós-reunião baseado em [19], SUS Slater-Usoh-
Steed [20] e PQ Presence Questionnaire [21].
B. Experimento
Os resultados do teste de hipóteses do estudo-piloto
indicaram que o grupo utilizando o modelo
SLMeetingRoom, apresentou menor esforço cognitivo e
maior senso de presença para realizar as reuniões. Estes
resultados nos estimularam a entender melhor quais os
ganhos com a utilização de um ambiente preparado para
suporte a reuniões, ou seja, quais os benefícios do modelo
proposto.

3
Propriedade que tem alguns elementos linguísticos, tais como pronomes
pessoais e demonstrativos (esse, ali, aqui, lá, aquele, etc.) [45].
Desta forma, preparamos um experimento comparando
apenas duas condições de trabalho (com o SLMeetingRoom
e sem o SLMeetingRoom). Trabalhamos com mais pessoas
em cada grupo, realizando mais reuniões, e, também, outra
tarefa. Os participantes eram os mesmos do estudo piloto, o
que nos garante que todos estavam aquecidos, amadurecidos
e engajados em todas as atividades. Quanto à validade
interna do experimento, ressaltamos que o amadurecimento
do grupo não piora seu desempenho, pois, de certa forma,
não é a variável que estamos avaliando.
O experimento tem como objetivo avaliar como o
preparo do ambiente para reuniões pode trazer benefícios
para o Second Life. A grande questão é verificar se vale à
pena investir, preparando um ambiente de reunião no Second
Life, e se esse ambiente sempre levará os usuários mais
próximos às interações face-a-face. Nossa expectativa com a
criação desse ambiente elaborado (SLMeetingRoom) é que
as pessoas consigam atingir melhor seus objetivos.
1) Visão geral: O experimento caracterizou-se por um
conjunto de reuniões de trabalho continuadas, com grupos
atuando em reuniões, utilizando duas condições de trabalho
(SL sem o SLMeetingRoom e SL com o SLMeetingRoom),
a fim de avaliar o modelo proposto em atender a hipótese
que orienta essa pesquisa.
2) Participantes: Os participantes foram os mesmo do
estudo piloto (um total de onze) e foram designados para os
grupos através de sorteio. Novamente, os participantes não
receberam qualquer remuneração, mas a nota atuou como
um incentivo a participação.
3) Tarefa: A tarefa foi a realização do projeto final da
disciplina, onde cada grupo escolheu o tema para o trabalho.
4) Duração: Os grupos foram acompanhados em um
período de 30 dias. Cada grupo realizou cinco reuniões, com
duração máxima de uma hora. Apenas um dos grupos
ultrapassou dois minutos do tempo estipulado. A quantidade
de reuniões foi de cinco reuniões para cada grupo,
totalizando quinze reuniões.
5) Configuração dos Grupos e Espaços de Trabalho:
Três grupos foram formados através de sorteio (um grupo
com quatro participantes e dois grupos com três
participantes). Assim como no estudo-piloto, o grupo que
utilizou o SLMeetingRoom atuou sem qualquer componente
de apoio ao processo de realização das reuniões, e o grupo
que utilizou o SLMeetingRoom atuou com o apoio dos dez
componentes do modelo.
6) Processo: Como os participantes foram os mesmos
do estudo piloto, não foi necessário submetê-los,
novamente, aos questionários aplicados. Os participantes
foram aferidos somente pelo questionário de pós-reunião.
7) Dados Coletados: As variáveis coletadas para cada
critério de avaliação foram as mesmas do estudo-piloto.
V. ANÁLISE E DISCUSSÃO
A. Estudo Piloto
1) Completude das tarefa
Por meio das medidas objetivas, foi possível observar um
alto grau de completude das tarefas em todos os grupos.
Acreditamos que o alto grau de completude das tarefas
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 57 -
ocorre pelas vantagens na utilização de agendas de reunião,
que, segundo Niederman e Volkema [22], altera a qualidade
dos resultados, a satisfação e, principalmente, o desperdício
de tempo. Verificamos, também, que os questionários
traduzem as mesmas porcentagens das medidas objetivas, ou
seja, o sentimento dos participantes em relação à completude
das tarefas é expresso no questionário exatamente como
ocorre nas reuniões. Apenas o grupo SL com o
SLMeetingRoom` ultrapassou o tempo estipulado de reunião
de uma hora, comprometendo a realização de uma das
tarefas da agenda de reunião.
2) Participação
O turno de conversa compreende o momento em que o
participante começa a falar até o momento que ele termina
sua fala [41]. Assim, definimos o turno de conversa como o
tempo durante o qual um participante fala,
independentemente das interrupções mal sucedidas ou
sobreposições de fala de outro participante, similar ao
esquema usado por Sellen [42]. Um turno termina quando o
participante para de falar, seja por uma interrupção causada
por um participante, seja por causa de um período
significativo de silêncio/pausa.
O grau de participação foi calculado pela razão entre o
tempo total de fala do participante (DTC
i
) e o total de turnos
de conversa do participante (NTC
i
). Através deste cálculo, e
assumindo a distribuição gaussiana para o seu resultado, foi
possível identificar os participantes que estão nas
extremidades da curva gaussiana, ou seja, quem fala em
poucos turnos estará muitos desvios-padrão acima da média
e quem fala em muitos turnos estará muitos desvios-padrão
abaixo da média. A curva gaussiana foi utilizada como
padrão de comparação (baseline).
O grupo na condição Face-a-Face` Ioi o grupo com a
menor média de participação, pelo fato de ser o grupo que
utilizou mais turnos de conversa (total de 1222 turnos),
fazendo com que a média por turnos caísse muito. Porém,
isto já era esperado, tendo em vista, que as mídias
áudio/visuais são mais dinâmicas, são transmitidas mais
rapidamente e em muitos turnos [40].
O grupo na condição SL com o SLMeetingRoom` é o
grupo com reuniões mais distante da curva do grupo Face-a-
Face`, ou seja, apresentou grau de participação na
extremidade da curva do grupo na condição Face-a-Face`
(acima de dois desvios). Acreditamos que isso ocorreu pelo
fato do grupo ter escolhido o canal de comunicação via texto,
ou seja, os turnos de conversa são maiores devido ao tempo
despendido na leitura, formulação e digitação do conteúdo.
Os grupos VideoconIerência` e SL sem o
SLMeetingRoom` atuaram mais proximos a média da curva
do grupo na condição Face-a-Face`, em todas as reuniões.
A partir dos questionários de pós-reunião, foi possível
verificar os reais sentimentos dos participantes em relação à
sua participação durante as reuniões. O grupo SL sem o
SLMeetingRoom` Ioi o que se sentiu mais participativo,
seguido pelos grupos Face-a-Face`, SL sem o
SLMeetingRoom`, e, Iinalmente, pelo grupo
VideoconIerência`.
3) Esforço Cognitivo
Verificamos que o grupo Face-a-Face` Ioi o grupo que
realizou as reuniões com menor esforço cognitivo. Isso
devido à facilidade e naturalidade das interações presenciais
[44]. Para este critério de avaliação, esperávamos que a
condição de áudio e vídeo, proporcionada pela
VideoconIerência`, Iizesse com que os dados se
aproximassem do grupo Face-a-Face`. Porém, o que
podemos verificar é que os dados do grupo
VideoconIerência` apresentam-se, estatisticamente,
diIerentes dos dados do grupo Face-a-Face`, ou seja, os
participantes do grupo VideoconIerência` relataram que
tiveram dificuldades em realizar as reuniões.
A transcrição das conversas do grupo VideoconIerência`
mostrou que os participantes tiveram muitos problemas com
o alto consumo de banda de Internet, pois a conexão não era
um-para-um, mas sim muitos-para-muitos. Acreditamos que
esses problemas de conexão e banda de Internet foram os
fatores que aumentaram o esforço cognitivo para a realização
das reuniões.
4) Senso de Presença
As medidas objetivas de senso de presença estão
baseadas em [19], que propôs um método de medição do
senso de presença com base nas características linguísticas
do diálogo, ou seja, se a pessoa fala de um espaço remoto da
mesma maneira que ela fala sobre o espaço local, podemos
inferir que ela se sente presente no espaço remoto. O autor
em [19] realizou a análise com pares (ajudante e trabalhador)
utilizando diferentes meios de comunicação. Para esta
pesquisa, a análise lingüística será aplicada para grupos
atuando em reuniões em diferentes meios de comunicação, e,
posteriormente, será realizada a comparação com os
resultados de [19].
Na tentativa de encontrar fatores que expliquem a
variância dos resultados, as perguntas relacionadas ao senso
de presença do questionário de pós-reunião foram
submetidas a uma Análise Fatorial com Rotação Varimax. A
solução revelou três fatores que explicam 76% da variância
dos dados. O Fator 1, denominado Objetos`, o qual indica
como os participantes se referiam aos objetos no espaço de
trabalho, conseguiu explicar 31% da variabilidade dos dados;
o Fator 2, denominado Ambiente`, o qual informou sobre
como os participantes se referiam ao espaço de trabalho,
conseguiu explicar 25% da variabilidade dos dados; e o Fator
3, denominado Grupo`, o qual informou como o participante
se sente em relação aos parceiros de trabalho, conseguiu
explicar 20% da variabilidade dos dados. Assim, o que os
participantes falam dos objetos, do ambiente e dos outros
participantes explica a diferença entre as respostas para cada
fator. A análise fatorial varimax testa uma hipótese para
verificar se os três fatores são suficientes para entender a
variação dos dados. O p-valor encontrado é de 0,018, desta
forma, o modelo é significativo (p < 0,05).
Para investigar a viabilidade da utilização de variáveis
linguísticas como um preditor da presença realizamos uma
regressão para prever presença com base das variáveis
linguísticas. A regressão para o Fator 1 (objetos) explica
16% dos escores de presença (R2 = 0,1677; F[7,40] = 1,151;
p-valor = 0,352). A regressão para o Fator 2 (ambiente)
apresentou-se como um modelo significativo, representando
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 58 -
27% da variância nos escores de presença (R2 = 0,2751;
F[7,40] = 2,169; p-valor = 0,058). E finalmente, para o Fator
3 (grupo) explica 9% dos escores de presença (R2 = 0,0976;
F[7,40] = 0,618; p-valor = 0,737).
Ao final, mensuramos a correlação entre as variáveis
linguísticas e os escores de presença para cada fator
encontrado. Os escores de presença foram positivamente
correlacionados com o uso de pronomes nos` e
negativamente correlacionados com o uso do pronome
você` e eu`. Isto é consistente com a teoria de que uma
maior presença faz com que os participantes remotos sintam-
se como se estivessem juntos em um mesmo ambiente [19].
Os escores de presença também foram altamente
correlacionados com o uso da dêixis locais e remotas,
sugerindo que quando os participantes se sentem presentes
em um ambiente remoto, eles falam sobre isso da mesma
maneira que eles falam sobre o ambiente físico.
A correlação realizada entre as variáveis linguísticas e os
escores de presença mostrou que os fatores se
complementam; o que não foi detectado por um fator foi
identificado por outro. Apesar das correlações encontradas
não serem significativas, ressaltamos novamente que Kramer
[19] em sua análise possuía uma amostra de N=148.
B. Experimento
1) Completude das Tarefas
Assim como no estudo piloto, foi possível observar um
alto grau de completude das tarefas em todos os grupos.
Todos os grupos conseguiram realizar a tarefa proposta. Fato
este que confirma os achados de Niederman e Volkema [22],
que afirmam que a utilização de agendas de reunião altera a
qualidade dos resultados, a satisfação, e principalmente, o
desperdicio de tempo. Apenas o grupo SL sem o
SLMeetingRoom` ultrapassou o tempo estipulado de reunião
de uma hora, comprometendo a realização das tarefas da
agenda em duas reuniões.
2) Grau de Participação
O grau de participação foi calculado da mesma forma
como no estudo piloto, ou seja, pela razão entre o tempo de
fala de cada participante (DTC
i
) e o número de turnos de
conversa (NTC
i
). As curvas gaussianas teóricas baseadas na
média e desvio-padrão de cada reunião foram construídas e
utilizadas como ferramentas para o entendimento das
diferenças entre as reuniões e grupos.
O grupo com maior grau de participação foi o grupo 3 na
condição SL com o SLMeetingRoom`, porém Ioi o grupo
com maior desvio padrão. Seguido pelo grupo 2, na condição
SL sem o SLMeetingRoom`, com o menor desvio padrão e,
finalmente, pelo grupo 1 na condição SL com o
SLMeetingRoom`.
Através das medidas subjetivas, aferidas pelo
questionário de pós-reunião, foi possível verificar os
sentimentos dos participantes em relação a sua participação
durante as reuniões. Verificamos que os dois grupos na
condição SL com o SLMeetingRoom` Ioram os que se
sentiram mais participativos e o grupo SL sem o
SLMeetingRoom` Ioi o que se sentiu menos participativo.
A métrica de grau de participação, baseada na
participação média, pode não ser boa, pois, de certa forma,
pode esconder participações valiosas, não conseguindo
refletir, por exemplo, quando um participante fala pouco (em
momentos específicos da reunião), mas tem uma
participação decisiva durante o processo de discussão.
3) Esforço Cognitivo
Verificamos, através dos questionários, os grupos que
utilizaram o modelo SLMeetingRoom apresentam menor
esforço cognitivo para realizar as reuniões. Isso reforça nossa
hipótese de pesquisa de que os grupos que utilizassem o
Second Life aliado ao modelo SLMeetingRoom
apresentariam menor esforço cognitivo para realizar as
reuniões.
4) Senso de Presença
Como no estudo piloto, as perguntas relacionadas ao
senso de presença do questionário de pós-reunião também
foram submetidas a uma análise fatorial com rotação
varimax. Foi encontrado apenas um fator que explica 45% da
variabilidade dos dados. Após utilizar a análise fatorial com
rotação varimax, testamos a hipótese de que apenas um fator
é suficiente para explicar a variação dos dados. O p-valor
encontrado é de 2,63e-06, desta forma, o modelo é
significativo (p < 0,05).
Assim como no estudo piloto, com o intuito de investigar
a viabilidade da utilização de variáveis linguísticas como um
preditor da presença, realizamos uma regressão para prever
presença com base das variáveis linguísticas. O modelo de
regressão para o fator foi significativo (p-valor < 0,05),
explicando 30% da variabilidade dos escores de presença
(R2 = 0,307; F[7,47] = 2,986; p-valor = 0,011).
Ao compararmos nossos resultados aos resultados do
estudo piloto e aos resultados obtidos por Kramer [19],
verificamos que nossos resultados são promissores.
Conseguimos explicar 30% da variabilidade dos escores de
presença com um N=55, ou seja, aumentamos o tamanho da
nossa amostra e obtivemos um resultado 3% maior. Em
resumo, nossos resultados se aproximaram dos resultados
obtidos por Kramer [19], que possuía uma amostra de N =
148 e conseguiu representar 33% da variância dos escores de
presença.
Finalmente, mensuramos a correlação entre as variáveis
linguísticas e os escores de presença para o fator encontrado.
Os escores de presença foram positivamente correlacionados,
com o uso de pronomes nos` e, negativamente
correlacionados, com o uso do pronome você` e eu`. Isto é,
consistente com a teoria de que uma maior presença faz com
que os participantes remotos sintam como se estivessem
juntos em um único ambiente [19]. Os escores de presença
também foram altamente correlacionados com o uso da
dêixis locais e remotas, sugerindo que, quando os
participantes se sentem presentes em um ambiente remoto,
eles falam sobre ele da mesma maneira que eles falam sobre
o seu ambiente físico.
As correlações não foram significativas em nenhum dos
experimentos, acreditamos isso pode ter ocorrido devido aos
vícios de linguagem, como por exemplo, momentos onde o
participante usa o pronome 'você¨ e na verdade deveria usar
o pronome 'nos¨.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 59 -
C. Teste de Hipóteses
O teste de hipóteses foi utilizado como mecanismo para
encontrar evidência estatística de diferenças entre os grupos.
Para comparação entre os grupos, foi utilizado o teste de
Jonckheere-Terpstra [11]. O teste é utilizado para problemas
com mais de duas amostras, a hipótese alternativa pode ser
expressa como: IJ
1
_ IJ
2
_ ... _ IJ
n,
ou IJ
1
_ IJ
2
_ ... _ IJ
n,
, com,
pelo menos, uma das desigualdades, onde IJ
i
denota o efeito
do i-ésimo tratamento (grupo experimental). Como critério
de decisão, foi adotado o nível de significância de 5%.
Após a aplicação do teste de Jonckheere-Terpstra
obtivemos um p-valor para cada critério de avaliação.
Posteriormente verificamos se a significância do resultado
obtido por p-valor está abaixo ou acima de 5%. Se o p-valor
estiver abaixo de 0,05 não há evidências a favor de H
1
, ou
seja, aceitamos H
0
. Caso contrário, rejeitamos H
0
.
Para o critério de completude das tarefas, os resultados
não apresentaram variação, não sendo necessário realizar o
teste de hipóteses para essa variável.
1) Estudo Piloto
Cada grupo realizou as reuniões do projeto considerando
uma das quatro condições de trabalho (SL com o
SLMeetingRoom`, SL sem o SLMeetingRoom`,
VideoconIerência` e Face-a-Face`). Para facilitar os
procedimentos de comparação, nos referimos aos grupos por
G1, G2, G3 e G4, respectivamente. Os resultados do Teste
de Hipóteses podem ser visto na Tabela 2.
TABELA 2: TESTE DE HIPÓTESES COM OS DADOS DO ESTUDO PILOTO.
ESTUDO PILOTO
Critério de
Avaliação
H1 JT: p-valor Decisão
Grau de
Participação
G2 _ G3 _ G1 _ G4, ou
G3 _ G2 _ G1 _ G4
0,870
Aceitamos
H0
Esforço
Cognitivo
G2 _ G3 _ G1 _ G4, ou
G3 _ G2 _ G1 _ G4
0,007
Rejeitamos
H0
Senso de
Presença
G2 _ G3 _ G1 _ G4, ou
G3 _ G2 _ G1 _ G4
Fator1 = 1,68E-06
Rejeitamos
H0
Fator2 = 0,012
Fator3 = 0,025
2) Experimento
Cada grupo realizou as reuniões do projeto considerando
uma das duas condições de trabalho (com e sem o
SLMeetingRoom). Para facilitar os procedimentos de
comparação, nos referimos aos grupos por G1 e G3 (SL
com o SLMeetingRoom), e G2 (SL sem o
SLMeetingRoom). Os resultados do Teste de Hipóteses
podem ser visto na Tabela 3.
TABELA 3: TESTE DE HIPÓTESES COM OS DADOS DO EXPERIMENTO.
EXPERIMENTO
Critério de
Avaliação
H1 JT: p-valor Decisão
Grau de
Participação
G2 _ G3 _ G1, ou
G2 _ G1 _ G3
0,794 Aceitamos H0
Esforço
Cognitivo
G2 _ G3 _ G1, ou
G2 _ G1 _ G3
0,017 Rejeitamos H0
Senso de
Presença
G2 _ G3 _ G1, ou
G2 _ G1 _ G3
0,015 Rejeitamos H0
VI. CONCLUSÃO
Este trabalho aborda o problema da utilização do Second
Life como ambiente para a realização de reuniões, tendo em
vista que o Second Life não foi criado com características de
EMS. A fim de resolver nosso problema de pesquisa,
propomos a criação de um modelo de ambiente para suporte
a atividades básicas de reuniões de trabalho, o modelo
SLMeetingRoom, que é composto por dez componentes
essenciais que apoiam atividades como comunicação,
coordenação, cooperação e percepção.
Levantamos a hipótese de que a utilização do
SLMeetingRoom para suporte a reuniões de trabalho
possibilita resultados mais próximos das interações face-a-
face. Dessa forma, realizamos um estudo experimental
comparativo (estudo piloto e experimento) e através da
análise dos dados coletados, concluímos que o modelo
SLMeetingRoom é promissor para os critérios de esforço
cognitivo e senso de presença.
Em resumo, esta pesquisa fornece bons indicativos para a
utilização do ambiente Second Life como uma ferramenta
EMS, que auxilia os grupos no estabelecimento de acordos e
metas, tornando as reuniões colaborativas mais eficientes.
O SL possui características peculiares dos ambientes
virtuais 3D, que oferecem vantagem em relação a outras
plataformas, como alta imersão, alto senso de presença no
grupo e ambiente, facilidade de contextualizar um ambiente
de reunião com os participantes sentados à mesa, facilidade
na comunicação síncrona (textual, oral e gestual), alta
percepção das atividades dos participantes de um grupo,
entre outras. Concluímos, então, que o SL é uma boa
ferramenta para a realização de reuniões remotas síncronas e
coexiste com a videoconferência, EMS, audioconferência e
compartilhamento de telas.
REFERÊNCIAS
[1] Olson, J., Olson, G., Storrøsten, M., and Carter, M. Groupwork close
up: a comparison of the group design process with and without a
simple group editor. ACM Trans. Inf. Syst. 11, 4 (Oct. 1993).
[2] De Lucia, A., Francese, R., Passero, I. and Tortora, G. SLMeeting:
supporting collaborative work in Second Life. In Proceedings of the
Working Conference on Advanced Visual interfaces (Napoli, Italy,
May 28 - 30, 2008). AVI '08. ACM, NY, 301-304.
[3] Nunamaker, J. Dennis, A., Valacich, J., Vogel, D. and George, J.
Eletronic Meeting System to Support Group Work. Comunications of
the ACM. Jul, 1991, 34(7), pp 40-61.
[4] Olivier, H. and Pinkwart, N. (2007). Computer Supported
Cooperative Work In The Second Life? Position paper presented at
the Track on Business in Second Life at the 3rd International Second
Life Community Convention. Chicago (IL).
[5] Harry, D. and Donath, J. 2008. Information spaces -- building
meeting rooms in virtual environments. In CHI '08 Extended
Abstracts on Human Factors in Computing Systems (Florence, Italy,
April 05 - 10, 2008). CHI '08. ACM, NY, 3741-3746.
[6] Second Life. Disponível em <www.secondlife.com>. Acessado em:
Julho de 2010.
[7] Santoro, F., Borges, M. e Santos, N. Um Framework para Estudo de
Ambientes de Suporte à Aprendizagem Cooperativa. Revista
Brasileira de Informática na Educação Número 4 1999.
[8] Rovere, A. e Zago, G. Uma Proposta do Uso do Second Life como
Ferramenta Educacional. Intercom Sociedade Brasileira de Estudos
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 60 -
Interdisciplinares da Comunicação XXX Congresso Brasileiro de
Ciências da Comunicação, Santos. 29/agosto a 2/setembro de 2007.
[9] Bessière, K., Ellis, J. B., and Kellogg, W. A. 2009. Acquiring a
professional "second life": problems and prospects for the use of
virtual worlds in business. In Proceedings of the 27th international
Conference Extended Abstracts on Human Factors in Computing
Systems (Boston, MA, USA, April 04 - 09, 2009). CHI EA '09.
ACM, New York, NY, 2883-2898.
[10] Marczyk, G., DeMatteo, D., & Festinger, D. (2005). Essentials of
research design and methodology. NY: John Wiley & Sons.
[11] Hollander, M. and Wolfe, D. A. (1973). Nonparametric Statistical
Methods. Wiley, New York.
[12] Ellis, C. A.; Gibbs, S. J.; Rein, G. L. Groupware: some issues and
experiences. Comunications of the ACM. 34(1). Vo1.34, No.1.
January, 1991.
[13] Dumas, J.S. and J.C. Redish (1999) A Practical Guide to Usability
Testing. Exeter, UK: Intellect Books .
[14] http://www.proac.uff.br/cep
[15] http://www.unigranrio.br/comite_etica
[16] Bastéa-Forte, M. and Yen, C. 2007. Encouraging contribution to
shared sketches in brainstorming meetings. In CHI '07 extended
abstracts on Human factors in computing systems (CHI '07). ACM,
NY, USA, 2267-2272.
[17] DiMicco, J., Pandolfo, A. and Bender, W. 2004. Influencing group
participation with a shared display. In Proceedings of the 2004 ACM
conference on Computer supported cooperative work (CSCW '04).
ACM, New York, NY, USA, 614-623.
[18] NASA-TLX MANUAL. NASA Ames Research, Califórnia, EUA,
1986.
[19] Kramer, A. D., Oh, L. M., and Fussell, S. R. 2006. Using linguistic
features to measure presence in computer-mediated communication.
In Proceedings of the SIGCHI Conference on Human Factors in
Computing Systems (Montréal, Québec, Canada, April 22 - 27,
2006). R. Grinter, T. Rodden, P. Aoki, E. Cutrell, R. Jeffries, and G.
Olson, Eds. CHI '06. ACM, New York, NY, 913-916.
[20] Usoh, M., Catena, E., Arman, S., & Slater, M. (2000). Using presence
questionnaires in reality. Presence: Teleoperators and Virtual
Environments, 9(5), 497-503.
[21] Witmer, B. G., & Singer, M. J. (1998). Measuring presence in virtual
environments: A presence questionnaire. Presence: Teleoperators and
Virtual Environments, 7(3), 225240.
[22] Niederman, F. and Volkema, R. 1996. Influence of agenda creation
and use on meeting activities and outcomes: report on initial results.
In Proceedings of the 1996 ACM SIGCPR/SIGMIS Conference on
Computer Personnel Research (Denver, Colorado, United States,
April 11 - 13, 1996). SIGCPR '96. ACM, New York, NY, 192-205.
[23] George, J., Valacich, J. and Nunamaker, J. 1990. The organizational
implementation of an electronic meeting system: an analysis of the
innovation process. In Proceedings of the SIGCHI conference on
Human factors in computing systems: Empowering people (CHI '90),
ACM, New York, NY, USA, 361-368.
[24] Beaudouin-Lafon, M. Computer Supported Co-operative Work.
England : John Wiley and Sons (1999).
[25] Olson, J. S., Covi, L., Rocco, E., Miller, W. J., and Allie, P. 1998. A
room of your own: what would it take to help remote groups work as
well as collocated groups? In CHI 98 Conference Summary on
Human Factors in Computing Systems (Los Angeles, California,
United States, April, 1998). CHI '98. ACM, New York, NY, 279-280.
[26] Dickey-Kurdziolek, M., Schaefer, M., Tatar, D., and Renga, I. P.
2010. Lessons from thoughtswap-ing: increasing participants'
coordinative agency in facilitated discussions. In Proceedings of the
2010 ACM Conference on Computer Supported Cooperative Work
(Savannah, Georgia, USA, February 06-10, 2010). CSCW '10. ACM,
New York, NY, 81-90.
[27] Bly, S., Harrison, S. and Irwin, S. Media spaces: bringing people
together in a video, audio, and computing 185 environment.
Communications of the ACM, 36(1), (1993), 28-46.
[28] Nguyen, D. T. and Canny, J. 2007. Multiview: improving trust in
group video conferencing through spatial faithfulness. In Proceedings
of the SIGCHI Conference on Human Factors in Computing Systems
(San Jose, California, USA, April 28 - May 03, 2007). CHI '07.
ACM, New York, NY, 1465-1474.
[29] Yamashita, N., Hirata, K., Aoyagi, S., Kuzuoka, H., and Harada, Y.
2008. Impact of seating positions on group video communication. In
Proceedings of the 2008 ACM Conference on Computer Supported
Cooperative Work (San Diego, CA, USA, November 08 - 12, 2008).
CSCW '08. ACM, NY, 177-186.
[30] Bietz, M. J. 2008. Effects of communication media on the
interpretation of critical feedback. In Proceedings of the 2008 ACM
Conference on Computer Supported Cooperative Work (San Diego,
CA, USA, November 08 - 12, 2008). CSCW '08. ACM, NY, 467-476.
[31] Cherubini, M., Nussli, M., and Dillenbourg, P. 2008. Dêixis and gaze
in collaborative work at a distance (over a shared map): a
computational model to detect misunderstandings. In Proceedings of
the 2008 Symposium on Eye Tracking Research & Applications
(Savannah, Georgia, March 26-28, 2008). ETRA '08. ACM, New
York, NY, 173-180.
[32] Townsend, A. M., DeMarie, S. M. & Hendrickson, A. R. 1996. Are
you ready for virtual teams? HR Magazine, 41 (9): 122-126; Pape, W.
R. 1997. Group insurance: Virtual teams can quickly gather the
knowledge of even far-flung staff. Inc. June 15: 29-30.
[33] Noll, A.M. (1976). Teleconferencing Communications Activities.
IEEE Communications Society, November, pp.8 14.
[34] Tyson, J. (1987). Video teleconferencing is cutting costa while
increasing the productivity of many companies. Communication8
New8 24(g).
[35] Pervan, G., Lewis, L. F., & Bajwa, D. S. (2004). Adoption and use of
electronic meeting systems in large Australian and New Zealand
organizations. Group Decision and Negotiation: on GDN 2002 Papers
(Guest Editors: Mohammed Quaddus and Des, 13(5), 403-414.
[36] Brown, B. and Bell, M. 2004. CSCW at play: 'there' as a collaborative
virtual environment. In Proceedings of the 2004 ACM Conference on
Computer Supported Cooperative Work (Chicago, Illinois, USA,
November 06 - 10, 2004). CSCW '04. ACM, New York, 350-359.
[37] Active World. Disponível em <www.activeworlds.com>. Acessado
em: Outubro de 2009.
[38] Second Life. Disponível em <www.secondlife.com>. Acessado em:
Julho de 2010.
[39] Rymaszewski, W., Au, W., Wallace, M., Winters, C., Ondrejka, C.,
Batstone-Cunningham, B. Second Life® O Guia Oficial. Tradução de
Abner Dmitruk. Rio de Janeiro. Editora Ediouro, 2007.
[40] Kirk, D., Rodden, T. and Fraser, D. 2007. Turn it this way: grounding
collaborative action with remote gestures. In Proceedings of the
SIGCHI conference on Human factors in computing systems (CHI
'07). ACM, New York, NY, USA, 1039-1048.
[41] T. Kim, A. Chang, L. Holland, and A. Pentland. Meeting mediator:
enhancing group collaboration with sociometric feedback. In Proc.
ACM `08: ConIerence on CSCW, pages 457466, 2008.
[42] Sellen, A. J. (1995). Remote conversations: the effects of mediating
talk with technology. Human-Computer Interaction, 10. 401-444.
[43] Grudin, J. Computer-Supported Cooperative Work: History and
focus. IEEE Computer, 27(5) pp.19-26, 1994.
[44] Qiu, L., Tay, W. and Wu, J. 2009. The impact of virtual teamwork on
real-world collaboration. In Proceedings of the International
Conference on Advances in Computer Enterntainment Technology
(ACE '09). ACM, New York, NY, USA, 44-51.
[45] Aurélio Buarque de Holanda Ferreira, Dicionário Aurélio Eletrônico.
Século XXI, 1999.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 61 -
xAgent: Arquitetura para a Colaboração em Ambientes
Cross-Reality
Débora Cardador
PUC-Rio
Rua Marquês de São Vicente, 225, Gávea
Rio de Janeiro, RJ - Brasil
(5521) 35251500 ext 4553, 22451-900
dcosta@ inf.puc-rio.br
Hugo Fuks
PUC-Rio
Rua Marquês de São Vicente, 225, Gávea
Rio de Janeiro, RJ - Brasil
(5521) 35251500 ext 4304, 22451-900
hugo@ inf.puc-rio.br
Katia Vega
PUC-Rio
Rua Marquês de São Vicente, 225, Gávea
Rio de Janeiro, RJ - Brasil
(5521) 35251500 ext 4553, 22451-900
kvega@ inf.puc-rio.br
Carlos Lucena
PUC-Rio
Rua Marquês de São Vicente, 225, Gávea
Rio de Janeiro, RJ - Brasil
(5521) 2540-6915 ext 103, 22451-900
lucena@ inf.puc-rio.br

ABSTRACT
This paper introduces xAgent, an architecture for developing
collaborative cross-reality environments. xAgent was
developed based on multi-agent systems in which agents
enable the message exchange between virtual and real worlds.
xGroupware and Ubilife are cross-reality prototypes that
illustrates how the xAgent architecture was implemented.
RESUMO
Este artigo apresentada a arquitetura xAgent, cuja finalidade é
o desenvolvimento de ambientes cross-reality colaborativos.
xAgent se baseia em um sistema multiagentes no qual a
comunicação entre os agentes se restringe a ocorrência de
eventos no mundo real e virtual. São apresentados dois
protótipos de aplicações, xGroupware e Ubilife, que ilustram
a implementação da arquitetura proposta.
Palavras chave
Colaboracao, Cross-Reality, Sistema Multiagentes.

1. INTRODUCTION
Mundos virtuais são ambientes predominantemente sociais,
amplamente utilizados para interação entre seus usuários. Sua
natureza imersiva motiva a participação e o senso de
responsabilidade conjunto [1], e por propiciarem a troca de
informações e idéias e a solução de problemas em grupo, são
utilizados como espaços colaborativos em diferentes
contextos como educacional, trabalho em equipe, comercial e
jogos.
A combinação do mundo real e virtual enriquece ambos os
mundos, tendo em vista a capacidade que têm de se refletirem,
influenciarem e fundirem mutuamente [2]. Uma forma de se
obter esta combinação é a criação de ambientes cross-reality
[3], que usam redes de sensores e atuadores. Estes ambientes
possibilitam a comunicação bidirecional entre o mundo físico
e o virtual, criando um ambiente sensível a ambos os
contextos e capaz de reagir a eventos e atuar de forma pró-
ativa. O ambiente resultante é rico em possibilidades de
interação e, consequentemente, propício à colaboração, pois
aos recursos inerentes a cada mundo são agregados aqueles
resultantes de sua combinação, como a manipulação
simultânea de objetos reais e virtuais e a comunicação entre
indivíduos no ambiente físico com avatares do mundo virtual.
Este artigo apresenta a arquitetura xAgent, que visa à
implementação de aplicações que envolvam a colaboração em
ambientes cross-reality. No ambiente físico, interfaces
tangíveis e wearable computers, que contém sensores,
identificam eventos significativos e os propagam em tempo
real pelo sistema por meio de uma infraestrutura de
transmissão de mensagens que integra diferentes tecnologias.
Da mesma forma, eventos detectados por objetos do mundo
virtual são propagados para o mundo real. xAgent prevê a
integração com sistemas externos de modo a possibilitar o
acréscimo de recursos ao ambiente cross-reality, como, por
exemplo, serviços web e mecanismos de inteligência artificial.
Tendo em vista que se deseja criar um ambiente cross-reality
que possibilita a comunicação entre os mundos real e virtual e
é capaz de reagir a eventos e atuar de forma pró-ativa, optou-
se por uma arquitetura baseada em um Sistema Multiagentes
(SMA). Agentes são entidades de hardware ou software
caracterizadas pelos atributos de: (a) reatividade - percebe o
ambiente e responde às mudanças de maneira oportuna; (b)
autonomia - opera sem intervenção externa e tem controle
sobre suas ações e estado interno; (c) habilidade social -
interage com outros agentes via algum tipo de linguagem de
comunicação; e (d) pró-atividade - toma a iniciativa e exibe
comportamentos baseados em objetivos [4] Na arquitetura
proposta, cada um dos elementos do sistema é um agente com
objetivos e responsabilidades bem definidos, que se comunica
com outros agentes sobre os eventos ocorridos no sistema.
Na próxima seção, são comentados os trabalhos relacionados.
A Seção III descreve a arquitetura de xAgent. A
implementação de dois protótipos baseados em xAgent são
detalhados na Seção IV. Conclusão e trabalhos futuros são
apresentados na Seção V.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 62 -
2. TRABALHOS RELACIONADOS
Aplicações baseadas em agentes que integram os mundos real
e virtual são categorizadas de diversas formas. O conceito de
Mixed Reality Agents (MiRA) [4], introduzido por Holz, visa
a criação de uma taxonomia para projetos desenvolvidos neste
escopo e apresenta o estado da arte neste tipo de pesquisa.
Holz apresenta cerca de 25 projetos, classificados usando os
eixos agência (fraca vs forte), presença corporal (física vs
virtual) e capacidade de interação (física vs virtual). Por
exemplo, os projetos Virtual Anatomy Assistant e Virtual
Gunslinger, que tem objetivos diferentes (ensinar a
localização dos orgãos e storytelling, respectivamente) são
classificados como de representação virtualmente forte. Os
projetos também são desenvolvidos com estratégias de
implementação diferentes, como é o caso do Chameleons [6],
um dos pioneiros em desenvolver agentes que migram entre o
mundo virtual e real.
Com o objetivo de desenvolver diferentes aplicações com
agentes em projetos que misturam o real e o virtual, foram
desenvolvidas arquiteturas para a geração de ambientes
específicos. Tal é o caso de UbiAgent [7], um framework de
agentes Belief-Desire-Intentions (BDI) representados em
objetos reais e virtuais e operados por interfaces de realidade
aumentada. A Figura 1 mostra o Virtual Tour Guide, uma
aplicação desenvolvida com o framework UbiAgent, onde um
agente virtual serve como guia para visitas em um prédio. No
caso de UbiAgent, cada representação virtual é encapsulada
em só um agente. Outra proposta de framework com sistemas
multiagentes BDI é o NeXuS [8], que faz uso de agentes para
controlar todos os aspetos do ambiente.


Figura 1. Usuário utilizando o Virtual Tour Guide [7].

Arquiteturas para desenvolvimento de ambientes cross-reality
não foram desenvolvidas unicamente usando agentes.
Twinspace [9] é uma infraestrutura para a prototipação de
ambientes cross-reality de trabalho em grupo. Esta
infraestrutura utiliza uma ontologia, baseada em SOUPA [10],
para mapear as entidades reais e virtuais. Além desta
ontologia, Twinspace utiliza um Context/Mapping Engine
para a configuração do ambiente e das regras de mapeamento.
O inSpace para brainstorming e apresentações, e o jogo
colaborativo Or de l`Acadie foram protipados usando a
arquitetura Twinspace. DejaVu [11] é outra arquitetura para o
desenvolvimento de ambientes cross-reality. Esta arquitetura
emprega sistemas de processamento de eventos complexos,
estendendo as funcionalidades do sistema gerenciador da base
de dados relacional de modo a detectar eventos com alto grau
de valor semântico para a aplicação, como um incêndio no
prédio ou a entrada de um ladrão na biblioteca. SmartRFLib
(desenvolvida usando DejaVu) é uma aplicação de
gerenciamento de empréstimo de livros de uma biblioteca real
que possibilita a transmissão de dados para uma biblioteca
virtual usando um leitor RFID. A Figura 2 mostra a
arquitetura em três camadas de SmartRFLib.

3. XAGENT
xAgent é uma arquitetura que possibilita o desenvolvimento
de distintas aplicações em ambientes cross-reality, se
adequando a diferentes contextos que envolvem a colaboração
entre o mundo real e o virtual. Nesta arquitetura, a interação
dos objetos (agentes) não necessariamente representam um
reflexo de um objeto de um mundo frente à outro. Esta
interação é realizada diretamente com os usuários e objetos do
mundo em que se encontram e além disso, enviam e recebem
informações sobre os eventos que ocorrem com objetos do
outro mundo.
No mundo real, uma rede de sensores e atuadores detecta
eventos e reage por meio de objetos físicos, como interfaces
tangíveis, para representação e controle das informações
digitais, e dispositivos wearable, que possibilitam a
colaboração nos limites do espaço pessoal do usuário. No
mundo virtual por sua vez, objetos 3D (que também são
agentes) são modelados e seus comportamentos
implementados. Opcionalmente, sistemas externos são
acoplados, adicionando-se recursos e funcionalidades à
aplicação.
xAgent usa um SMA como modelagem computacional. Nesta
abordagem, uma arquitetura é modelada como uma coleção de
entidades, denominadas agentes. Dado que um dos atributos
fundamentais dos agentes é a habilidade social, a
comunicação e interação entre eles é realizada por meio da
troca de mensagens, foco principal da arquitetura proposta. A
Figura 3 apresenta um resumo da arquitetura xAgent em
termos de seus agentes.


Figura 2. SmartRFLib - Arquitetura baseada em DejaVu
para ambientes cross-reality [11].


VIII Simpósio Brasileiro de Sistemas Colaborativos
- 63 -
O suporte à interação que ocorre entre o mundo real e o virtual é
realizado entre o Mensageiro e os Comunicadores que, ao trocarem
mensagens entre si, difundem a ocorrência dos eventos no sistema.
O Mensageiro recebe mensagens de diferentes origens, registra os
eventos correspondentes na base de dados do sistema e redistribui
as mensagens aos agentes a que se destinam, de acordo com o tipo
de evento. Para isto, utiliza os Comunicadores, também agentes,
que atuam como pontes entre o Mensageiro e os agentes contidos
nos objetos do mundo real e virtual. A troca de mensagens pelos
agentes segue uma mesma estrutura de modo que eles possam
interpretar a mensagem independentemente da plataforma usada ou
do mundo em que se encontram.

4. AMBIENTES COLABORATIVOS
USANDO XAGENT
A seguir, são apresentadas dois ambientes colaborativos que
implementam a arquitura xAgent: xGroupware [12] que visa dar
suporte ao planejamento e realização de reuniões no contexto de
trabalho em grupo a distância, e Ubilife, que tem por finalidade
auxiliar no cuidado de idosos.
Nas aplicações apresentadas, o Mensageiro foi implementado no
framework Spring com a linguagem Java. , usando sockets para a
interação com os Comunicadores do Mundo Real, também
implementados em Java. Além da troca de mensagens com o
Mensageiro, os Comunicadores do Mundo Real se comunicam
com objetos do mundo real por meio de uma rede wireless que
utiliza módulos XBees [13] para enviar e receber mensagens. Os
objetos do mundo real foram implementados usando tecnologia
Arduino [14].
Os Comunicadores e demais objetos do Mundo Virtual foram
implementados na plataforma Second Life usando a linguagem de
programação Linden Script Language (LSL). A troca de
mensagens entre os objetos virtuais é realizada via os canais de
comunicação do LSL. A troca de mensagens com objetos externos
só é possível com o uso do protocolo HTTP, motivo pelo qual um
servidor web foi implementado no Mensageiro.
4.1. xGroupware
Ambientes colaborativos 3D são utilizados como ferramenta
meetingware para grupos de trabalho a distância, dentre outros
motivos, por promover uma forte sensação de presença e
engajamento de seus participantes [15]. Estes ambientes propiciam
a comunicação por meio de texto, voz, gestos e expressões faciais,
e também o uso de outros meios virtuais, como o correio
eletrônico. No entanto, não há comunicação com o mundo real
[16].
xGroupware é um ambiente cross-reality que possibilita a
comunicação entre os mundos real e virtual por meio da troca de
mensagens entre os agentes do sistema, que informam sobre a
ocorrência de eventos tais como entrada e saída de usuários,
convites, solicitação de confirmação de presença e cancelamento
de reunião. Esta comunicação ocorre por meio de um bracelete
utilizado pelo participante no mundo real, que contém sensores e
atuadores. No ambiente 3D são utilizados para comunicação
objetos virtuais como painéis e Head-up Displays (HUDs), como
ilustrado na Figura 4.

Figura 4. O Bracelete, o Painel de Reuniões e o HUD utilizados
para comunicação entre o mundo real e virtual.

Figura 3. xAgent: arquitetura geral.
Mundo Real Mundo Virtual
...
.
.
.
.
.
.
.
.
.
.
.
.
Mensageiro
Comunicador
Comunicador
Comunicador
Comunicador
Objeto Real
Objeto Real
.
.
.
Objeto Real
Objeto Real
Comunicador Comunicador
Objeto Virtual
Objeto Virtual
.
.
.
Objeto Virtual
Objeto Virtual
Sistema
Externo
Sistema
Externo
Base de Dados
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 64 -
As reuniões ocorrem na Sala de Reuniões virtual, no
ambiente compartilhado, e são agendadas e confirmadas pelo
Coordenador de Reuniões, um dos agentes do sistema, com base
nas disponibilidades das agendas individuais dos participantes. O
Coordenador de Reuniões solicita a confirmação de presença aos
participantes por meio do bracelete e do HUD e com base no
retorno dado pelos participantes, confirma ou cancela sua
realização. No caso de cancelamento, o Coordenador reagenda a
reunião e divulga a nova data e horário para todos os participantes.
O Coordenador de Reuniões é um agente implementado na
plataforma Jade. Nesta aplicação, o comunicador que atua entre o
Mensageiro e o Coordenador de Reuniões foi implementado
também em Jade, utilizando o padrão FIPA para comunicação em
SMAs [17]. A Figura5 apresenta os agentes envolvidos na
aplicação xGroupware, baseada na arquitetura xAgent.
4.2. Ubilife
Ambient Assisted Living (ALL) [18] utiliza tecnologias diversas
com o intuito de integrar ao dia-a-dia do usuário serviços que
propriciem a melhoria de sua qualidade de vida. Em particular,
ALLs auxiliam na manutenção da saúde e na segurança de
pacientes em recuperação, doentes crônicos e idosos, provendo
serviços como monitoramento continuado e detecção de situações
de emergência [19].
Ubilife é um ALL colaborativo que visa auxiliar parentes, amigos
ou profissionais da área médica responsáveis pela assitêcia a
idosos que vivem sozinhos em suas residências, por meio do
monitoramento constante do idoso e de serviços como lembretes e
alarmes. Com a utilização de sensores, o sistema possibilita a
coleta de dados sobre o usuário e o ambiente, e a obtenção de
informações sobre a correlação entre eles, como a localização do
usuário e os objetos com que interage. Além do uso de sensores e
atuadores, é possível incluir nas vestimentas, nos objetos e no
próprio espaço físico recursos de processamento e comunicação
que tornam o ambiente mais responsivo e capaz de prover serviços
de forma autônoma e pró-ativa.
O espaço físico monitorado é reproduzido no ambiente 3D,
contendo objetos virtuais que representam objetos do mundo real.
Para representar os indivíduos monitorados, são utilizados Non-
Player Characters (NPCs), que, diferentemente de um avatar
controlado por um usuário, apresentam comportamentos pré-
definidos em scripts (Figura 6). Desta forma, é criado um
'espelho¨ que simula eventos especiIicos que ocorrem ou
ocorreram no mundo real, como a movimentação do idoso pela
residência, sua interação com alguns objetos e atividades
específicas em que esteja envolvido. Este espaço virtual possibilita
o acompanhamento do idoso nas atividades de interesse de uma
forma não invasiva, preservando a privacidade do indivíduo
monitorado.

Figura 6. NPC representando o indivíduo monitorado no
ambiente 3D.

Figura 5. xGroupware em função de seus agentes.
Mundo Real
Mundo Virtual
Dispositivos
Wearable
Computador
Portátil
SecondLife
Mensageiro
Base de
Dados
Comunicador
FIPA
Coordenador de
5HXQL}HV
Comunicador da
6DODGH5HXQL}HV
Virtual
Sensor de
SUHVHQoD
HUD 1
HUD 2
HUD 3
Painel de
5HXQL}HV
Comunicador
Ultra
Bracelete 1
Bracelete 2
Bracelete 3
Servidor
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 65 -
Uma das funcionalidades do Ubilife é o monitoramento da auto-
administração de medicamentos em forma de comprimido pelo
idoso através do agente Porta Comprimidos, que monitora os
horários de medicação e informa ao usuário que comprimido deve
ser tomado num determinado momento através de mensagens pré-
gravadas e avisos luminosos. Por meio de sensores este agente
identifica se o usuário tomou o remédio no horário indicado.
Senão, novamente é utilizada uma mensagem pré-gravada para
orientá-lo sobre a administração do medicamento. Após alguns
minutos, caso o idoso não tenha ainda tomado o medicamento, é
propagada pelo sistema uma mensagem de alerta, que é recebida
na residência do responsável pelo acompanhamento do idoso. O
agente Sentinela, que emite avisos luminosos, indica ao
responsável que há uma situação que requer sua intervenção. O
responsável acessa o ambiente 3D de monitoramento para obter
mais informações sobre a situação do idoso por meio do Painel de
Monitoramento e observando o objeto virtual Porta Comprimidos,
que espelha o objeto real, para decidir que ação tomar. Na Figura7
observa-se como o evento de alerta, transmitido pelo agente Porta-
comprimidos no mundo real, é propagado pelo sistema.

5. CONCLUSÕES E TRABALHOS
FUTUROS
Neste artigo foi apresentada a arquitetura xAgent que propõe uma
base para desenvolvimento de ambientes colaborativas em cross-
reality. xGroupware e Ubilife são duas aplicações que ilustram a
sua implementação.
xAgent tem a capacidade de se adequar a diferentes contextos
envolvendo a interação entre os mundos real e virtual como são os
casos do meetingware xGroupware e o ALL Ubilife. xAgent
também possibilita a comunicação com sistemas externos por meio
da troca de mensagens entre os Comunicadores e o Mensageiro
como no caso do agente Coordenador de Reuniões do
xGroupware. Outra possibilidade que esta arquitetura oferece é a
integração de diversas tecnologias e plataformas de
desenvolvimento, como é observado nas aplicações citadas, que
usaram Arduino, LSL, Java e Jade nas implementações.
Como modelagem computacional, optou-se pelos sistemas
multiagentes, dado que os atributos de agentes (autonomia,
habilidade social, reactividade e proactividade) são também
atributos dos objetos físicos e virtuais. Principalmente pelo atributo
de habilidade social, que possibilita a interação entre os agentes e
por conseguinte, a colaboração entre os mundos.
Nos trabalhos futuros, pretende-se aprimorar a arquitetura para
suportar a noção forte de agentes utilizando-se BDI. Também se
deseja examinar a aplicação do Modelo 3C de Colaboração em
ambientes cross-reality baseadas na arquitetura xAgent. Além
disso, se sugere a implementação de um processo para o
desenvolvimento deste tipo de aplicações.

6. AGRADECIMENTOS
Katia Vega e Débora Cardador recebem bolsas de doutorado do
CNPq nº 140859/2010-1 e nº 141520/2010-8 respectivamente.
Hugo Fuks recebe bolsas de Produtividade de Pesquisa do CNPq
nº 302230/2008-4 e Cientista do Nosso Estado da FAPERJ. Carlos
Lucena recebe bolsas de Produtividade de Pesquisa do CNPq nº
304810/2009-6 e Cientista do Nosso Estado da FAPERJ.


Figura 7. Ubilife em função de seus agentes.
Mundo Real Mundo Virtual
Servidor
Dispositivos Computador
Portátil
Second Life
Mensageiro Comunicador
GDUHVLGrQFLD
do idoso
Comunicador do
UHVSRQViYHO
Localizador
Porta
Comprimidos
Controle do
ambiente
Sentinela
Comunicador
do ambiente
virtual
Painel de
monitoramento
Porta
Comprimidos
NPC
Controle do
ambiente
Base de Dados
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 66 -
7. REFERÊNCIAS

[1] A. Pereira, K. Vega., D. Filippo, V. David, A. Raposo, and H.
Fuks. 2009. Enacting Collaboration via Storytelling in
Second Life 15th Collaboration Researchers` International
Workshop on Groupware (CRIWG 2009), Lecture Notes on
Computer Science LNCS 5784, Springer-Verlag, September
2009, pp. 319-327, ISSN 0302-9743.
[2] J. Lifton and J.A. Paradiso. 2009. Dual Reality: Merging the
Real and Virtual. In Proceedings of the First International
ICST Conference on Facets of Virtual Environments (FaVE),
July 2009, p. 12-28.
[3] J. Paradiso and J. Landay. 2009 Cross-Reality Environments.
In IEEE Pervasive Computing, vol.8, n.3, July 2009, p. 14-15
doi:10.1109/MPRV.2009.47, ISSN 1536-1268.
[4] M. Wooldridge and N.R. Jennings. 1995. Intelligent Agents:
Theory and Practice. In Knowledge Engineering Review
vol.10, n.2, 1995, p. 115-152.
[5] T. Holz, A. Campbella, G. O`Harea, J. StaIIordb, A. Martinb,
and M. Dragonea. 2011. MiRA²Mixed Reality Agents. In
International Journal of Human-Computer Studies, vol.69,
n.4, April 2011, p.251-268.
[6] B.R. Duffy, B.R., G.M.P.O`Hare, A. Martin, J.F. Bradley, and
B. Schön. 2003.. Agent Chameleons: Agent Minds and
Bodies. 16th International Conference on Computer
Animation and Social Agents (CASA), Rutgers University,
New-Brunswick, New Jersey, USA, May 2003, p.7-9.
[7] I. Barakonyi and D. Schmalstieg. 2006.. Ubiquitous Animated
Agents for Augmented Reality. In Proceedings of the 5th IEEE
and ACM International Symposium on Mixed and
Augmented Reality (ISMAR), October 2006, p.145-154.
doi:10.1109/ISMAR.2006.297806.
[8] G.M.P. O`Hare, A.G. Campbell, and J.W. Stafford. 2005.
NeXuS: Delivering Behavioural Realism through Intentional
Agents. In Proceedings of the 2005 International Conference
on Active Media Technology (AMT), May 2005, p.481-486.
doi:10.1109/AMT.2005.1505402.
[9] D.F. Reilly, H. Rouzati, A. Wu, J.Y. Hwang, J. Brudvik, and
W.K. Edwards. 2010. TwinSpace: An Infrastructure for
Cross-Reality Team Spaces. In Proceedings of the 23rd ACM
Symposium on User Interface Software and Technology
(UIST), October 2010, pp. 119-128.
doi:10.1145/1866029.186605.
[10] H. Chen, T. Finin, and A. Joshi. 2004. The SOUPA Ontology
for Pervasive Computing. In Ontologies for agents: Theory
and experiences, Birkhauser Publishing Ltd., 2004 pp. 233--
258
[11] N. Dindar, C. Balkesen, K. Kromwijk, and N. Tatbul. 2009.
Event Processing Support for Cross-Reality Environments.
IEEE Pervasive Computing Magazine, vol.8, n.3, Special
Issue on Cross-Reality Environments, July 2009, p.34-41.
doi:10.1109/MPRV.2009.43.
[12] K. Vega, D. Cardador, H. Fuks, and C.J.P. Lucena. 2011.
xAgent: Colaboração em Ambientes Cross-Reality com
Agentes. SVR 2011, XIII Symposium on Virtual and
Augmented Reality, Uberlândia, Minas Gerais, Brazil, May
2011,. ISSN 2177-6768.
[13] R. Faludi. 2008. XBee Lilypad. [Online]. Available:
http://www.faludi.com/2008/06/15/xbee-lilypad.
[14] (2010) Arduino Website. [Online]. Available:
http://arduino.cc/en/.
[15] W. A. Kellogg, T. Erickson, N.S. Shami, and D. Levine.
2010. Telepresence in Virtual Conferences: An empirical
comparison of distance collaboration technologies. New
Frontiers in Telepresence Workshop. CSCW 2010, Savannah,
GA, USA, February 2010 .
[16] M. Billinghurst and H. Kato. 1999. Collaborative Mixed
Reality. First International Symposium on Mixed Reality
(ISMR `99), Springer-Verlag, 1999, pp. 261-284.
[17] (2010) FIPA website. [Online]. Available:
http://www.fipa.org.
[18] M. Wojciechowski, H. Ristok, W. Brandes, B. Lange, and G.
Baumgarten. 2011. $UFKLWHFWXUHRIWKHµ'DLO\FDUH-RXQDO¶IRU
the Support of Health Care Networks. In Ambient Assisted
Living, 1st ed., R. Wichert and B. Eberhardt (Eds.), Ed.
Berlin: Springer, 2011, pp.3-16.
[19] Doukas, C., Maglogiannis, I., Rouskas A., and Pneumatikakis.
2009. A. Emergency incidents detection in assisted living
environments utilizing sound and visual perceptual
components. In ACM Proceedings of the 2nd International
Conference on Pervasive Technologies Related to Assistive
Environments, Springer-Verlag, June 2009, p.1-7.

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 67 -
Ampliando o suporte à interoperabilidade em uma
arquitetura orientada a serviços de middleware para
sistemas colaborativos
Rita Suzana P. Maciel
Universidade Federal da Bahia
(UFBA)
Salvador, BA
ritasuzana@dcc.ufba.br
José Maria N. David
Universidade Federal de Juiz de Fora
(UFJF)
Juiz de Fora, MG
jose.david@ufjf.edu.br
Thiago R. de Almeida
Universidade Salvador
(UNIFACS)
Salvador, BA
thiago.almeida@unifacs.edu.br
ABSTRACT
Interoperability between collaborative systems is a complex
requirement to be considered separately from other non functional
requirements. WGWSOA (Web-based Groupware Service-
Oriented Architecture) was designed to support interoperable
collaborative systems development. The initial focus of the project
was to explore interoperability requirement and its relationship
with other non functional requirements, such as: reuse, portability,
loose coupling, stateless and composability. However, the
obtained results have indicated that other interoperability types
need to be investigated. This paper presents the results of
WGWSOA project in order to support both the construction and
execution of collaborative systems focusing in interoperability
issues. Moreover, it analyzes the forms that different types of
interoperability can be supported by WGWSOA.
Categories and Subject Descriptors
D.2.12 [Software Engineering]: Interoperability – data mapping.
General Terms
Design.
Keywords
Interoperability, Middleware Services, SOA, Collaborative
Systems.
RESUMO
A interoperabilidade entre sistemas colaborativos é um requisito
complexo para ser tratado isoladamente de outros requisitos não
funcionais. A WGWSOA (Web-based Groupware Service-
Oriented Architecture) foi projetada para apoiar o
desenvolvimento de sistemas colaborativos interoperáveis.
Inicialmente, buscou-se explorar a interoperabilidade e o
relacionamento deste requisito com outros, tais como:
reutilização, portabilidade, baixo acoplamento, ausência de estado
e capacidade para composição. Entretanto, os resultados obtidos
indicam que o suporte para outros tipos de interoperabilidade
precisam ser investigados. Este artigo apresenta os resultados
obtidos no projeto WGWSOA para o suporte à construção e
execução de sistemas colaborativos, principalmente no que diz
respeito à interoperabilidade. Além disso, analisa as formas pelas
quais os diferentes tipos de interoperabilidade podem ser tratados
pela WGWSOA.
Palavras-Chave
Interoperabilidade, Serviços de Middleware, SOA, Sistemas
Colaborativos.
1. INTRODUÇÃO
A interoperabilidade pode ser definida como a capacidade de
aplicações heterogêneas compartilharem procedimentos e dados
mesmo estando em equipamentos e plataformas distintas [1]. Está
relacionada à capacidade dos sistemas se comunicarem de tal
forma que diferentes partes possam colaborar independentemente
das tecnologias utilizadas (metodologias, linguagens e ambientes
de programação) [2].
Ela é um requisito fundamental para a implementação de
mecanismos que apoiem de forma eficiente e eficaz a realização
das tarefas colaborativas em ambientes heterogêneos. A ausência
de um suporte adequado à interoperabilidade é um problema para
os desenvolvedores e usuários de sistemas colaborativos devido à
imposição da utilização de um único ambiente ou tratamento não
automatizado quando ferramentas distintas são adotadas. Ao
considerarmos um único ambiente, aspectos relacionados à
interoperabilidade frequentemente são implicitamente tratados na
própria aplicação, gerando sistemas fortemente acoplados.
O suporte à interoperabilidade tem sido objeto de estudo em
diferentes contextos. Inicialmente, para prover interoperabilidade
entre aplicações distintas, mecanismos que utilizavam estratégias
de mapeamentos específicos foram desenvolvidos para
plataformas distintas [3]. Como resultado, aplicações
desenvolvidas entre duas plataformas distintas se tornavam
interoperavéis adotando estas estratégias. Posteriormente,
principalmente impulsionadas pelo advento das aplicações Web,
soluções baseadas em padrões públicos e abertos foram propostos,
por exemplo: SOAP (Simple Object Access Protocol), WSDL
(Web Service Definition Language), XMI (XML Metadata
Interchange), e outros. Porém para se alcançar níveis mais amplos
de interoperabilidade entre aplicações diferentes faz-se necessário
ir além da utilização de padrões.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 68 -
Neste contexto, uma arquitetura orientada a serviços de
middleware, denominada WGWSOA (Web-based Groupware
Service-Oriented Architecture) [4], foi projetada para apoiar o
desenvolvimento e a execução de sistemas colaborativos. Dentre
os serviços dessa arquitetura incluem os serviços de coordenação,
cooperação, comunicação, percepção. Além disso, ela foi
idealizada tendo como foco o suporte à interoperabilidade e, para
tanto, foi projetada de acordo com os conceitos e princípios da
orientação a serviços.
Em um primeiro estágio do projeto da WGWSOA buscou-se tratar
a interoperabilidade em relação aos aspectos técnicos.
Interoperabilidade sintática (ou técnica) está associada ao suporte
para que mensagens possam ser trocadas entre diferentes partes
que colaboram para a realização de uma tarefa. Posteriormente,
foram iniciadas atividades no contexto da WGWSOA para apoiar
a interoperabilidade semântica. Estas atividades fazem parte de
um projeto que busca investigar as diferentes formas propostas na
literatura para acrescentar significado às mensagens, para que elas
possam ser compreendidas entre os sistemas que colaboram [5].
Os resultados preliminares obtidos apontam que outros tipos de
interoperabilidade precisam ser tratados no desenvolvimento e na
execução de sistemas colaborativos com o suporte de uma
infraestrutura de middleware, por exemplo, a interoperabilidade
pragmática.
A interoperabilidade pragmática amplia aspectos não cobertos
pela sintática e semântica. Ela está relacionada à capacidade dos
sistemas, que colaboram, de capturarem os desejos por ações entre
aqueles que solicitam e enviam os resultados [6]. Quando este
suporte não é oferecido o efeito real de uma mensagem enviada
difere daquele que foi pretendido pela aplicação.
O objetivo deste artigo é apresentar os resultados obtidos em
relação ao suporte aos diferentes tipos de interoperabilidade em
uma arquitetura orientada a serviços de middleware para apoiar o
desenvolvimento e a execução de sistemas colaborativos
distribuídos. Adicionalmente, são apresentados os próximos
passos do projeto no intuito de oferecer uma cobertura mais ampla
ao requisito não funcional interoperabilidade e, consequentemente
potencializar o desenvolvimento de sistemas colaborativos.
Este artigo está organizado da seguinte forma. A Seção 2
apresenta alguns trabalhos que procuram apoiar a
interoperabilidade no desenvolvimento de sistemas. A Seção 3
apresenta a infraestrutura de middleware (WGWSOA) projetada
para apoiar a interoperabilidade de sistemas colaborativos. A
Seção 4 apresenta os diferentes tipos de interoperabilidade no
contexto desta infraestrutura. A Seção 5 apresenta as soluções
para a interoperabilidade implementadas na WGWSOA, bem
como os resultados obtidos. Finalizando o texto, a Seção 6
apresenta as direções futuras para esta pesquisa no sentido de
oferecer suporte para a interoperabilidade de sistemas
colaborativos.
2. TRABALHOS RELACIONADOS
A interoperabilidade entre sistemas colaborativos é um tópico
bastante investigado na literatura. Inicialmente, para permitir
algum nível de interoperabilidade com outras ferramentas, alguns
sistemas colaborativos disponibilizaram mecanismos diversos.
Estes mecanismos permitem tanto o compartilhamento de um
espaço de trabalho e informações gerenciais do projeto, como
também procedimentos para edição, revisão, formatação e
conversão entre formatos distintos de documentos. A maioria das
propostas são frameworks, por exemplo, Dyce [7], Disciple [8],
Evolve [9]. De uma forma geral, um sistema instanciado a partir
de um framework, não é prontamente interoperável com outro
sistema instanciado a partir de um framework distinto (por
exemplo: Dyce-Evolve, Evolve-Disciple).
Dewan e Sharma [10] investigaram o problema da
interoperabilidade entre sistemas colaborativos nas dimensões da
arquitetura (políticas de controle de concorrência, replicação de
objetos, etc.). Para prover a interoperabilidade neste contexto,
uma ponte realiza a conversão entre os protocolos distintos
utilizados nas arquiteturas. Na maioria dos casos, será necessário
conhecer os protocolos empregados pelas aplicações para
convertê-los em um protocolo abstrato utilizado pela camada que
proverá interoperabilidade [11].
Mangan, Borges e Werner [12] propõem a utilização de um
middleware para tratar a percepção entre ferramentas de
desenvolvimento de software. Especificamente, a solução
proposta envolve o tratamento de eventos gerados por essas
ferramentas. Para tal, é necessário implementar uma extensão para
diferentes ferramentas CASE tanto para monitorar os eventos
quanto para visualizá-los. Isso significa possuir um conhecimento
mais específico sobre detalhes de implementação. O suporte à
interoperabilidade pode ser realizado através de funções de um
middleware e do conhecimento das estruturas implementadas nas
aplicações.
Para apoiar o desenvolvimento de sistemas colaborativos Fonseca
e Carrapatoso [13] propõem uma arquitetura, denominada SAGA,
baseada na utilização de web services. Como resultado, aplicações
desenvolvidas a partir da solução proposta se beneficiam das
vantagens oferecidas pela tecnologia de web services para apoiar a
interoperabilidade entre sistemas colaborativos. A utilização
apenas de padrões como WSDL e UDDI, limita o suporte para a
interoperabilidade. Com o objetivo de tratar os limites impostos
pela tecnologia de web services, o projeto METEOR-S [14]
propõe a utilização de um framework para acrescentar mais
semântica às descrições WSDL. Através desse framework
anotações são associadas de forma semiautomáticas às descrições
dos serviços com ontologias. Apesar de ampliar a
interoperabilidade entre serviços, percebe-se a necessidade de um
esforço adicional para apoiar a interoperabilidade entre sistemas
desenvolvidos em plataformas distintas e tecnologias
heterogêneas.
3. WGWSOA – UMA INFRAESTRUTURA
DE SERVIÇOS DE MIDDLEWARE
WGWSOA é uma infraestrutura baseada em serviços de
middleware cujo principal objetivo é apoiar o desenvolvimento e
a execução de sistemas colaborativos. Para tanto, um dos
objetivos específicos da infraestrutura é apoiar a
interoperabilidade entre aplicações distribuídas construídas em
uma mesma plataforma de middleware ou com o apoio de
plataformas distintas. Além disso, através de uma arquitetura
orientada a serviços esta infraestrutura busca tratar alguns
requisitos frequentemente necessários para as aplicações no
domínio de sistemas colaborativos. São eles: flexibilidade para
que os serviços evoluam de acordo com a dinâmica dos requisitos
das aplicações neste domínio, portabilidade, escalabilidade,
capacidade de reutilização e composição dos serviços.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 69 -
De acordo com a Figura 1 a arquitetura da WGWSOA é composta
de três camadas nas quais podemos encontrar (i) descrições dos
serviços armazenadas em repositórios. Essas descrições apoiam a
localização de serviços (Camada de Persistência), (ii) serviços
comuns e específicos (Camada de Middleware) e (iii) aplicações
de groupware (Camada de Aplicação). Serviços comuns
implementam funcionalidades que são necessárias para muitas
aplicações distribuídas, tais como: controle de concorrência,
gerenciamento de transações, nomeação e localização de serviços.
Já os serviços específicos estão relacionados às funcionalidades
das aplicações de um determinado domínio, no caso o domínio de
sistemas colaborativos. Por exemplo, funcionalidades para apoiar
a comunicação, a cooperação, a coordenação, a percepção e
elementos de interoperabilidade que são específicos para os
sistemas colaborativos. Através desta última funcionalidade a
arquitetura inclui o suporte aos tipos de interoperabilidade
necessários para o desenvolvimento de sistemas colaborativos [4].
O projeto do serviço de interoperabilidade inclui o suporte para a
interoperabilidade sintática, semântica e pragmática, ao mesmo
tempo em que interage com os outros serviços específicos para
que eles interoperem através de instâncias da WGWSOA.
4. TIPOS DE INTEROPERABILIDADE
No contexto de uma SOA a interoperabilidade pode ser redefinida
como a capacidade de sistemas diversos, autônomos e
heterogêneos utilizarem seus serviços de forma efetiva. A
ausência de interoperabilidade entre serviços pode ser considerada
um dos obstáculos na realização dos objetivos em uma SOA para
apoiar o desenvolvimento de sistemas colaborativos.
4.1 Interoperabilidade Sintática (ou Técnica)
Interoperabilidade sintática (ou técnica) está relacionada à
capacidade de entidades distintas trocarem mensagens com
estruturas de dados compatíveis. Esta troca frequentemente é
realizada através de um processo de codificação/decodificação de
acordo com os protocolos utilizados. Por exemplo, para a
tecnologia de web services a interoperabilidade sintática é tratada
através dos padrões oferecidos para a descrição, troca de
mensagens, busca e localização de serviços. No projeto da
WGWSOA, a possibilidade de utilização de diferentes
plataformas para o desenvolvimento de serviços restringe o
suporte à interoperabilidade sintática às diferentes tecnologias
utilizadas pelas plataformas. Como resultado, um esforço
adicional do desenvolvedor é necessário para oferecer este
suporte.
4.2 Interoperabilidade Semântica
No contexto da WGWSOA a interoperabilidade semântica está
sendo tratada conforme o conceito proposto por Pollock e
Hodgson [15]. Ao apoiar a interoperabilidade sistemas
colaborativos devem ser capazes de (i) relacionar conceitos caso
eles possuam o mesmo significado, e (ii) interpretar e classificar
significados. Este conceito está relacionado à capacidade de
entidades distintas (emissor e receptor) compreenderem o
conteúdo de uma mensagem [6]. Portanto, ela está associada ao
contexto no qual a informação é transmitida.
Inicialmente, a interoperabilidade semântica está sendo tratada
através do compartilhamento e alinhamento de ontologias. A
decisão por esta abordagem se deve ao fato de oferecer serviços
fracamente acoplados ao mesmo tempo em que a semântica é
associada às operações dos serviços para promover a
interoperabilidade [5].
4.3 Interoperabilidade Pragmática
Ao trocarem mensagens, as partes que colaboram nem sempre
utilizam o mesmo modelo para se comunicarem. O suporte à
interoperabilidade pragmática tem como objetivo tratar de
situações não apoiadas pelas soluções propostas para a
interoperabilidade semântica. Mesmo que o significado da
mensagem seja compreendido, o efeito por ela produzido pode
diferir daquele que foi planejado. Por exemplo, uma das partes
trata o termo “professor” em um contexto de ensino presencial,
enquanto a outra parte, que colabora, considera o contexto de
ensino a distância.
Em termos de uma infraestrutura de middleware, o suporte à
interoperabilidade pragmática está situado tanto na camada de
serviços como em um nível acima dessa camada. Este nível, que
Figura 1. Visão geral da arquitetura da WGWSOA (adaptada de [4]).
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 70 -
ainda não foi projetado para a WGWSOA, relaciona-se aos
processos de negócios de uma organização. Ao definir e executar
um processo, as partes que colaboram devem estar de acordo com
as políticas e regras estabelecidas. Desta forma, os serviços que
participam deste processo concordam que as mensagens enviadas
e recebidas compartilham do mesmo significado [16].
Consequentemente, elementos de contexto devem ser levados em
consideração ao tratarmos do suporte a este tipo de
interoperabilidade.
5. INTEROPERABILIDADE NA WGWSOA
Apesar de manipularem objetos (documentos, aplicações de
suporte a reuniões, agenda, lista de discussão, etc.) com mesma
semântica, não é possível para a maioria dos sistemas
colaborativos distribuídos acessarem objetos e dados de outra
aplicação, mesmo que tais aplicações tenham sido construídas em
uma mesma plataforma de middleware. A complexidade deste
cenário torna-se maior ao idealizarmos a interoperabilidade e a
reutilização de serviços de sistemas colaborativos construídos
com o suporte de middlewares distintos [1].
Diante deste cenário, o suporte à interoperabilidade entre sistemas
colaborativos tem sido investigado no contexto da WGWSOA.
Diferentes soluções, propostas na literatura têm sido investigadas.
Inicialmente, aquelas que estão relacionadas diretamente à
interoperabilidade sintática, foram implementadas e avaliadas
considerando-se os princípios da arquitetura orientada a serviços.
Estes resultados estão descritos em [4]. Outras soluções são
descritas a seguir e se relacionam também ao suporte à
interoperabilidade semântica e interoperabilidade entre modelos
de desenvolvimento.
5.1 Wrapper
O serviço de wrapper na WGWSOA (WGWSOAWrapper) tem
como objetivo apoiar a comunicação entre instâncias distintas da
infraestrutura. Quando uma aplicação em uma instância necessita
executar um serviço em outra instância é necessário enviar uma
mensagem de solicitação contendo o nome da instância de
destino. A partir desse momento, se inicia um processo de
resolução de nomes utilizando-se uma tabela da WGWSOA. Essa
tabela contém os seguintes campos: o nome identificador e o
número IP da instância. A partir do nome da instância é retornado
o número IP do serviço da instância remota [17].
Para que a interação entre as instâncias da WGWSOA ocorra é
necessária à conversão da mensagem para um protocolo de
interoperabilidade. Esse protocolo define um conjunto de regras
para o empacotamento/desempacotamento das informações
necessárias para a comunicação. Para o início da interação entre
serviços específicos da WGWSOA é informado o nome do
serviço, o nome da função e a identificação dos seus parâmetros
(nome, tipo e valor). A instância que recebe a mensagem a
desempacota e executa o serviço localmente. Após a execução,
uma mensagem é retornada contendo as informações do resultado
da operação [4].
Para a avaliação do serviço de wrapper na WGWSOA, serviços
de coordenação e de percepção foram desenvolvidos
considerando, principalmente, os aspectos relacionados à
interoperabilidade sintática. Para os serviços de coordenação e de
percepção mensagens foram trocadas de acordo com as descrições
das interfaces dos serviços. Esses serviços permitiram avaliar a
flexibilidade do serviço de wrapper para apoiar a
interoperabilidade na WGWSOA. Para tanto, alguns ajustes foram
necessários aos serviços existentes para a adequação ao projeto do
(WGWSOAWrapper).
Os resultados da avaliação indicaram que extensões são
necessárias para apoiar a comunicação entre aplicações que não
foram desenvolvidas utilizando-se a plataforma Java. A inclusão
deste serviço na WGWSOA promoveu a interoperabilidade
sintática na infraestrutura, e permitiu que avaliações pudessem ser
realizadas, à medida que estudos de casos foram realizados
envolvendo diferentes instâncias da infraestrutura e os serviços
por ela oferecidos [4]. Usuários de aplicações distintas puderam
realizar tarefas de forma colaborativa, informações e
procedimentos comuns foram compartilhados. Porém, foi
observado um esforço adicional, através de troca de mensagens,
para organizar detalhes relativos à realização das atividades
colaborativas, por exemplo, de coordenação. Considerando
cenários de maior escala e geograficamente mais dispersos, este
esforço tende a aumentar consideravelmente.
Através dos estudos de caso que foram conduzidos, ficou evidente
a necessidade de ir além do suporte à interoperabilidade sintática
para apoiar as atividades de desenvolvimento e execução de
sistemas colaborativos. O serviço de wrapper permite que
usuários compartilhem dados e procedimentos. Apesar de uma
instância da WGWSOA poder solicitar a execução de um
determinado serviço em instâncias distintas, não é possível prever
os efeitos dessa execução na instância destino. Desta forma, a
interoperabilidade pragmática precisa ser tratada neste contexto,
bem como a interoperabilidade semântica.
5.2 Mediadores
Em sistemas colaborativos distribuídos a semântica dos dados está
relacionada ao contexto em que eles serão utilizados.
Considerando que o contexto no qual as aplicações estão inseridas
é dinâmico, um suporte adequado à representação do contexto
deve ser investigado no sentido de oferecer um suporte mais
amplo à interoperabilidade semântica. À medida que o contexto
evolui, as divergências dos significados dos dados tendem a
aumentar. Essas divergências estão relacionadas, por exemplo, aos
aspectos de nomenclatura, escalas e unidades, culturas envolvidas,
conhecimento do domínio das aplicações, e integridade dos dados
[15].
No atual estágio da pesquisa, o suporte à interoperabilidade
semântica na WGWSOA está sendo oferecido através da
utilização de mediadores. A escolha pela utilização de mediadores
se deve ao fato deles apoiarem a escalabilidade e a flexibilidade
dos serviços em domínios nos quais a dinâmica dos contextos
envolvidos é uma característica que predomina. Para tanto, uma
ontologia foi inicialmente desenvolvida, bem como um serviço
mediador que apoia o alinhamento das ontologias associadas aos
serviços que interoperam [5].
A figura 2 ilustra duas instâncias da WGWSOA nas quais duas
ontologias foram associadas a dois serviços específicos: um
serviço de comunicação e um serviço de coordenação. Os serviços
de interoperabilidade da WGWSOA implementam serviços de
mediação que são responsáveis pelo alinhamento das ontologias
de cada serviço específico.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 71 -
Figura 2. Interação entre os serviços de interoperablidade
semântica e outros serviços específicos da WGWSOA [5].
No sentido de proporcionar interoperabilidade para os sistemas
colaborativos, os serviços de Interoperabilidade Semântica foram
divididos em três outros serviços: (i) manipulação de ontologia, é
responsável por analisar a ontologia recebida e obter os conceitos
(classes, subclasses, propriedades, etc); (ii) manipulação de
conceitos, busca avaliar os conceitos obtidos pelo serviço de
manipulação de ontologia comparando-os com os que foram
informados pelo serviço mediador, e indicando se estes são ou
não passíveis de interoperar, bem como a conversão necessária;
(iii) mediador, repassa as ontologias das aplicações a interoperar e
o conceito a ser avaliado para os respectivos serviços. Conforme
as respostas, ele executa a conversão dos dados ou notifica sobre a
impossibilidade de interoperar. O módulo WordNet refere-se à
aplicação que apoia a decisão do serviço manipulador de
conceitos, provendo para este informações sobre sinônimos e
hiperônimos do conceito a interoperar. Além destes as aplicações
podem utilizar outros serviços específicos de middleware (Figura
3).
Serviço de Manipulação
de Ontologia
Wordnet
Serviço de Manipulação
de Conceitos
Serviço Mediador
Serviço de Interoperabilidade
Semântica
Serviço de
Comunicação
Serviços Específicos de
Middleware
Aplicação de
Groupware
Figura 3. Visão geral da arquitetura do mediador da
WGWSOA.
A figura 4 apresenta o Diagrama de Componentes com as
interações entre os serviços que compõem o Serviço de
Interoperabilidade Semântica. É importante notar que a
comunicação deste serviço com o sistema colaborativo é
estabelecida por meio de uma porta que encapsula os demais
serviços.
De acordo com a figura 4, o OntologyHandler é responsável pelo
tratamento da ontologia, isto é, o reconhecimento dos conceitos
de classe. Por sua vez, ConceptHandler avalia tanto os termos
obtidos com o tratamento da ontologia, como a possibilidade de
interoperar. SemanticMediator recebe as ontologias dos serviços
a interoperar e as repassa para OntologyHandler e
ConceptHandler, dependendo das respostas obtidas ele retorna o
resultado da conversação dos dados.
Figura 4. Diagrama de componentes do serviço de
interoperabilidade semântica.
Avaliações foram realizadas no sentido de verificar e extensão na
qual um serviço mediador baseado em ontologias pode alinhar os
conceitos de serviços específicos que necessitam interoperar. Para
a construção dos sistemas colaborativos com o suporte da
WGWSOA foi necessário lançar mão do suporte à
interoperabilidade sintática fornecida pela infraestrutura através
dos seus serviços. Os resultados obtidos revelaram que, no
contexto da arquitetura proposta, a utilização de mediadores
baseados em modelos ricamente semânticos (ontologias) pode
potencializar o suporte à interoperabilidade entre sistemas
colaborativos [5]. Entretanto, outras formas de mediação precisam
ser avaliadas como, por exemplo, a utilização de mediadores
baseados em mapeamentos de modelos (UML, e outros).
Apesar dos resultados obtidos em relação ao suporte à
interoperabilidade semântica, ficou evidente nas avaliações que
outros tipos de interoperabilidade precisam ser apoiados para a
construção e a execução de sistemas colaborativos. Neste
contexto, o suporte à interoperabilidade pragmática, por exemplo,
necessita ser investigado considerando-se que mensagens trocadas
entre serviços que colaboram necessitam satisfazer restrições
determinadas por eles.
5.3 Uma abordagem MDA para apoiar a
interoperabilidade
A MDA (Model Driven Architecture) é uma especificação do
OMG (Object Management Group) que define um framework
conceitual para a realização do desenvolvimento dirigido por
modelos. A MDA propõe que uma determinada aplicação seja
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 72 -
construída a partir de modelos mais genéricos de acordo com a
sua categoria. O ciclo de desenvolvimento de uma aplicação
começa através da especificação de um modelo de negócio (CIM
– Computational Independent Model), um modelo de análise e
projeto do sistema independente de plataforma (PIM – Platform
Independent Model) e, posteriormente, escolhida a plataforma de
desenvolvimento para este software, um modelo específico para
esta plataforma deve ser definido (PSM – Platform Specific
Model). Um PIM pode ter associado a ele diversos PSMs, um
para cada plataforma desejada.
Um dos objetivos da WGWSOA é ser uma infraestrutura
independente de plataforma. Para atender este requisito, além de
facilitar e sistematizar a implementação dos seus serviços, o
processo MDA para desenvolvimento de serviços específicos foi
adotado como processo de software da arquitetura [18].
A homogeneização de plataformas, ou o estabelecimento de
padrões, não tem se mostrado como formas suficientes para apoiar
a interoperabilidade. Segundo Ruokolainen e Kutvonen [6],
ambientes normalmente requerem multiplicidade de plataformas e
os padrões frequentemente são sujeitos à ambiguidade de
interpretações e, como resultado, não podem garantir a
interoperabilidade entre entidades que colaboram. Nesta direção,
experimentos realizados no contexto da WGWSOA evidenciaram
que a adoção de padrões, por exemplo, aqueles estabelecidos pela
tecnologia de Web Services, foram suficientes para apoiar
aspectos da interoperabilidade técnica (ou sintática) e,
parcialmente, semântica.
Neste contexto, outro aspecto relevante diz respeito às
especificidades de soluções frequentemente disponibilizadas por
determinadas aplicações de groupware. A partir do momento em
que desejamos torná-las interoperáveis é necessário um processo
de desenvolvimento específico para cada par de aplicações. Tal
processo pode se tornar inviável à medida que o número de
aplicações cresce. Sendo assim a ausência de interoperabilidade é
um problema não apenas para os usuários, devido à imposição da
utilização de um único ambiente ou tratamento não automatizado
de informações quando sistemas colaborativos distintos são
adotados, mas sobretudo para os desenvolvedores devido ao
esforço envolvido na implementação das soluções frequentemente
propostas na literatura. Tal esforço se relaciona à complexidade
existente para implementar soluções que demandam a
interoperabilidade e a integração entre plataformas distintas de
middleware.
Ao utilizar um modelo unificado entre as partes que colaboram a
interoperabilidade pode ser potencializada. Esse modelo poderia
utilizar uma linguagem com uma notação independente de
plataforma. Ainda, segundo Ruokolainen e Kutvonen [6], a
abordagem MDA pode apoiar a interoperabilidade no momento
em que consideramos a possibilidade de gerar componentes a
partir de transformações aplicadas em um mesmo modelo
independente de plataforma. Como resultado, ferramentas de
diferentes fabricantes podem gerar componentes capazes de
interoperar.
A interoperabilidade entre modelos é promovida à medida que o
processo de construção de uma aplicação pode ser visto como um
conjunto de transformações que levam ao sistema final. Uma
transformação de modelo é o processo de converter um modelo
origem em outro modelo destino. Para que modelos abstratos, ao
longo do ciclo de desenvolvimento, evoluam e deem origem a
código é necessária a realização de transformações [19].
O processo MDA aplicado a WGWSOA destina-se a desenvolver
serviços em várias plataformas distintas da infraestrutura. Desta
forma foi possível adotar um modelo unificado de
desenvolvimento dos serviços, tanto para instâncias distintas da
WGWSOA quanto para as aplicações que os utilizam. Não é mais
necessário um processo de desenvolvimento distinto para cada
nova plataforma de middleware utilizada pela WGWSOA. Como
resultado, o esforço de implementação para interoperabilidade
entre ambientes que utilizam modelos de desenvolvimentos
distintos foi minimizado.
PSM => Código
PIM => PSM
CIM => PIM
Modelo
Operacional
Modelo Projeto
Modelo Domínio
Regra ATL
PSM
Regra MofScript
PIM
CIM
Regra ATL
Figura 5. Visão geral do processo MDA.
A figura 5 apresenta uma visão geral do processo MDA. Neste
processo é possível, a partir da identificação de características
inerentes ao domínio, que são potencialmente requisitos
funcionais mais comuns das aplicações, identificar os serviços
específicos. Desta forma, serviços são definidos a partir das
atividades dos membros do grupo. Além disso, estes serviços são
especificados de forma independente de plataforma para,
posteriormente, através de apoio de regras de transformação,
serem implementados em uma plataforma específica. Aplicando
este processo na WGWSOA, o CIM corresponde ao modelo de
domínio, ao contexto em que o serviço deve ser aplicado. O
escopo do serviço, o vocabulário, a informação e as suas
responsabilidades são definidos neste modelo através dos
requisitos funcionais inicialmente estabelecidos. Casos de usos
devem ser especificados evidenciando as tarefas que o grupo
precisa realizar nas suas atividades.
O PIM corresponde ao Modelo de Projeto. Os serviços a serem
oferecidos e suas operações são definidos neste modelo. Ele
identifica a interface de serviços e componentes estabelecidos no
CIM, independente de uma plataforma de middleware em
particular.
O PSM corresponde ao Modelo Operacional que descreve o
ambiente de execução dos serviços em uma plataforma. As
características de uma plataforma de middleware em particular
(por exemplo, CORBA, RMI, JMS) são consideradas neste
modelo de modo a refletir o ambiente de execução real.
O processo MDA possui até o momento transformações que
permitem a especificação e a implementação de serviços de
middleware para as plataformas CCM (CORBA Component
Model) e EJB (Enterprise Java Beans). As transformações entre
os modelos (CIM-PIM e do PIM-PSM) estão implementadas na
linguagem ATL (Atlas Transformation Language) e as
transformações do PSM para o código estão implementadas na
Linguagem MOFScript. A ferramenta Transforms [20] é o
engenho de transformação utilizado para automatizar estas
atividades.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 73 -
RemoveMeeting
<<Activity>>
CreateMeeting
<<Activity>>
UpdateMeeting
<<Activity>>
ListMeeting
<<Activity>>
PreMeeting_BP
<<BusinessProces s>>
ListUsers
<<Activity>>
Figura 6. Modelo computacional para o serviço de pré-
reunião [18].
A figura 6 mostra o modelo computacional (PIM) para o serviço
de pré-reunião da WGWSOA. Esta aplicação foi desenvolvida
com o intuito de avaliar a solução. Neste modelo, estereotipado
com conceitos do perfil UML EDOC (Enterprise Distributed
Object Computing), o processo de negócio (<<Business
Process>>) Pre-Meeting-BP passa por duas transformações CIM-
PIM e PIM-PSM (conforme ilustrado na figura 5) para gerar a
interface de descrição do serviço Pre-MeetingServer na JavaIDL
(Java Interface Definition Language) na plataforma de
middleware EJB. A figura 7 mostra a IDL gerada a partir do
modelo apresentado na Figura 6.
Na cadeia de transformação do processo MDA, o <<Business
Process>> Pre-Meeting-BP (Figura 6) é mapeado para a interface
Pre-MeetingServer (Figura 7). Da mesma forma, cada elemento
<<Activity>> é mapeado para uma operação da interface do
serviço Pre-MeetingServer.
Figura 7. JavaIDL do serviço de pré-reunião [18].
IDLs (Interface Definition Language) foram projetadas para
serem descritores dos serviços de forma independente da
plataforma de middleware, promovendo assim a
interoperabilidade sintática. Porém, atualmente, não existe uma
IDL padrão adotada por várias plataformas. Na WGWSOA, a
descrição do serviço no PIM tem como objetivo descrever a
interface do serviço de forma independente de plataforma.
A abordagem de MDA foi uma tentativa de ampliar a
interoperabilidade na WGWSOA. Através dos experimentos
realizados, foi observado que a interoperabilidade pode ser
potencializada a partir do momento em que diferentes instâncias
da WGWSOA utilizam a mesma estratégia para desenvolvimento
dos seus serviços. Entretanto, um estudo mais detalhado precisa
ser desenvolvido no sentido de verificar as formas pelas quais a
solução desenvolvida pode ser estendida para apoiar a
interoperabilidade pragmática.
6. CONCLUSÕES E TRABALHOS
FUTUROS
O suporte à interoperabilidade em sistemas colaborativos
demanda muitas vezes a adoção de aspectos comuns no projeto,
tais como: utilização de tecnologias, modelo de dados, políticas
para a execução de atividades de coordenação, e outros.
Entretanto, a uniformidade desses aspectos não é frequentemente
encontrada nos ambientes organizacionais. A interoperabilidade,
portanto, é um requisito com uma complexidade que necessita ser
tratado de uma forma mais abrangente.
Este artigo apresentou uma discussão sobre os diferentes tipos de
interoperabilidade e as soluções adotadas, considerando-se uma
infraestrutura de middleware para apoiar o desenvolvimento e a
execução de sistemas colaborativos. As avaliações realizadas
revelaram a necessidade de se investigar outras soluções para
apoiar a interoperabilidade no contexto dessa infraestrutura. As
questões e abordagens para a interoperabilidade não devem ser
consideradas apenas em determinados níveis de abstração. Sempre
que necessário, o tratamento de interoperabilidade deve ser
considerado através do inter-relacionamento entre diferentes
níveis da infraestrutura (camada de persistência, de middleware e
de aplicação). Por exemplo, em um nível mais abstrato no qual
devemos buscar o suporte à execução de processos de negócio, o
suporte à combinação de diferentes tipos de interoperabilidade se
faz necessário.
A utilização de uma infraestrutura comum, estruturas de mediação
ou meta linguagens não são suficientes para apoiar a
interoperabilidade entre sistemas colaborativos. Mesmo através da
tecnologia de orientação a serviços, alguns aspectos de
interoperabilidade não foram devidamente apoiados pela
WGWSOA. Por exemplo: aspectos comportamentais dos serviços
que compõem os sistemas colaborativos. Esses sistemas
demandam uma complexidade crescente e necessitam de um
suporte mais amplo à flexibilidade para diferentes configurações,
para evoluir no sentido de apoiar os contextos nos quais estão
inseridos, e para apoiar projetos diversificados.
Portanto, ao considerarmos o suporte à interoperabilidade
pragmática percebemos uma necessidade de um suporte mais
abrangente à representação do contexto no qual os processos são
executados. Este estudo passa por uma investigação que está em
andamento no projeto da WGWSOA ao considerarmos não
apenas os modelos para representação dos requisitos da aplicação
e as suas respectivas transformações, mas a representação de
contexto através de ontologias e outras formas propostas na
literatura.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 74 -
7. AGRADECIMENTOS
Agradecemos à Fundação de Amparo à Pesquisa do Estado da
Bahia (FAPESB), pelo apoio financeiro (No. APR0385/2008).
Thiago R. de Almeida é apoiado pela Fundação de Amparo à
Pesquisa do Estado da Bahia.
8. REFERÊNCIAS
[1] Bernstein, P. A. 1996. Middleware: A Model for Distributed
System Services. Communication of the ACM. New York. v.
39, n. 2, Feb., 86-98.
[2] Wegner, P. 1996. Interoperability. ACM Computing Surveys
(CSUR), 28(1), 285-287.
[3] Norman, R. J. 1998. CORBA and DCOM: Side by Side,
Distributed Computing (May 1998). 41-46.
[4] David, J. M. N. and Maciel, R. S. P. 2009. WGWSOA –
Implementando Serviços de Colaboração em uma Infra-
estrutura de Middleware, VI Simpósio Brasileiro de Sistemas
Colaborativos (SBSC), Fortaleza, CE, 193-201.
[5] Almeida, T. R., David, J. M. N. and Maciel, R. S. P. 2011.
Supporting semantic interoperability in a middleware
infrastructure for the development of collaborative services,
In: 15th International Conference on Computer Supported
Cooperative Work in Design (CSCWD), Lausanne,
Switzerland, 422-428.
[6] Ruokolaien, T. and Kutvonen, L. 2006. Interoperability in
Service-based Communities, In: Business Process
Management Workshops, Lecture Notes in Computer
Science, vol. 3812, 317-328.
[7] Tietze, D. 2001. A Framework for Developing Component
based Co-operative Applications, Ph. D. Dissertation
(Computer Science), Technischen Universität Darmstadt,
Germany, 178 p.
[8] Krebs, A. M., Ionescu, M., Dorohonceanu, B. and Marsic, I.
2003. The Disciple System for Collaboration over the
Heterogeneous Web, In: Proceedings of the 36th Annual
Hawaii International Conference on System Sciences
(HICSS’03), Computer Society Press, Big Island: Hawaii,
Jan.
[9] Stiemerling, O. and Cremers, A. 2000. The Evolve Project:
Component-Based Tailorability for CSCW Applications, AI
& Society, London, 120-141.
[10] Dewan, P. and Sharma, A. 1999. An Experiment in
Interoperating Heterogeneous Collaborative Systems, In:
Proceedings of European Conference on Computer-
Supported Cooperative Work (ECSCW’99), Copenhagen,
Sept., 11-20.
[11] Chung, G. and Dewan, P. 2001. Flexible support for
application-sharing architecture, In: Proceedings of
European Conference on Computer Supported Cooperative
Work (ECSCW’01), Germany, Sept., 99-118.
[12] Mangan, M. de Souza, Borges, M. R. S. and Werner, C. M.
2004. A Middleware to Increase Awareness in Distributed
Software Development Workspaces, In: The Joint
WebMedia/LA-Web Conference, Ribeirão Preto, v.1, 62-64.
[13] Fonseca, B. and Carrapatoso, E. 2006. SAGA: A Web
services Architecture for Groupware Applications, In:
Groupware: Design, Implementation and Use. Proc. of 12th
International Workshop on Groupware (CRIWG’06),
Medina del Campo, Spain, Sept., 246-261.
[14] Patil, A., Oundhakar, S., Sheth, A. and Verma, K. 2004.
Meteor-S Web Service annotation framework, In:
Proceedings of the 13th International Conference on the
World Wide Web, 553-562.
[15] Pollock, J. T. and Hodgson, R. 2004. Adaptive Information:
Improving Business Through Semantic Interoperability, Grid
Computing, and Enterprise Integration, John Whiley & Sons.
[16] Pokraev, S., Quartel, D., Steen, M. W. A. and Reichert, M.
A. 2006. Method for Formal Verification of Service
Interoperability, IEEE International Conference on Web
Services (ICWS'06), 895-900.
[17] Bittencourt, L. G., Sposito, H. G., Costa, B. M. S., Maciel,
R. S. P. and David, J. M. N. 2009. Um Serviço de
Comunicação para uma Arquitetura Orientada a Serviços de
Middleware. In: Workshop de Trabalhos de Iniciação
Científica e Graduação Bahia, Alagoas e Sergipe (WTICG-
BASE), Ilhéus – BA, IX Escola Regional de Computação
Bahia-Alagoas-Sergipe, (CD-ROM).
[18] Bispo, C. P., Maciel, R. S. P., David, J. M. N., Ribeiro, I.
and Conceição, R. P. 2010. Applying a Model-Driven
Process for a Collaborative Service-Oriented Architecture,
In: 14th International Conference on Computer Supported
Cooperative Work in Design (CSCWD), Shanghai. v. I. 378-
383.
[19] OMG. 2003. MDA Guide. Version 1.0.1 (omg/2003-06-01).
[20] Silva, B., Magalhães, A., Maciel, R. S. P., Martins, N.,
Nogueira, L. and Queiroz, J. 2009. Transforms: Um
Ambiente de Apoio a Modelagem e Execução de Processos
de Software Dirigido por Modelos. In: Proceedings of the
23rd Brazilian Symposium on Software Engineering (SBES)
- Tools Track, Fortaleza, Outubro 5-9.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 75 -
Uma Ferramenta de Colaboração Móvel para Auxiliar a
Interação em Palestras Presenciais
Gabriel Balestrin
Universidade do Estado de
Santa Catarina - UDESC
Departamento de Ciência da
Computação
Joinville, SC, Brasil
gabrieu3@gmail.com
Carla Diacui Medeiros
Berkenbrock
Universidade do Estado de
Santa Catarina - UDESC
Departamento de Ciência da
Computação
Joinville, SC, Brasil
diacui@joinville.udesc.br
Celso Massaki Hirata
Instituto Tecnológico de
Aeronáutica - ITA
Divisão de Ciência da
Computação
S.J.Campos, SP, Brasil
hirata@ita.br
ABSTRACT
The advancement of mobile computing as well as the con-
nectivity of mobile devices enable the development of new
tools to support groups of people engaged in a common goal.
In events such as conferences, congresses, and symposia, the
participants engage in tasks such as listening, asking the
turn to make questions, questioning in a disciplined and not
efficient form. This article presents a tool to assist classroom
lectures that occur at events such as conferences, congresses
and symposia. The tool enables the creation of questions
using mobile devices or personal computers. The results
showed that the tool helps participants to conduct and sup-
port questions satisfactorily.
Keywords
co-located environments; computer-supported cooperative
work; mobile groupware
RESUMO
O avan¸co e consolida¸ c˜ao da computa¸ c˜ao m´ ovel juntamente
com a conectividade dos dispositivos port´ ateis permitem o
desenvolvimento de novas ferramentas para apoiar grupos
de pessoas engajadas em um objetivo comum. Em even-
tos como conferˆencias, congressos e simp´osios, os partici-
pantes engajam em tarefas de escutar, solicitar a vez de
fazer perguntas e perguntar, de uma naneira disciplinada e
n˜ao eficiente. Este artigo apresenta uma ferramenta para
auxiliar palestras presenciais que ocorrem em eventos como
conferˆencias, congressos e simp´ osios. A ferramenta permite
a elabora¸ c˜ao de perguntas utilizando dispositivos m´oveis ou
computadores pessoais. Os resultados obtidos mostraram
que a ferramenta auxilia os participantes a realizar e apoiar
perguntas de maneira satisfat´oria.
Palavras-chave
ambientes colocalizados; trabalho cooperativo apoiado por
computador; groupware m´ovel
1. INTRODUÇÃO
A popularidade e desenvolvimento tecnol´ogico dos dispos-
itivos m´oveis tornam poss´ıvel o desenvolvimento de novos
tipos de ferramentas que possibilitem o relacionamento de
pessoas. O avan¸co desses dispositivos tem colaborado com
a sua aceita¸c˜ao e despertado interesse na fundamenta¸ c˜ao de
aplica¸c˜oes para auxiliar grupos em suas tarefas. Melhorias
como redu¸ c˜ao de tamanho, peso e consumo de energia e fa-
tores como portabilidade e a conectividade permitem que os
dispositivos m´oveis tenham melhor efetividade nas tarefas
do dia-a-dia. Luff e C. Heath [4] descrevem que esse avan¸co
em conjunto com as novas formas de conectividade permite
a integra¸ c˜ao de dispositivos m´oveis em aplica¸c˜oes coopera-
tivas.
Em palestras presenciais como aquelas que ocorrem em con-
ferˆencias, congressos e simp´osios, ´e desej´ avel que existam
intera¸ c˜oes entre os participantes. Nessas palestras, geral-
mente as intera¸c˜oes s˜ao caracterizadas pela apresenta¸c˜ao do
palestrante sobre um tema para um grupo de participantes
e pela sess˜ao de perguntas e respostas. Os participantes ap-
resentam suas perguntas individualmente sobre t´opicos do
tema. As perguntas s˜ao elaboradas em geral na ordem em
que ´e dada a palavra ao participante. O palestrante em geral
responde imediatamente ap´os a apresenta¸ c˜ao da pergunta.
O conte´ udo da resposta depende do conte´ udo da palestra
proferida e das respostas dadas at´e aquele instante. Con-
tudo, por raz˜oes de restri¸ c˜ao de tempo, personalidade ou
atitude dos participantes e dificuldades de gest˜ao, a sess˜ ao
pode ficar comprometida. Perguntas de interesse particular
de alguns participantes podem ser feitas enquanto que per-
guntas de interesse maior podem deixar de ser realizadas.
Essas situa¸c˜oes caracterizam uma perda de qualidade da
palestra e uma ineficiˆencia no uso do tempo.
Conjectura-se que ambientes de palestras presenciais pos-
suem potencial para a utiliza¸ c˜ao de dispositivos m´ oveis para
melhorar a intera¸ c˜ao entre os participantes, de modo a au-
mentar a efetividade das reuni˜ oes.
O desenvolvimento de sistemas colaborativos que empregam
dispositivos m´ oveis apresenta dificuldades variadas. Roth
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 76 -
[6] descreve sete dificuldades (comunica¸c˜ao; arquitetura; co-
ordena¸ c˜ao; distribui¸c˜ao de dados e consistˆencia; interfaces
do usu´ ario; seguran¸ca e privacidade; e implementa¸c˜ao) para
a constru¸ c˜ao de um groupware m´ovel. Berkenbrock et al
[2] apresentam e avaliam requisitos que ajudam projetistas
a identificar pontos fracos relacionados com a usabilidade
dos dispositivos. Esses trabalhos ainda apontam a falta de
padroniza¸ c˜ao e de diretrizes para projetar e avaliar sistemas
de groupware m´ovel. Outro agravante ´e o tamanho pequeno
das telas dos dispositivos m´oveis, que dificulta a realiza¸c˜ao
de tarefas b´ asicas como ler, navegar e selecionar opera¸c˜oes.
Contudo, sistemas baseados em dispositivos m´oveis com in-
tera¸c˜ao social entre um grupo, ou groupware m´ ovel, tˆem sido
´ uteis para alguns estudos que envolvem o trabalho colabora-
tivo [1, 2, 3, 7]. Novos paradigmas de relacionamento entre
as pessoas est˜ao surgindo, gra¸cas ` a tecnologia m´ ovel e ao
uso de groupware para auxili´a-los em seus trabalhos.
Em ambientes de conferˆencias, congressos e palestras, exis-
tem alguns problemas que podem ser tratados com o uso
de groupware m´ovel. Este trabalho contextualiza uma fer-
ramenta que permite aos participantes desses ambientes re-
alizarem perguntas atrav´es de uma aplica¸c˜ao executada em
dispositivos m´oveis. Os participantes tˆem acesso as pergun-
tas feitas pelos demais e podem dar apoio para aquelas que
s˜ ao mais interessantes.
Este artigo tem como objetivo, apresentar uma ferramenta
de colabora¸ c˜ao m´ ovel para auxiliar participantes de reuni˜oes.
De modo que, pretende-se auxiliar com o apoio da ferra-
menta da seguinte forma: (i ) melhorar a utiliza¸c˜ao do tempo,
podendo criar perguntas durante a apresenta¸ c˜ao; (ii ) permi-
tir outra forma de exposi¸ c˜ao das d´ uvidas, atrav´es do envio
de uma mensagem utilizando um dispositivo e n˜ao necessari-
amente se expondo ao p´ ublico; (iii ) permitir a colabora¸ c˜ao
do p´ ublico para sele¸ c˜ao das perguntas que os participantes
tˆem um maior interesse; e (iv) garantir que todas as quest˜oes
levantadas pelo grupo de participantes de uma conferˆencia
sejam registradas em um banco de dados para futuras con-
sultas. Assim, os participantes ter˜ao oportunidade de par-
ticipar e colaborar com o grupo para compreender o tema
da apresenta¸c˜ao.
O artigo est´a organizado da seguinte forma. Na se¸c˜ao 2
fornece-se uma breve vis˜ao sobre os trabalhos relacionados.
Na Se¸c˜ao 3 apresenta-se o pr´ ototipo desenvolvido. Na Se¸c˜ao
4 apresenta-se o estudo de caso realizado. Na Se¸ c˜ao 5 apresenta-
se uma an´ alise dos primeiros resultados obtidos. Finalmente,
na Se¸c˜ao 6, apresentam-se as conclus˜oes e trabalhos futuros.
2. TRABALHOS RELACIONADOS
Alguns trabalhos apresentam ferramentas de colabora¸ c˜ao
m´ ovel para auxiliar grupos colocalizados, ou seja, onde os
participantes est˜ao dispostos em um mesmo ambiente.
Em [7], Yu e Selker apresentam o Meeting Essence II, um
groupware m´ovel que introduz um novo paradigma para reg-
istro de informa¸c˜oes durante reuni˜ oes face-a-face. Nesse tra-
balho, os eventos mais importantes que ocorrem durante a
reuni˜ao s˜ ao identificados e registrados pelos participantes
com um ´ unico toque na tela do dispositivo m´ovel. O princi-
pal objetivo da ferramenta ´e garantir que as principais ideias
geradas pelos participantes sejam armazenadas atrav´es de
uma grava¸c˜ao de ´audio feita pelo pr´ oprio dispositivo, o qual
´e controlado pela aplica¸ c˜ao. Isso permite que todos os mem-
bros da reuni˜ ao que consideraram o assunto importante pos-
sam registr´a-lo, para futuras consultas. Quando a voz de um
participante est´ a sendo gravada ´e poss´ıvel que ele perceba
atrav´es do seu dispositivo se algu´em considera a sua colo-
ca¸ c˜ao importante, dessa forma os participantes recebem um
feedback da sua contribui¸c˜ao. A principal contribui¸ c˜ao da
ferramenta ´e permitir que cada participante defina o que ´e
mais importante para si, e colabore com o grupo para recu-
perar as principais informa¸c˜oes discutidas.
Esponda [3] descreve um sistema Web de vota¸c˜ao eletrˆonica
para estudantes em salas de aula. O groupware permite que
um professor durante uma aula ou previamente possa elab-
orar quest˜ oes atrav´es de um dispositivo eletrˆonico m´ovel,
como PDA ou tablet, e disponibilize essas quest˜oes para
serem respondidas pelos alunos, os quais tamb´em utilizam
dispositivos m´ oveis para respondˆe-las. As respostas s˜ao ar-
mazenadas em um servidor e podem ser disponibilizadas
graficamente como desejadas pelo professor. O principal ob-
jetivo da ferramenta ´e aumentar o n´ıvel de participa¸ c˜ao dos
estudantes durante as aulas.
Em [2], Berkenbrock et al. desenvolveram um jogo de per-
guntas e respostas. Os jogadores se dividem em duas equipes,
onde o objetivo de cada jogador ´e conseguir o maior n´ umero
de pontos respondendo as quest˜oes apresentadas a ele. A
pontua¸c˜ao do jogo ´e dada pela soma dos pontos de cada
membro da equipe. O jogo deve ser instalado nos dispos-
itivos m´oveis dos indiv´ıduos participantes da atividade e o
controle de acesso `as perguntas e sincroniza¸c˜ao s˜ ao feitos
utilizando um servidor. O jogo serviu como uma aplica¸c˜ao
prot´ otipo para observar o potencial requisitos de groupware
m´ovel, e assim, identificar pontos fracos relacionados com a
usabilidade.
Os trabalhos mencionados consideram a ideia de auxiliar
um grupo de pessoas para desenvolver determinadas tare-
fas necess´arias para o grupo a partir de dispositivos m´oveis.
Ainda que uma das grandes vantagens da plataforma m´ovel
seja a mobilidade dos usu´arios, o foco desses trabalhos n˜ao
foi a mobilidade, mas sim a avalia¸c˜ao de aspectos como co-
opera¸c˜ao e coordena¸ c˜ao das atividades. Al´em disso, a co-
munica¸c˜ao face-a-face predominou em todas as aplica¸c˜oes.
3. PROTÓTIPO DESENVOLVIDO
O Simple Question foi desenvolvido para possibilitar a co-
labora¸ c˜ao dos participantes de palestras, na elabora¸ c˜ao de
perguntas a partir de dispositivos m´ oveis. As perguntas re-
alizadas atrav´es de dispositivos port´ateis ou computadores
desktops s˜ao disponibilizadas aos demais usu´arios, permitindo
aos participantes, por exemplo, conhecer as perguntas a
serem feitas `a um palestrante durante uma palestra. As
tecnologias que auxiliaram o desenvolvimento da ferramenta
foram as linguagens de marca¸c˜ao HTML e CSS; a linguagem
de programa¸ c˜ao PHP 5; e o banco de dados relacional MySQL.
O objetivo da ferramenta ´e auxiliar participantes de palestras,
congressos e conferˆencias, a realizar perguntas atrav´es de
dispositivos m´ oveis ou fixos em palestras presenciais. Du-
rante a apresenta¸c˜ao, participantes podem submeter pergun-
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 77 -
tas ou esclarecimentos de d´ uvidas que ocorrem no decorrer
da apresenta¸c˜ao. Os participantes redigem as perguntas e
as enviam pela ferramenta.
As perguntas submetidas ficam dispon´ıveis para acesso aos
demais participantes. Se um participante desejar fazer uma
pergunta que j´a est´a cadastrada, ele tem a op¸c˜ao de apoiar
a pergunta. Cada pergunta possui um contador de partici-
pantes que ´e incrementado a cada apoio. E ao final, quando
o palestrante encerrar a apresenta¸c˜ao do tema, a ferramenta
possibilita apresentar as perguntas em ordem decrescente de
valor de seus contadores.
Para participar da sess˜ao colaborativa ´e necess´ario que os
participantes possuam dispositivos m´ oveis com acesso Wi-Fi
ou computador conectado `a rede. O dispositivo deve conter
um navegador, o qual permite abrir a aplica¸c˜ao. A Figura
1(a) apresenta a janela inicial da aplica¸ c˜ao. A ferramenta
possui suporte para dois idiomas: inglˆes e portuguˆes.
Ao entrar no sistema, o participante precisa fazer um cadas-
tro. O cadastro ´e ´ util para identificar a autoria das per-
guntas. E no caso de a pergunta ser selecionada, mas n˜ao
respondida, por desconhecimento do palestrante ou falta de
tempo durante a sess˜ao, ´e poss´ıvel que o palestrante ou uma
pessoa respons´ avel, entre em contato com o participante
atrav´es do cadastro e responda a pergunta pendente. Con-
tudo, de modo a preservar a identidade dos participantes,
apenas o mediador da sess˜ao tem acesso a identifica¸ c˜ao dos
respons´aveis pelas perguntas. Dessa forma, conjectura-se
que a n˜ ao identifica¸c˜ao dos participantes incentive a realiza-
¸c˜ao de perguntas por pessoas que se sintam intimidados em
fazer uma pergunta em p´ ublico.
Conforme apresentado na Figura 1(b), as perguntas s˜ ao ex-
ibidas no dispositivo conforme uma lista. Sendo que, a cada
pergunta ´e atribu´ıdo um t´ıtulo pelo participante, o qual ´e re-
spons´avel por identific´ a-la. Vale considerar que a pergunta
enviada por ´ ultimo aparece no topo da lista. A lista ap-
resenta sete perguntas por vez. Isso acontece porque al-
guns navegadores para dispositivos m´oveis s˜ao limitados e
n˜ao conseguem renderizar uma grande quantidade de infor-
ma¸ c˜oes na janela de uma s´ o vez. Sendo assim, no final da
lista existe um bot˜ao que permite visualizar as demais per-
guntas, tal como apresentado na Figura 1(c).
O acesso ao conte´ udo das perguntas ´e feito ao clicar em cima
do seu t´ıtulo. Uma nova janela exibir´a o nome do autor,
o t´ıtulo da pergunta e conte´ udo. Assim que o acesso da
pergunta for feito, o usu´ario tem a op¸c˜ao de apoiar. A Figura
1(d) apresenta a janela correspondente a esta situa¸ c˜ao.
Ainda, atrav´es da janela principal ´e poss´ıvel saber o n´ umero
de quest˜oes enviadas at´e o momento e a quantidade de usu´ arios
conectados. Ela possui um bot˜ ao para acesso a algumas in-
forma¸c˜oes da palestra com nome da apresenta¸ c˜ao, nome do
palestrante, dura¸c˜ao prevista, entre outras. Tamb´em, por
meio desta janela, o participante pode: acessar a janela para
elaborar perguntas, conforme a Figura 1(e); sair da aplica¸c˜ao
para voltar a p´agina inicial; e ´e poss´ıvel atualizar a janela
atrav´es de um bot˜ao que sincroniza os dados sem utilizar
atualiza¸ c˜ao do navegador.
O mediador ´e a pessoa respons´avel por organizar e acom-
panhar o andamento da reuni˜ao. Ele pode utilizar um com-
putador fixo, notebook, netbook ou tablet para gerenciar a
aplica¸c˜ao. Atrav´es de uma aplica¸c˜ ao integrada ao sistema
de perguntas, o mediador pode manter uma reuni˜ao e moni-
torar as perguntas cadastradas, os apoios e a quantidade de
participantes cadastrados.
A partir da janela principal apresentada na Figura 2, o me-
diador pode criar, editar, abrir, salvar e fechar sess˜oes de
perguntas. Ao criar uma palestra ela ´e salva automatica-
mente, por´em, para que o estado atual seja recuperado ´e
necess´ ario salvar a sess˜ ao sempre que for necess´ario.
´
E pos-
s´ıvel filtrar as perguntas pelo t´ıtulo. Essa funcionalidade se
torna interessante quando o palestrante receber um n´ umero
elevado de quest˜oes.
Todas as perguntas enviadas s˜ao listadas em ordem decres-
cente de apoios. Assim, as perguntas que estiverem no topo
da lista, representam aquelas que obtiveram o maior n´ umero
de apoios.
Para acessar as informa¸c˜oes de uma pergunta, basta clicar
na linha corrente onde ela se encontra na tabela. Sempre que
uma pergunta nova aparecer na janela, a sua fonte aparecer´a
em negrito. Ap´os a visualiza¸c˜ao, a fonte deixa de ser negrito.
Isso auxilia o mediador a diferenciar as perguntas lidas, das
n˜ ao lidas. Tamb´em ´e poss´ıvel acessar uma pergunta e marc´a-
la como j´ a respondida, ou n˜ ao respondida. No caso das
perguntas respondidas, uma flag verde aparece ao lado da
pergunta. As n˜ ao respondidas tˆem flags vermelhas.
4. ESTUDO DE CASO
O estudo de caso teve como objetivo observar a utiliza¸c˜ao da
ferramenta de colabora¸c˜ao m´ ovel e a sua eficiˆencia na sess˜ao
de perguntas atrav´es da colabora¸c˜ao do grupo.
4.1 Ambiente do Desenvolvimento
O ambiente de desenvolvimento e de experimento ´e com-
posto por 2 unidades m´ oveis, a saber, Palm OS 5.4.8 e
Iphone equipados com interface Wi-Fi, 13 computadores de
mesa sob Windows 7, um servidor Apache 2.2 sob Win-
dows 7 e uma infra-estrutura de rede local sem fio segundo
o padr˜ao IEEE 802.11 e rede local com fio segundo o padr˜ao
Ethernet.
A comunica¸ c˜ao entre cliente e servidor ´e feita atrav´es do pro-
tocolo HTTP. Por se tratar de uma aplica¸c˜ao m´ ovel, foram
adotadas as recomenda¸c˜oes pr´ aticas de desenvolvimento de-
scritas por Rabin e McCathieNevile [5]. N˜ ao h´ a atualiza¸c˜oes
autom´ aticas das informa¸ c˜oes, assim o sincronismo ocorre
quando o cliente solicita a atualiza¸c˜ao.
4.2 Estrutura do experimento controlado
O experimento foi realizado com 26 participantes, 20 homens
e 6 mulheres, com idades entre 20 e 26 anos (idade m´edia
= 22.2 anos). Por´em, os participantes estiveram dispostos
em grupos de dois ou trˆes elementos, a fim de compartilhar
os recursos. Portanto, os dados aqui apresentados est˜ao de
acordo com os representantes de cada grupo. Todos os par-
ticipantes s˜ ao estudantes de gradua¸ c˜ao no curso de Tecnolo-
gia em An´alise e Desenvolvimento de Sistemas da UDESC
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 78 -
Figure 1: a) Janela inicial; b) Janela principal sem rolagem; c) Janela principal com rolagem; d)Janela para
visualizar pergunta; e) Janela editar a pergunta
Figure 2: Janela Principal do Mediador
e est˜ao cursando os periodos finais do curso. Em rela¸c˜ao `a
experiˆencia pr´evia desses participantes com os recursos en-
volvidos no experimento, todos indicaram j´a ter utilizado
um dispositivo m´ ovel. Tamb´em, dos treze representantes de
cada grupo, doze alegaram j´a ter utilizado aplica¸ c˜oes Web
atrav´es de dispositivos m´oveis. No entanto, nenhum deles
teve oportunidade pr´evia de utilizar algum dispositivo m´ovel
em palestras.
Os instrumentos para coleta dos dados e avalia¸c˜ao foram os
seguintes: (i ) Observa¸c˜oes feitas pelos mediadores da sess˜ao
durante os experimentos; (ii ) Logs registrados no servidor
contendo informa¸ c˜oes sobre os acessos e apoios as perguntas;
e (iii ) Question´ arios preenchidos pelos participantes.
Conforme mostrado na Figura 3(a), no ambiente do experi-
mento os participantes est˜ao pr´oximos uns dos outros (colo-
cated). Entretanto, apesar dos participantes estarem em
uma mesma sala, usando o seu dispositivo para acessar a
sess˜ ao eletrˆ onica, a orienta¸c˜ao era de que as perguntas fos-
sem feitas utilizando a ferramenta, sendo que cada grupo de-
veria realizar pelo menos uma pergunta e apoiar pelo menos
uma. Cada grupo cadastrou-se com o nome do representante
ou nome dos membros do grupo para participar da sess˜ao.
4.3 Resultados Coletados
Foram realizadas duas apresenta¸c˜oes de palestras com sess˜oes
de perguntas colaborativas. Os mediadores da sess˜ao foram
respons´aveis por fornecer as instru¸c˜oes sobre o estudo de
caso aos participantes. Antes de iniciar as tarefas moni-
toradas, cada participante preencheu o Question´ario Pr´e-
experimento buscando identificar o perfil do participante e a
sua experiˆencia anterior com dispositivos m´oveis. Ap´os cada
experimento monitorado, foi aplicado o Question´ario P´ os-
experimento com o qual se busca identificar elementos de
percep¸ c˜ao, coerˆencia, compreens˜ao das atividades e desem-
penho obtidos pelos participantes. Nesse documento tam-
b´em se solicita ao participante a indica¸c˜ao de sugest˜oes para
realiza¸ c˜ao de levantamento das necessidades do usu´ario.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 79 -
Figure 3: a) Participantes durante a palestra; b) Flagrantes das telas dos dispositivos.
Na primeira sess˜ao doze participantes se cadastraram, seis
perguntas foram realizadas, houve um total de dez apoios
distribu´ıdos entre as seis perguntas, sendo que a mais votada
obteve quatro apoios e uma das perguntas n˜ao obteve nen-
hum. Na segunda sess˜ ao quatorze participantes se cadas-
traram, dez perguntas foram realizadas, trinta e quatro apoios
foram distribu´ıdos entre as perguntas, e houve duas pergun-
tas com total de apoios igual a cinco. A Figura 3(b) apre-
senta um flagrante das telas dos dispositivos.
5. ANÁLISE DOS RESULTADOS
Nesta se¸ c˜ao apresentam-se as an´alises realizadas para obser-
var os resultados obtidos, a fim de avaliar a utiliza¸c˜ao da
ferramenta no ambiente do estudo de caso.
O question´ ario aplicado ap´ os o experimento cont´em uma
s´erie de perguntas sobre satisfa¸c˜ao, percep¸c˜ao e o esfor¸ co
gasto em todas as tarefas. Al´em disso, o question´ario foi
utilizado para verificar se as informa¸c˜oes apresentadas aos
participantes estavam coerentes com as informa¸c˜oes de cada
sess˜ ao colaborativa. Algumas das quest˜oes s˜ao apresentadas
na Tabela 1. Os participantes do experimento foram in-
stru´ıdos a fazer um c´ırculo em volta do n´ umero que melhor
representa a sua avalia¸c˜ao. Os valores para avalia¸c˜ao das
respostas dos participantes foram categorizados da seguinte
forma: 1-Muito Negativo, 2-Negativo, 3-Neutro, 4-Positivo
e 5-Muito Positivo. Assim, as pontua¸c˜oes menores (1 e 2) in-
dicam que a ferramenta influi negativamente nas opera¸c˜oes
enquanto que as pontua¸c˜oes maiores (4 e 5) indicam uma
influˆencia positiva.
O resumo da avalia¸c˜ao est´ a sumarizado na Tabela 2.
Para 50% dos participantes, a capacidade de utilizar o aplica-
tivo de maneira satisfat´oria foi definida como “Muito Posi-
tivo”. Os demais participantes consideraram entre“Positivo”
ou “Neutro”.
Para avaliar a percep¸ c˜ao, em m´edia, os participantes defini-
ram como “Neutro” os elementos presentes na janela para
identificar outros participantes e suas a¸c˜oes. Nesse caso,
´e importante observar que o n´ umero de usu´ arios online e
o n´ umero de perguntas submetidas foram as ´ unicas formas
de identificar outros participantes na sess˜ao. Contudo, os
participantes consideraram como “Positivo” o esquema de
cores apresentados para o estado das perguntas. Um partic-
ipante abordou que, o esquema de cores se assemelha a out-
ras aplica¸c˜oes que ele utiliza no dia-a-dia, como por exemplo,
aplica¸c˜oes de e-mail. Com isso, ele n˜ao teve dificuldade na
realiza¸c˜ao das opera¸c˜oes da ferramenta.
Como o sistema ´e ass´ıncrono, os participantes deveriam sin-
cronizar os dados conforme achassem necess´ario. Os partic-
ipantes consideraram como “Neutro” poder acompanhar as
perguntas durante a sess˜ao sem sincroniza¸c˜ao imediata dos
dados. Conforme observado pelos mediadores, em alguns
momentos da sess˜ao os participantes permaneciam na janela
principal sem realizar nenhuma a¸ c˜ao. Com isso, eles n˜ao
acompanhavam o estado corrente da sess˜ao de perguntas.
Para elaborar as perguntas, 50% dos participantes consider-
aram “Negativo” a facilidade para definir uma pergunta; os
demais consideraram como“Positivo”e“Muito Positivo”. No
entanto, para apoiar uma pergunta os participantes consid-
eraram“Positivo” o esquema de palavras chaves para identi-
ficar as perguntas. Segundo um participante, ele leu apenas
as quest˜oes com t´ıtulos que chamaram a sua aten¸c˜ao, em
rela¸c˜ao a apresenta¸c˜ao da palestra.
Conforme descrito na sess˜ao anterior, houve uma breve ex-
plana¸ c˜ao sobre a ferramenta. Entretanto, os participantes
avaliaram como “Positivo” a facilidade de aprender a uti-
lizar o aplicativo, realizar as tarefas com a ferramenta e tam-
b´em, o esfor¸ co para realizar qualquer atividade. No entanto,
deve ser lembrado que o perfil dos participantes indica que a
maioria pertence ` a ´area de tecnologia. Em rela¸ c˜ao ao n´ıvel
de concentra¸ c˜ao requerido para realizar as tarefas, apenas
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 80 -
Table 1: Quest˜ oes relacionadas com a percep¸ c˜ao e o esfor¸ co durante as tarefas cooperativas.
Quest˜ao Op¸ c˜oes para avalia¸c˜ao do usu´ario
1-Vocˆe conseguiu utilizar o aplicativo de maneira satisfat´ oria? Pouco...1 2 3 4 5...Muito
2-As informa¸ c˜oes apresentadas na tela principal auxiliaram a identificar os participantes? Pouco...1 2 3 4 5...Muito
3-Vocˆe conseguiu identificar o estado de cada pergunta pelo esquema de cores proposto? Pouco...1 2 3 4 5...Muito
4-Vocˆe conseguiu identificar as a¸c˜oes dos demais participantes? Pouco...1 2 3 4 5...Muito
5-Os t´ıtulos elaborados pelos participantes ajudaram na sele¸c˜ao das perguntas de interesse? Pouco...1 2 3 4 5...Muito
6-O qu˜ao dif´ıcil foi acompanhar as perguntas sem ter sincroniza¸c˜ao imediata? Muito dif´ıcil..1 2 3 4 5..Muito f´ acil
7-Qu˜ao dif´ıcil foi elaborar as perguntas? Muito dif´ıcil..1 2 3 4 5..Muito f´ acil
8-O qu˜ao dif´ıcil foi utilizar o dispositivo m´ ovel? Muito dif´ıcil..1 2 3 4 5..Muito f´ acil
9-O qu˜ao dif´ıcil foi aprender a utilizar o sistema colaborativo de perguntas? Muito dif´ıcil..1 2 3 4 5..Muito f´ acil
10-O qu˜ao dif´ıcil foi completar as tarefas? Muito dif´ıcil..1 2 3 4 5..Muito f´ acil
11-O quanto de esfor¸co as tarefas necessitaram? Muito dif´ıcil..1 2 3 4 5..Muito f´ acil
12-O qu˜ao dif´ıcil foi se concentrar para executar as tarefas? Muito dif´ıcil..1 2 3 4 5..Muito f´ acil
Table 2: Sum´ario da avalia¸c˜ao
Requisito Quest˜oes analisadas Coment´arios
Satisfa¸ c˜ao 1 e respostas descritiva Os participantes declararam alto grau de satisfa¸c˜ao no uso da aplica¸ c˜ao
Os elementos de percep¸c˜ao utilizados precisam ser melhorados, contudo, o
Percep¸c˜ao 2, 3, 4, 5
esquema de cores proposto auxiliou na identifica¸c˜ao do estado das quest˜oes
Os participantes consideraram f´acil utilizar a aplica¸ c˜ao, por´em declararam que
Esfor¸ co 6, 7, 8, 9, 10, 11, 12
os ru´ıdos e a leitura das perguntas distrairam sua aten¸ c˜ao
Falta de sincroniza¸ c˜ao prejudicou a coerˆencia entre as informa¸c˜oes apresentadas
Coerˆencia respostas descritiva
aos participantes e as informa¸c˜oes de cada sess˜ao colaborativa
um participante definiu como “Muito Negativo”. Os demais
participantes consideraram “Neutro” ou “Positivo”. Entre-
tanto quando solicitado se houve distra¸c˜oes durante o uso
da ferramenta, 50% informaram que sim. A maioria definiu
que o principal motivo foi os ru´ıdos durante a sess˜ao. Um
dos participantes considerou que ficar lendo as perguntas o
distraiu de prestar aten¸ c˜ao na palestra. Em torno de 25%
dos participantes alegaram o uso da ferramenta impediu de
acompanhar detalhes importantes da palestra.
A avalia¸c˜ao da coerˆencia das informa¸ c˜oes buscou verificar
se as informa¸ c˜oes apresentadas aos participantes estavam
coerentes com as informa¸c˜oes de cada sess˜ao colaborativa.
Para essa avalia¸ c˜ao, foi solicitado aos participantes que in-
formassem o n´ umero total de perguntas recebidas e a quan-
tidade de participantes que utilizavam a ferramenta durante
a sess˜ao. N˜ao houve respostas coerentes. Considerando que
ocorreram duas sess˜oes, pode ter havido confus˜ ao para re-
sponder essas quest˜ oes. E conforme observado pelos medi-
adores, alguns participantes n˜ao utilizaram com tanta fre-
q¨ uˆencia a ferramenta. Deste modo, os dados n˜ao estavam
atualizados, levando em conta que ´e necess´ ario o pr´ oprio
participante atualizar as informa¸c˜oes da sess˜ao.
Atrav´es dos resultados obtidos nos experimentos, ´e poss´ıvel
correlacionar a colabora¸c˜ao do grupo ` a facilidade de apren-
der e utilizar a ferramenta. Em geral, os participantes ap-
resentaram conceitos positivos com rela¸c˜ao `a facilidade de
aprender a utilizar a ferramenta. Prova disso s˜ao os resul-
tados com rela¸ c˜ao ao esfor¸co realizado e o desempenho dos
participantes por gerar um n´ umero interessante de pergun-
tas e apoios. Do mesmo modo, a satisfa¸ c˜ao com o uso da
ferramenta tamb´em colaborou com o aprendizado, j´a que os
participantes consideraram satisfat´orio o uso da ferramenta.
No entanto, durante a utiliza¸c˜ao alguns detalhes impediram
total colabora¸ c˜ao do grupo. De modo que, a coerˆencia dos
dados dependia da freq¨ uˆencia de utiliza¸ c˜ao da aplica¸c˜ao e
interesse do participante. Alguns participantes se sentiram
distra´ıdos ao utilizar a ferramenta, para ler e elaborar as
perguntas.
No experimento realizado foi poss´ıvel constatar que num
primeiro momento os participantes tiveram dificuldade em
entender do que realmente se tratava a ferramenta. Sendo
que, durante a primeira sess˜ao apenas seis perguntas foram
submetidas e obtiveram dez apoios no total. No entanto, na
segunda sess˜ao, obteve-se um aumento de 66.6% no n´ umero
de perguntas realizadas e 240% de aumento no n´ umero de
apoios. Deste modo, conforme os participantes se acostu-
maram com o uso da ferramenta, maior foi a colabora¸ c˜ao
entre eles.
6. CONCLUSÃO
O Simple Question possibilitou oferecer aos usu´ arios uma
nova forma de realizar perguntas. Assim, v´arias perguntas
podem ser feitas e apoiadas, sendo que, ´e poss´ıvel previ-
amente conhecer as d´ uvidas dos demais participantes e co-
laborar para obter uma gama de perguntas relacionadas com
o perfil dos participantes.
Neste trabalho, constatou-se ainda que os participantes n˜ao
tiveram dificuldades em utilizar o groupware. O principal
esfor¸co, segundo dados relativos com o question´ario p´ os-
experimento foi para realizar as perguntas. Mas levando
em conta que as outras atividades n˜ao necessitavam tanta
complexidade, a elabora¸c˜ao da pergunta dependia exclusi-
vamente do entendimento do participante com rela¸c˜ao ao
contexto da apresenta¸c˜ao. A falta de concentra¸ c˜ao pode ter
influenciado negativamente a palestra, j´a que alguns partic-
ipantes se distra´ıram durante o experimento.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 81 -
Em geral, a ferramenta auxiliou os participantes de um sem-
in´ ario a realizar e apoiar perguntas de outros participantes.
De modo que, ao final do semin´ario foi poss´ıvel levantar um
n´ umero relativamente satisfat´orio de perguntas. As pergun-
tas com mais apoios e possivelmente a com maior interesse
puderam ser apresentadas ao palestrante.
Alguns problemas identificados neste trabalho est˜ ao em aberto
e ser˜ao endere¸ cados futuramente. Entre as sugest˜oes para
trabalhos futuros destacam-se: (i ) Permitir o mediador fil-
trar todas as perguntas submetidas pelos participantes, a
fim de impedir que perguntas sem sentido sejam visualizadas
por todos que utilizam a ferramenta; (ii ) Atribuir novas fun-
cionalidades a ferramenta com inten¸ c˜ao de possibilitar os
pr´oprios participantes responder as perguntas. Com isso,
tamb´em pode-se permitir que os participantes definam um
grau de satisfa¸ c˜ao para as respostas; (iii ) Adicionar mais
elementos de percep¸c˜ao `a janela principal, a fim de melho-
rar o reconhecimento do ambiente atrav´es dos dispositivos,
considerando que, dispositivos m´ oveis possuem uma janela
reduzida. Esses elementos teriam inten¸ c˜ao de responder per-
guntas como: “O que est´a acontecendo?” e“O que devo fazer
em seguida?”; (iv) Definir uma maneira de compartilhar a
edi¸ c˜ao de perguntas, de modo que, um participante possa
submeter uma pergunta e outros possam complement´a-la;
(v) Avaliar o desempenho para um n´ umero grande de partic-
ipantes, por exemplo 200 a 300 participantes; (vi ) Permitir
a hierarquiza¸ c˜ao ou outra forma de agrupamento da per-
guntas; (vii ) Usar sistema de multi-agente para modera¸c˜ao;
e (viii ) Incluir os participantes remotos para elabora¸c˜ao e
apoio as perguntas.
Agradecimentos
Ao DCC pelo disponibiliza¸ c˜ao da infra-estrutura computa-
cional. Aos alunos da turma A-2011/1 de TES-03 - SQL,
volunt´arios por participar dos experimentos. Agradecemos
tamb´em aos revisores anˆonimos pelos coment´arios e sug-
est˜ oes durante a elabora¸c˜ao e revis˜ ao do artigo.
7. REFERENCES
[1] C. D. M. Berkenbrock and C. M. Hirata.
Implementacao e an´ alise de uso de uma aplica¸c˜ao para
edicao cooperativa em dispositivos moveis. Sistemas
Colaborativos, Simp´osio Brasilerio de, 0:99–110, 2008.
[2] C. D. M. Berkenbrock, C. M. Hirata, C. T. Fernandes,
and M. C. Pichiliani. Usability requirements for the
development and evaluation of mobile groupware
systems. In SBSC ’09: Proceedings of the 2009
Simp´ osio Brasileiro de Sistemas Colaborativos, pages
10–18, Washington, DC, USA, 2009. IEEE Computer
Society.
[3] M. Esponda. Electronic voting on-the-fly with mobile
devices. In ITiCSE ’08: Proceedings of the 13th annual
conference on Innovation and technology in computer
science education, pages 93–97, New York, NY, USA,
2008. ACM.
[4] P. Luff and C. Heath. Mobility in collaboration. In
CSCW ’98: Proceedings of the 1998 ACM conference
on Computer supported cooperative work, pages
305–314, New York, NY, USA, 1998. ACM.
[5] J. Rabin and C. McCathieNevile. Mobile web best
practices 1.0, 2011.
[6] J. Roth. Seven challenges for developers of mobile
groupware. In IN: WORKSHOP: MOBILE AD HOC
COLLABORATION, CHI 2002, 2002.
[7] S.-J. Yu and T. Selker. Who said what when?:
capturing the important moments of a meeting. In CHI
EA ’10: Proceedings of the 28th of the international
conference extended abstracts on Human factors in
computing systems, pages 3283–3288, New York, NY,
USA, 2010. ACM.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 82 -

S E S S Ã O 4
Ferramentas e Desenvolvimento de
Sistemas Colaborativos
Adicionando informações de contexto de tarefa a uma
ferramenta de chat síncrono para apoiar o
desenvolvimento distribuído de software
Ana Paula Chaves
Coord. Tecn. em Sistemas
para Internet (COINT)
UTFPR – Campo Mourão - PR
anachaves@utfpr.edu.br
Igor Scaliante Wiese
Coord. Tecn. em Sistemas
para Internet (COINT)
UTFPR – Campo Mourão - PR
igor@utfpr.edu.br
Igor Steinmacher
Coord. Tecn. em Sistemas
para Internet (COINT)
UTFPR – Campo Mourão - PR
igorfs@utfpr.edu.br
Fabio Baia
UTFPR – Campo Mourão-PR
baiacfabio@gmail.com
Edilson F. da Costa
UTFPR – Campo Mourão-PR
edilsonfc@gmail.com
Karen Moreschi
UTFPR – Campo Mourão-PR
karenmoreschi@gmail.com
Cicero Jupi
UTFPR – Campo Mourão-PR
cicerojupi@gmail.com
Marco Aurélio Gerosa
Departamento de Ciência
da Computação(DCC-IME)
Univ. de São Paulo (USP)
gerosa@ime.usp.br
ABSTRACT
Communication is one of the challenges brought by the ap-
proach called Distributed Software Development (DSD). One
way to improve communication is to make members of a
conversation aware of other developer’s context. This paper
presents a synchronous chat tool to support DSD, by sharing
the developer’s context automatically. The tool is presented
as an Eclipse plugin, and the information shared is related
to the code piece in which the developer is working.
RESUMO
A comunica¸c˜ao ´e um dos desafios trazidos pela abordagem
chamada Desenvolvimento Distribu´ıdo de Software (DDS).
Uma das maneiras de melhorar a comunica¸c˜ao ´e possibili-
tar que, durante uma intera¸ c˜ao, os membros de uma con-
versa fiquem cientes do contexto da outra parte. Este artigo
apresenta uma ferramenta de chat s´ıncrono para apoiar o
DDS, compartilhando o contexto da tarefa do desenvolve-
dor. A ferramenta ´e apresentada como um plugin para a IDE
Eclipse, e as informa¸ c˜oes compartilhadas dizem respeito ao
trecho de c´ odigo em que o desenvolvedor est´a trabalhando.
Palavras-chave
Desenvolvimento Distribu´ıdo de Software, comunica¸ c˜ao, con-
texto
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
Copyright 2011 ACM X-XXXXX-XX-X/XX/XX ...$10.00.
1. INTRODUÇÃO
A ind´ ustria de desenvolvimento de software vem utili-
zando os benef´ıcios trazidos pelo trabalho cooperativo apoi-
ado por computador (CSCW) para obter as vantagens com-
petitivas em termos de custo, qualidade e da possibilidade de
encontrar profissionais em qualquer parte do globo [18]. Esta
abordagem, chamada Desenvolvimento Distribu´ıdo de Soft-
ware (DDS), ´e baseada em equipes geograficamente distantes
trabalhando colaborativamente em um projeto de software.
Entretanto, as vantagens s˜ao acompanhadas de desafios re-
lacionados a diferen¸cas culturais, contextuais, geogr´ aficas,
organizacionais e pol´ıticas [13].
Dentre os desafios, destacam-se aqueles relacionados `a co-
munica¸c˜ao, como a distˆancia temporal e geogr´afica dos de-
senvolvedores [12]. Segundo Herbsleb [11], problemas na
comunica¸ c˜ao em DDS podem levar ´ a falta de percep¸c˜ao e
falta de informa¸c˜ao sobre quem pode ajudar em uma tarefa,
ou quem ´e respons´avel por executar uma tarefa. Isto acon-
tece porque desenvolvedores em locais diferentes de trabalho
percebem pequenas partes do contexto relacionado `as tare-
fas e ao projeto em que est˜ao trabalhando. Com isso, eles
passam a desconhecer o contexto da tarefa dos outros mem-
bros e a disponibilidade para iniciar uma conversa. A falta
de informa¸ c˜ao contextual dificulta o in´ıcio de uma intera-
¸c˜ao, pois a necessidade de compartilhar o contexto em que
o problema ser´ a discutido pode tornar a comunica¸c˜ao um
processo moroso, adiando a discuss˜ ao do t´ opico principal.
Portanto, ´e necess´ario propor abordagens pr´aticas para
estabelecer comunica¸ c˜ao a partir da percep¸c˜ao do contexto
de uma tarefa. Este artigo apresenta uma ferramenta de
chat s´ıncrono que objetiva melhorar a comunica¸c˜ao por meio
do compartilhamento de informa¸ c˜oes contextuais da tarefa
em que o desenvolvedor est´ a trabalhando. Tal ferramenta ´e
apresentada na forma de um plugin para o ambiente de de-
senvolvimento Eclipse, evitando que o desenvolvedor neces-
site mudar o foco de aten¸c˜ao, e permitindo que o protocolo
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 84 -
de in´ıcio da intera¸c˜ao seja simplificado. As informa¸c˜oes com-
partilhadas dizem respeito ao c´ odigo fonte em que o desen-
volvedor est´ a trabalhando no momento. A ferramenta est´ a
em fase de desenvolvimento e um experimento est´ a sendo
conduzido a fim de avaliar seu uso.
O restante deste artigo est´a estruturado da seguinte forma:
a Se¸c˜ao 2 discute a comunica¸ c˜ao em DDS e apresenta alguns
trabalhos relacionados; a Se¸c˜ao 3 apresenta a ferramenta de
chat s´ıncrono proposta para apoiar desenvolvedores em ce-
n´arios de DDS; e a Se¸c˜ao 4 apresenta a conclus˜ao deste artigo
e os trabalhos futuros.
2. REFERENCIAL TEÓRICO
2.1 Comunicação em DDS
Membros de uma equipe de software podem colaborar de
diferentes formas, tais como: chamadas telefˆonicas, fax, ins-
tant messaging, videocoferˆencia e email. Segundo Paasiva-
ara [14], estas pr´aticas s˜ao utilizadas para apoiar necessida-
des de comunica¸ c˜ao em DDS: resolu¸c˜ao de problemas, cons-
tru¸ c˜ao de relacionamento, tomada de decis˜ao e coordena¸c˜ao.
No entanto, alguns desafios precisam ser enfrentados como
o design das ferramentas que n˜ao facilitam sua ado¸c˜ao [21].
Al´em disso, as ferramentas de comunica¸c˜ao n˜ao s˜ ao aprovei-
tadas pelos desenvolvedores em alguns casos. Muitas vezes,
apesar da disponibilidade das ferramentas, os desenvolvedo-
res n˜ao comunicam as altera¸c˜oes feitas durante o dia para
outros membros da equipe dispersos geograficamente [16],
resultando em repeti¸c˜ao de trabalho e desperd´ıcio de tempo
[17].
De acordo com Cockburn [5], as pessoas nem sequer sabem
o que desejam comunicar na maioria dos casos. Assim, ´e im-
portante pensar em integrar ferramentas ao contexto atual
da tarefa, com o objetivo de evitar comunica¸c˜ao desnecess´ a-
ria e minimizar o risco de informa¸ c˜oes serem propagadas de
forma incorreta ou incompleta.
Para Carmel et. al [3], a comunica¸c˜ao s´ıncrona pode resol-
ver falhas de comunica¸c˜ao, mal-entendidos e pequenos pro-
blemas antes que se tornem maiores. Um pequeno problema
pode levar muito tempo para ser resolvido com discuss˜oes
por meio ass´ıncrono (e.g. email), mas uma breve conversa
s´ıncrona pode esclarecer rapidamente o problema. Assim,
a comunica¸ c˜ao ass´ıncrona, muitas vezes pode gerar atrasos
para a resolu¸ c˜ao de problemas. Como a codifica¸c˜ao ´e uma
tarefa dinˆamica que necessita de resolu¸c˜ao r´apida, isto de-
manda intera¸c˜ao entre os envolvidos, justificando a necessi-
dade de meios s´ıncronos para apoi´ a-la.
2.2 Trabalhos relacionados
Existem na literatura v´arias ferramentas e arquiteturas
que tem como um de seus objetivos melhorar a comunica-
¸c˜ao para cen´ arios de DDS, como observado em [23]. Uma
ferramenta de tickertape (uma esp´ecie de barra de status
que exibe mensagens de eventos) foi introduzida em [8] para
mostrar mensagens de commits em CVS (Concurrent Ver-
sion System) para os membros de um projeto, possibilitando
que estes iniciem um chat privado ou em grupo dentro do
contexto da mensagem inserida no CVS. Communico [6]
´e uma ferramenta que apresenta mecanismos de percep¸c˜ao
para possibilitar que participantes vejam discuss˜oes em an-
damento ou passadas, saibam quem est´a conversando e o
n´ıvel de conhecimento desses indiv´ıduos. Jazz [4] inclui uma
ferramenta de chat para que desenvolvedores incluam links
para transcri¸c˜oes de chats anteriores e para as notifica¸c˜oes
de eventos das equipes. Uma extens˜ao da ferramenta Jazz,
chamada COFFEE [2], oferece uma ferramenta de discuss˜ao,
incorporado na IDE Eclipse, possibilita que os desenvolvedo-
res conduzam discuss˜oes categorizadas dentro do ambiente
de desenvolvimento. EGRET [22] tamb´em oferece um chat
contextualizado e ferramentas de email que facilitam a inser-
¸c˜ao autom´ atica ou manual de links naveg´ aveis para artefatos
relevantes nas mensagens.
Outros trabalhos ([7, 24, 1, 15]) apresentam ferramentas
de chat s´ıncrono como parte de ambientes de DDS mais
completos, que oferecem diversas facilidades para equipes
distribu´ıdas. Por´em as ferramentas de chat s˜ ao forneci-
das na forma de instant messengers tradicionais (como o
Same-time, MSN, jabber), sem qualquer tipo de altera¸c˜ao
que possa contribuir para tornar a comunica¸ c˜ao mais f´acil e
mais efetiva em ambientes de DDS.
Existem alguns outros estudos com foco na fase de codi-
fica¸ c˜ao, em especial para apoiar a pr´atica de programa¸c˜ao
em pares em equipes distribu´ıdas, possibilitando aos desen-
volvedores cooperar sobre um determinado trecho de c´odigo
([9, 20, 19, 10]). Essas ferramentas geralmente oferecem
formas dos desenvolvedores se comunicarem, exibindo seus
pap´eis na intera¸c˜ao e outras informa¸c˜oes relevantes ao de-
senvolvimento em pares (como edi¸c˜ao s´ıncrona de c´odigo e
compartilhamento de tela).
Os trabalhos apresentados apontam iniciativas para facili-
tar a comunica¸c˜ ao em DDS e at´e mesmo para compartilhar
o contexto em mensagens. Por´em, essas iniciativas s˜ao ge-
ralmente integradas a ambientes mais complexos, cujo foco ´e
mais amplo do que a comunica¸c˜ao em si. Foram identificadas
outras pesquisas que tratam de mecanismos de comunica¸c˜ao
para metodologias de desenvolvimento espec´ıficas, como ´e o
caso do XP (eXtreme Programming). No entanto, n˜ao foram
encontrados estudos que apresentem ferramentas espec´ıficas
para comunica¸ c˜ao, independentes de outras funcionalidades
ou recursos, e que ofere¸cam o compartilhamento do contexto
da intera¸ c˜ao de maneira simples.
3. FERRAMENTA PROPOSTA
Nesta se¸ c˜ao, ser´a apresentada a ferramenta proposta no
presente artigo. Ela consiste em um chat s´ıncrono para de-
senvolvedores, criado como um plugin para o ambiente de
desenvolvimento Eclipse, como pode ser verificado na Fi-
gura 1. A ferramenta foi desenvolvida como uma evolu¸ c˜ao
ao plugin EIMP
1
, j´a existente no SourceForge.
A ferramenta apresenta-se como uma View do ambiente
de desenvolvimento, e sua interface ´e semelhante `a de um
chat s´ıncrono tradicional, conforme apresentado na Figura
2. Os contatos aparecem em uma lista ordenada por nome,
apresentando o status de cada um deles. At´e o momento, os
status poss´ıveis s˜ ao desconectado (branco), ausente (ama-
relo), ocupado (vermelho) e dispon´ıvel (verde).
A principal caracter´ıstica da ferramenta ´e possibilitar que,
ao iniciar as intera¸ c˜oes, o contexto da tarefa do desenvolve-
dor seja automaticamente compartilhado com a outra parte.
Isto ´e feito a partir do envio de uma mensagem autom´ atica
no momento em que o chat ´e iniciado. Essa mensagem con-
t´em os nomes do projeto, da classe e do m´etodo (apresen-
tando o local do c´ odigo que est´a selecionado) onde o foco
de trabalho do usu´ ario que iniciou a intera¸c˜ao est´a ativo
1
http://sourceforge.net/projects/eimp
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 85 -
Figure 1: Ambiente Eclipse com a ferramenta de chat e uma mensagem contendo informa¸c˜ oes de contexto
enviada automaticamente
Figure 2: Apresenta¸c˜ao da lista de contatos e status
(Figura 1). Com essas informa¸c˜oes sendo enviadas automa-
ticamente, pretende-se que haja uma economia de tempo no
in´ıcio da comunica¸ c˜ao. Isto deve ocorrer uma vez que s˜ao
deixados de lado os passos iniciais do protocolo formal de
comunica¸c˜ao, tornando a outra parte ciente do contexto da
tarefa em que o desenvolvedor se encontra.
Durante a conversa, ´e poss´ıvel solicitar o compartilha-
mento do local em que o desenvolvedor est´a focado. Isto ´e
feito a partir de um menu pop-up, clicando na op¸c˜ao “Share
my context”. Isto permite que, se solicitado, o desenvolve-
dor possa informar `a outra parte o local exato em que est´ a
trabalhando. Neste caso, se um trecho de c´odigo estiver
selecionado, o texto ´e compartilhado no chat (Figura 3).
4. CONCLUSÃOETRABALHOS FUTUROS
O presente artigo apresentou uma ferramenta que tem por
objetivo melhorar a comunica¸c˜ao por meio do compartilha-
mento de informa¸ c˜oes contextuais. Tal ferramenta ´e apre-
Figure 3: (a) Menu popup que permite o compar-
tilhamento de contexto e (b) mensagem comparti-
lhada via chat
sentada na forma de um plugin para o ambiente de desen-
volvimento Eclipse, evitando que o desenvolvedor necessite
mudar o foco da aten¸ c˜ao. O compartilhamento de contexto
oferecido pela ferramenta visa, primordialmente, melhorar
a comunica¸ c˜ao e a coordena¸c˜ao entre membros de equipes
geograficamente dispersas. Tal melhoria ´e obtida uma vez
que o fluxo de comunica¸ c˜ao ´e iniciado por uma mensagem
padronizada, conhecida pelas partes envolvidas na conversa.
Isso possibilita que as primeiras mensagens trocadas j´a di-
gam respeito `a tarefa em que os usu´arios est˜ao trabalhando,
tornando a comunica¸ c˜ao mais r´apida e efetiva.
Atualmente a ferramenta est´ a em fase de desenvolvimento
e est´a sendo utilizada pela equipe que realizou seu desenvol-
vimento. Est˜ ao sendo incorporadas novas funcionalidades e
modos de apresenta¸ c˜ao das informa¸c˜oes. Paralelo a isso, um
experimento em ambiente acadˆemico controlado est´a sendo
preparado para verificar se a ferramenta atende aos obje-
tivos propostos. Ao final do experimento, um question´ario
ser´ a aplicado aos participantes visando descobrir os reais
benef´ıcios e aplica¸c˜oes da ferramenta.
´
E importante observar que os dados compartilhados por
meio da ferramenta n˜ao formam um conjunto exaustivo de
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 86 -
poss´ıveis informa¸c˜oes contextuais. Outros dados relaciona-
dos `as tarefas do desenvolvedor podem ser utilizadas para
aumentar a percep¸ c˜ao dos membros da equipe sobre o tra-
balho colaborativo. Para tanto, faz-se necess´ario mapear as
informa¸c˜oes contextuais que necessitam ser compartilhadas
para melhorar este cen´ario. Pretende-se, al´em dos dados so-
bre o c´odigo propriamente dito, coletar informa¸ c˜oes relativas
ao relacionamento do desenvolvedor com o ambiente e com
o projeto (por exemplo, tempo de intera¸c˜ao com a classe,
tempo que trabalha com o projeto, quantidade de contribui-
¸c˜oes etc.). Por fim, pretende-se, de acordo com as informa-
¸c˜oes de contexto obtidas, recomendar intera¸c˜oes com outros
membros da equipe que melhor se adequem `a situa¸ c˜ao.
5. REFERÊNCIAS
[1] H. Bani-Salameh, C. Jeffery, Z. Al-Sharif, and
I. Abu Doush. Integrating collaborative program
development and debugging within a virtual
environment. In Groupware: Design, Implementation,
and Use, volume 5411 of LNCS, pages 107–120.
Springer Berlin, 2008.
[2] F. Belgiorno, I. Manno, G. Palmieri, and V. Scarano.
Argumentation tools in a collaborative development
environment. In Cooperative Design, Visualization,
and Engineering, volume 6240 of LNCS, pages 39–46.
Springer Berlin, 2010.
[3] E. Carmel and R. Agarwal. Tactical approaches for
alleviating distance in global software development.
IEEE Software, 18(2):22–29, March 2001.
[4] L.-T. Cheng, S. Hupfer, S. Ross, and J. Patterson.
Jazzing up eclipse with collaborative tools. In
Proceedings of the 2003 OOPSLA workshop on eclipse
technology eXchange, pages 45–49, Anaheim,
California, 2003. ACM.
[5] H. Cockburn. Agile software development.
Addison-Wesley Professional, Boston, MA, 2002.
[6] K. Dullemond, B. van Gameren, and R. van Solingen.
Virtual open conversation spaces: Towards improved
awareness in a gse setting. pages 247–256, aug. 2010.
[7] R. Duque, M. L. Rodr´ıguez, M. V. Hurtado, C. Bravo,
and C. Rodr´ıguez-Dom´ınguez. Integration of
collaboration and interaction analysis mechanisms in a
concern-based architecture for groupware systems.
Science of Computer Programming, 2010.
[8] G. Fitzpatrick, P. Marshall, and A. Phillips. Cvs
integration with notification and chat: lightweight
software team collaboration. In Proceedings of the
2006 20th anniversary conference on Computer
supported cooperative work, pages 49–58, Banff,
Alberta, Canada, 2006. ACM.
[9] B. Hanks. Empirical evaluation of distributed pair
programming. International Journal of Human
Computer Studies, 66(7):530–544, 2008.
[10] R. Hegde and P. Dewan. Connecting programming
environments to support ad-hoc collaboration. In ASE
2008 - 23rd IEEE/ACM International Conference on
Automated Software Engineering, Proceedings, pages
178–187, 2008.
[11] J. D. Herbsleb. Global software engineering: The
future of socio-technical coordination. In 2007 Future
of Software Engineering, pages 188–198, Washington,
DC, USA, 2007. IEEE Computer Society.
[12] J. D. Herbsleb and D. Moitra. Guest editors’
introduction: Global software development. IEEE
Software, 18:16–20, 2001.
[13] M. Ivcek and T. Galinac. Aspects of quality assurance
in global software development organization. In 31st
International Convention MIPRO, pages 150–155,
2008.
[14] M. Paasivaara. Communication needs, practices and
supporting structures in global inter-organizational
software development projects. 2003.
[15] V. Penichet, J. Gallud, R. Tesoriero, and M. Lozano.
Design and evaluation of a service oriented
architecture-based application to support the
collaborative edition of uml class diagrams. In
Computational Science - ICCS 2008, volume 5103 of
LNCS, pages 389–398. Springer Berlin, 2008.
[16] R. Prikladnicki, J. Audy, and R. Evaristo. Distributed
software development: Toward an understanding of
the relationship between project team, users and
customers. In Proceedings of International Conference
on Enterprise Information Systems (ICEIS), Angers,
France, 2003.
[17] V. Ramesh and A. Dennis. The object-oriented team:
Lessons for virtual teams from global software
development. In System Sciences, 2002. HICSS.
Proceedings of the 35th Annual Hawaii International
Conference on, pages 212 – 221, 2002.
[18] M. Robinson and R. Kalakota. Offshore Outsourcing:
Business Models, ROI and Best Practices. Mivar
Press, Georgia, 2004.
[19] S. Salinger, C. Oezbek, K. Beecher, and J. Schenk.
Saros: an eclipse plug-in for distributed party
programming. In CHASE ’10: Proceedings of the 2010
ICSE Workshop on Cooperative and Human Aspects
of Software Engineering, pages 48–55, Cape Town,
South Africa, 2010. ACM.
[20] T. Schuemmer and S. Lukosch. Supporting the social
practices of distributed pair programming. In
Groupware: Design, Implementation, and Use, volume
5411 of LNCS, pages 83–98. Springer Berlin, 2008.
[21] N. S. Shami, N. Bos, Z. Wright, S. Hoch, K. Y. Kuan,
J. Olson, and G. Olson. An experimental simulation of
multi-site software development. In Proceedings of the
2004 conference of the Centre for Advanced Studies on
Collaborative research, pages 255–266, Markham,
Ontario, Canada, 2004. IBM Press.
[22] V. Sinha, B. Sengupta, and S. Chandra. Enabling
collaboration in distributed requirements
management. IEEE Software, 23(5):52–61, 2006.
[23] I. Steinmacher, A. P. Chaves, and M. A. Gerosa.
Awareness support in global software development: a
systematic review based on the 3c collaboration
model. In 16th international conference on
Collaboration and technology, CRIWG’10, pages
185–201, Berlin, 2010. Springer-Verlag.
[24] M.-A. D. Storey, D.
ˇ
Cubrani´c, and D. M. German. On
the use of visualization to support awareness of human
activities in software development: a survey and a
framework. In Proceedings of the 2005 ACM
symposium on Software visualization, pages 193–202,
St. Louis, Missouri, 2005. ACM.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 87 -
Desenvolvimento e Implantação de uma Ferramenta de
Apoio a Reuniões Presenciais
Daniel Catarino Biscalchin
Instituto de Computação/UNICAMP
Campinas, Brasil
Bolsista do CNPq - Brasil
danielbiscalchin@gmail.com
Jacques Wainer
Insitituto de Computaçao/UNICAMP
Campinas, Brasil
wainer@ic.unicamp.br
ABSTRACT
Meetings play an important role within organizations, and
they are the means by which many decisions are taken. Al-
lowing participants to contribute in a satisfactory manner, as
well as keep costs (of time and money) low are challenges to
meeting organizers. Technology seeks to make this task eas-
ier through meeting support systems (meetingware), which
provide the means to improve the interaction between par-
ticipants and the use of resources. In this work, we devel-
oped a software for supporting face to face meetings based
on Robert’s Rules of Order, rules created in the nineteenth
century and used to direct formal meetings in various or-
ganizations. The software provides features designed to en-
hance the progress of meetings and interaction of its partici-
pants, as the result of automating administrative tasks such
as preparation of the minutes. Currently, the system has a
version developed and is being used by the Congregation of
the Computing Institute at UNICAMP. Data collected from
meetings using the software will be confronted with data al-
ready obtained before the use of the system. In addition,
after implantation questionnaires will be used to assess user
satisfaction.
RESUMO
Reuni˜oes desempenham um importante papel dentro de or-
ganiza¸ c˜oes, sendo o meio pelo qual s˜ ao tomadas diversas de-
cis˜oes. Permitir que seus participantes contribuam de forma
satisfat´oria, assim como evitar que seus custos (tempo e din-
heiro) sejam maiores que o necess´ ario s˜ ao desafios de seus
organizadores. A tecnologia busca tornar esta tarefa mais
f´acil atrav´es de sistemas para suporte a reuni˜oes (meeting-
ware), que fornecem meios para melhorar a intera¸c˜ao entre
os participantes e o aproveitamento dos recursos utilizados.
Neste trabalho, desenvolvemos um software para suporte a
reuni˜oes presenciais baseadas nas Robert’s Rules of Order,
regras criadas no s´eculo XIX e usadas para direcionar re-
uni˜oes formais em v´arias organiza¸c˜oes. A ferramenta fornece
recursos que visam aprimorar o andamento de reuni˜oes e
a intera¸ c˜ao de seus participantes, assim como automatizar
tarefas burocr´aticas resultantes desta, como a elabora¸ c˜ao da
ata. Atualmente, o sistema possui um vers˜ao desenvolvida e
est´ a em fase de implanta¸c˜ao nas reuni˜oes da Congrega¸c˜ao do
Instituto de Computa¸ c˜ao. Dados coletados das reuni˜oes uti-
lizando o software ser˜ao confrontados com dados j´a obtidos
antes de sua implanta¸c˜ao, como os tempos despendidos com
os itens da pauta. Al´em disso, ap´ os a implanta¸ c˜ao ser˜ ao uti-
lizados question´arios para avaliar a satisfa¸c˜ao dos usu´arios.
Categories and Subject Descriptors
H.4.1 [INFORMATION SYSTEMS APPLICATIONS]:
Groupware; H.5.3 [INFORMATION INTERFACES AND
PRESENTATION]: Group and Organization Interfaces
General Terms
Experimentation
Keywords
Meetingware, design, avalia¸c˜ao
1. INTRODUÇÃO
Reuni˜oes s˜ao essenciais para organiza¸ c˜oes, pois, por meio de-
las, s˜ao tomadas importantes decis˜ oes e feitos planejamen-
tos. No entanto, elas podem ter um custo elevado para a
empresa, uma vez que, se mal conduzidas, acarretam em um
grande desperd´ıcio de tempo e dinheiro. A tecnologia pode
contribuir para o aumento da eficiˆencia das reuni˜oes, ou seja,
para que elas ocorram em menos tempo e que todos os par-
ticipantes cumpram seus pap´eis de forma satisfat´ oria e, por
isso, cada vez mais empresas e pesquisadores tˆem se interes-
sado por sistemas de suporte a reuni˜oes (ou meetingware),
alguns dos quais s˜ao voltados a reuni˜oes ` a distˆ ancia – po-
dendo possuir recursos de v´ıdeo conferˆencia ou, at´e mesmo,
gr´aficos 3D – enquanto outros tˆem como foco as reuni˜ oes
presenciais (caso da ferramenta proposta neste projeto).
Desde o final da d´ecada de 1980, diversas pesquisas foram
realizadas para desenvolver sistemas capazes de tornar re-
uni˜oes mais eficientes e, tamb´em, para avaliar tais sistemas
quanto `a satisfa¸c˜ao dos usu´ arios. Em 1991, o artigo [6]
propˆos o termo electronic meeting system (ou apenas EMS)
para referir-se a sistemas computacionais com o prop´ osito
de melhorar os processos de reuni˜oes. Al´em disso, neste
mesmo artigo, os autores contam que desenvolveram uma
variedade de softwares com este prop´osito, os quais foram
testados por milhares de indiv´ıduos. Ao final do projeto, os
autores identificaram alguns aspectos importantes no pro-
jeto de EMS e conclu´ıram que tais sistemas, podem, em
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 88 -
muitas situa¸c˜oes, contribuir para a melhora do processo, mas
reconheceram a necessidade de pesquisa posterior. Desde en-
t˜ao, mais pesquisadores interessaram-se pelo assunto e mais
pesquisa foi desenvolvida com o intuito de reconhecer qual-
idades importantes neste tipo de software, e tamb´em, para
desenvolver m´etodos eficientes de avalia¸c˜ ao dos mesmos. A
referˆencia [1] busca identificar tais aspectos relevantes destes
softwares e apresentar modelos para inserir estas caracter´ıs-
ticas no software. J´a as referˆencias [7, 5, 2] tˆem o seu foco
na avalia¸ c˜ao das ferramentas.
A avalia¸c˜ao de ferramentas colaborativas ´e um assunto com-
plexo [7, 5, 2], pois h´a v´arias dimens˜ oes a serem avaliadas.
Na dimens˜ao pessoal, os usu´arios devem“gostar”ou“sentirem-
se a vontade” em usar o software [3]. Nesta dimens˜ao, as
quest˜oes de usabilidade do software colaborativo n˜ao s˜ ao
diferentes das de um software comum. Numa segunda di-
mens˜ao, um software colaborativo deve facilitar a execu¸c˜ao
de uma atividade colaborativa, nesse caso uma reuni˜ao [4,
8]. Desta forma, o software deve trazer ganhos “para os
objetivos” da atividade colaborativa. No caso de reuni˜oes,
h´a v´arios objetivos: decis˜ oes “mais corretas”, menor tempo
gasto na reuni˜ao, explora¸ c˜ao melhor das alternativas, medi-
a¸c˜ao de diferentes pontos de vista, difus˜ao de tens˜oes, etc.
Finalmente, a outra dimens˜ ao relevante para a avalia¸c˜ao de
ferramentas colaborativas ´e a melhoria ou a manuten¸c˜ao do
ambiente social do grupo.
O software desenvolvido neste projeto tem como foco as re-
uni˜oes presenciais baseadas nas Robert’s Rules of Order,
usadas para direcionar reuni˜oes formais em v´arias organi-
za¸c˜ oes. Acreditamos que o fato de nossa ferramenta ser
baseada nestas regras representa um diferencial para a mesma,
j´a que a maioria das ferramentas para suporte eletrˆonico a
reuni˜oes desenvolvidas at´e hoje seguem um prot´otipo em que
os participantes interagem a maior parte do tempo atrav´es
do software, perdendo, assim, um pouco do car´ ater presen-
cial da reuni˜ ao.
Outro aspecto importante da ferramenta desenvolvida ´e que
ela visa n˜ao apenas a melhorar o andamento de reuni˜ oes,
como tamb´em `a automatiza¸ c˜ao de tarefas burocr´aticas ap´os
seu t´ermino, j´a que estas tarefas tamb´em demandam bas-
tante tempo, embora muitas vezes esse custo n˜ao receba a
devida aten¸c˜ao. O software pode preencher informa¸c˜oes co-
muns a diversas atas, como hor´ arios de in´ıcio e t´ermino,
assuntos debatidos e resultados de vota¸c˜oes, cabendo a um
usu´ ario humano apenas a tarefa de preencher alguns poucos
dados.
Ap´os o desenvolvimento do software, ocorre sua implanta¸c˜ao
em reuni˜ oes reais. Ent˜ao, tem in´ıcio a fase de avalia¸c˜ao, na
qual, atrav´es de m´etodos quantitativos e qualitativos, verifi-
camos a efic´acia da ferramenta proposta. Esta efic´acia deve
levar em considera¸c˜ao n˜ ao apenas medidas como tempo de
dura¸c˜ao das reuni˜oes, mas tamb´em a satisfa¸c˜ ao dos usu´ arios
e a qualidade de suas interven¸c˜oes nas reuni˜oes.
2. MÉTODOS
2.1 Desenvolvimento
A aplica¸c˜ao Web proposta foi desenvolvida dentro do paradigma
de Orienta¸c˜ ao a Objetos, buscando representar de forma
modular aspectos importantes deste tipo de software, assim
como em [1]. Dentre os principais componentes represen-
tados no software, est˜ao os recursos da reuni˜ao (pauta, ata,
etc.), pap´eis dos participantes e as etapas da reuni˜ao (etapas
do processo).
Os pap´eis envolvidos no tipo de reuni˜ao abordado s˜ao presi-
dente, secret´ aria e participante ativo. O primeiro representa
a figura do l´ıder, coordenando o andamento da reuni˜ ao e,
em casos excepcionais, tomando decis˜oes relativas ao seu
rumo; o segundo, ´e respons´ avel por tomar nota dos acon-
tecimentos, al´em de elaborar tanto a pauta, quanto a ata;
j´a o terceiro corresponde `aqueles que participam ativamente
da reuni˜ ao, agregando informa¸c˜oes atrav´es de interven¸c˜oes,
como coment´ arios e votos.
Como foi dito, as reuni˜ oes em quest˜ao seguem regras con-
hecidas como Robert’s Rules of Order. Este tipo de reuni˜ao
´e dividido em trˆes grandes etapas: Ata da Reuni˜ao, Expe-
diente e Ordem do Dia. Estas etapas ocorrem nesta ordem
durante a reuni˜ ao e est˜ao claramente indicadas na pauta,
cada uma contendo seus pr´ oprios itens.
Na Ata da Reuni˜ ao, s˜ao aprovadas atas de reuni˜oes anteri-
ores. Nesta etapa, cada ata corresponde a um item na pauta
e os participantes podem intervir sugerindo modifica¸c˜oes ou
corre¸ c˜oes. Caso uma ata n˜ ao seja aprovada, ela ser´a sub-
metida ` a aprova¸c˜ao novamente, na reuni˜ao seguinte, ap´ os
terem sido feitas as modifica¸c˜oes necess´ arias.
Durante o Expediente, s˜ao discutidos assuntos relevantes
para a congrega¸ c˜ao que n˜ ao precisam ser submetidos ` a vota¸c˜ao.
Normalmente, o presidente inicia esta etapa passando alguns
informes e, ent˜ao, os demais participantes tamb´em podem
expressar sobre os assuntos.
J´a a Ordem do Dia inicia-se com o destaque de seus itens.
Tanto a mesa, representada pela figura do presidente, quanto
os demais participantes podem selecionar itens da Ordem do
Dia para que estes sejam submetidos a uma aprecia¸c˜ao antes
de serem votados. Os itens n˜ao destacados s˜ ao votados em
bloco logo em seguida, enquanto os outros s˜ao discutidos e
votados seguindo a sequˆencia da pauta.
Para o desenvolvimento do software, utilizou-se a linguagem
de programa¸ c˜ao Python, juntamente do framework Cher-
ryPy, escrito nesta mesma linguagem, para executar a l´ ogica
do servidor. A interface Web baseou-se em HTML, CSS e
JavaScript, tamb´em respons´avel pela l´ogica do cliente. Para
cria¸ c˜ao da interface tamb´em foi utilizada a linguagem Gen-
shi, para cria¸c˜ao de templates.
2.2 Implantação e Avaliação
A implanta¸ c˜ao do sistema nas reuni˜oes da congrega¸ c˜ao do
Instituto de Computa¸c˜ao da UNICAMP teve in´ıcio em abril
de 2011. Futuramente, o sistema ser´ a avaliado atrav´es de
an´alises quantitativas e qualitativas.
Para a an´alise quantitativa, ser˜ao obtidos os valores de di-
versos parˆametros ao longo de v´arias reuni˜ oes e, ent˜ao, estes
valores ser˜ao comparados com aqueles referentes ao per´ıodo
anterior ` a utiliza¸ c˜ao da aplica¸ c˜ao. Dentre estes parˆametros,
est´ a o tempo m´edio de dura¸ c˜ao dos itens da pauta. Com
o ac´ umulo de v´arias reuni˜ oes, podemos comparar estes val-
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 89 -
ores para avaliar se o software torna o processo mais r´apido.
Al´em deste, outros parˆametros como o n´ umero e o tempo
das interven¸c˜oes tamb´em podem ser analisado.
J´ a a an´alise qualitativa ser´ a feita atrav´es do preenchimento
de question´arios pelos usu´arios, de forma a obter uma me-
dida da satisfa¸c˜ao dos mesmos. Esta avalia¸ c˜ao ´e importante
para estimar parˆametros subjetivos, como a qualidade das
interven¸c˜oes feitas.
3. O QUE JÁ FOI FEITO
Atualmente, h´a uma vers˜ao do sistema em funcionamento
nas reuni˜oes da Congrega¸c˜ao do Instituto de Computa¸c˜ao,
que ocorrem mensalmente. Esta vers˜ao permite que os usu´arios
entrem e saiam da fila para falar atrav´es do computador.
Al´em disso, tanto as vota¸c˜oes como os destaques (no in´ıcio
da Ordem do Dia) s˜ ao feitos atrav´es da aplica¸c˜ao. Tam-
b´em ´e apresentado um crˆ onometro ao participante que fala
e ao presidente da reuni˜ao, para que ambos possam contro-
lar melhor a utiliza¸c˜ao do tempo. Ap´os a reuni˜ao, uma ata
resumida ´e gerada, sendo necess´ario apenas que a secret´aria
preencha alguns detalhes.
A ata resumida ´e gerada com base em v´arios logs armazena-
dos pelo sistema durante a reuni˜ao. O software grava infor-
ma¸ c˜oes referentes ao momento de chegada e sa´ıda de partic-
ipantes, ao andamento do processo, `a evolu¸c˜ao da fila para
falar, al´em, ´e claro, dos votos e destaques. Estes dados tam-
b´em poder˜ao ser utilizados para a avalia¸ c˜ao do sistema.
A implanta¸ c˜ao do sistema tem sido bem recebida pelos usu´arios,
sendo que v´ arios, inclusive, sugeriram modifica¸c˜oes. Mesmo
aqueles que apresentavam certa desconfian¸ca mostraram-se
satisfeitos com as novas possibilidades de intera¸c˜ao, como
acompanhar, atrav´es do computador, as decis˜oes (votos, destaques,
etc.) dos outros participantes.
J´ a dando in´ıcio `a etapa de avalia¸c˜ao, foram obtidos os ´au-
dios de todas as reuni˜oes realizadas durante o ano de 2010
para medir os tempos gastos em determinados eventos das
reuni˜oes. Os tempos m´edios gastos nos itens de cada uma
das etapas (Ata da Reuni˜ ao, Expediente e Ordem do Dia)
j´a foram calculados e ser˜ao usados para compara¸c˜ao com
dados obtidos ap´ os a implanta¸ c˜ao do sistema. Arquivos de
´audio muito antigos n˜ao foram utilizados porque o formato
das reuni˜oes era diferente do atual, o que comprometeria a
avalia¸ c˜ao do sistema.
4. ETAPAS FUTURAS
Embora o desenvolvimento da vers˜ao inicial do software es-
teja completo, ainda est˜ao sendo feitos v´arios aprimoramen-
tos. Em breve, com uma vers˜ao mais madura, planejamos
elaborar um question´ ario de satisfa¸ c˜ao a ser respondido pe-
los usu´ arios. Posteriormente, para termos uma compreens˜ao
quantitativa dos objetivos alcan¸cados pela aplica¸c˜ao, fare-
mos um experimento comparando o tempo m´edio gasto por
item antes e depois de sua implanta¸c˜ao. J´a possu´ımos v´arias
medidas anteriores `a implanta¸ c˜ao, por´em, para fazer uma
compara¸c˜ao adequada, ainda ´e necess´ ario acumular mais
medidas ap´ os a implanta¸c˜ao.
Nossas espectativas para a avalia¸c˜ao s˜ ao de que as funcional-
idades implementadas contribuam para a diminui¸c˜ao da du-
ra¸c˜ao das reuni˜oes, assim como o aumento da satisfa¸ c˜ao dos
usu´ arios. Esta hip´ otese baseia-se, principalmente, em duas
funcionalidades relacionadas `as discuss˜oes: o cronˆ ometro e
a fila.
O cronˆ ometro ´e mostrado a um participante no momento
em que este come¸ca a falar. Apesar de n˜ao limitar o tempo
permitido de fala, j´a que ´e competˆencia do presidente encer-
rar a fala de um participante, acreditamos que a exibi¸c˜ao
do cronˆ ometro sirva como um alerta. Assim, ao notar que
bastante tempo transcorreu, um participante pode apressar-
se para encerrar sua fala. Al´em disso, ao ver que o tempo
de um participante ultrapassou um limite, o presidente da
reuni˜ao pode solicitar que este conclua seu racioc´ınio.
Por outro lado, a fila tamb´em dever´ a contribuir para a diminui¸ c˜ao
da dura¸c˜ao da reuni˜ ao, por´em de duas formas distintas. A
primeira delas ´e que, ao ver na fila que sua vez de falar est´a
aproximando-se, um participante pode preparar sua fala an-
tecipadamente. Desta forma ´e prov´ avel que, quando inciar
sua fala, o participante tenha maior facilidade para desen-
volver seu racioc´ınio, o que, possivelmente, diminuiria seu
tempo de fala. J´ a a segunda contribui¸ c˜ao estaria relacionada
ao tamanho da fila. Acreditamos que o fato de a fila es-
tar sendo exibida constantemente, desistimularia os partici-
pantes a entrar na fila quando esta estivesse muito grande.
Isto contribuiria para a agiliza¸ c˜ao da reuni˜ ao, uma vez que
menos participantes falariam.
5. AGRADECIMENTOS
Aos membros da Congrega¸c˜ao do Instituto de Computa¸ c˜ao,
que aceitaram utilizar o sistema, e aos funcion´ arios respon-
s´ aveis pela organiza¸ c˜ao das reuni˜oes, pelo apoio na implan-
ta¸c˜ ao.
6. REFERENCES
[1] P. Antunes, L. Carri¸ co, L. Laborat´orio, S. I. Gr,
E. Escala, and D. D. Inform´atica. Modeling the
information structures of meetingware. In In Proc. of
Workshop de Sistemas de Informao Multimdia e
Cooperativos (COOP-MEDIA’03, 2003.
[2] P. Antunes and C. J. Costa. Perceived value: A
low-cost approach to evaluate meetingware. In J. Favela
and D. Decouchant, editors, CRIWG, volume 2806 of
Lecture Notes in Computer Science, pages 109–125.
Springer, 2003.
[3] C. Gutwin and S. Greenberg. The mechanics of
collaboration: Developing low cost usability evaluation
methods for shared workspaces. In WETICE, pages
98–103. IEEE Computer Society, 2000.
[4] S. R. Haynes, S. Purao, and A. L. Skattebo. Situating
evaluation in scenarios of use. In J. D. Herbsleb and
G. M. Olson, editors, CSCW, pages 92–101. ACM,
2004.
[5] V. Herskovic, J. A. Pino, S. F. Ochoa, and P. Antunes.
Evaluation methods for groupware systems. In
CRIWG’07, pages 328–336, 2007.
[6] J. F. Nunamaker, A. R. Dennis, J. S. Valacich, D. R.
Vogel, and J. F. George. Electronic meeting systems to
support group work. Commun. ACM, 34(7):40–61,
1991.
[7] W. M. Post, M. H. in ’t Veld, and S. A. A. V. D.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 90 -
Boogaard. Evaluating meeting support tools. Personal
and Ubiquitous Computing, pages 223–235, 2008.
[8] O. Stiemerling and A. B. Cremers. The use of
cooperation scenarios in the design and evaluation of a
cscw system. IEEE Trans. Software Eng.,
24(12):1171–1181, 1998.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 91 -
Ambientes eParticipativos sob a ótica do modelo 3C de
colaboração
Cleyton Slaviero
Instituto de Computação -
Universidade Federal Fluminense
Rua Passo da Pátria, 156 – Bloco E
São Domingos – Niterói, RJ - Brasil
cslaviero@ic.uff.br
Ana Cristina Bicharra Garcia
Instituto de Computação -
Universidade Federal Fluminense
Rua Passo da Pátria, 156 – Bloco E
São Domingos – Niterói, RJ - Brasil
bicharra@ic.uff.br
Cristiano Maciel
Instituto de Computação –
Universidade Federal de Mato
Grosso
Av. Fernando Corrêa da Costa, nº
2367 - Bairro Boa Esperança. Cuiabá
- MT
cmaciel@ufmt.br
RESUMO
A participação online dos cidadãos em assuntos políticos é
realizada com o uso das Tecnologias de Informação e
Comunicação, como chats, fóruns de discussão, ferramentas de
votação, entre outros. Cidadãos são chamados a interagir entre si
e com o governo para discutir e deliberar sobre assuntos
realizando diversas atividades, formando ambientes de
eParticipação. É notável que estas atividades se assemelham
àquelas realizadas em ambientes colaborativos. No entanto,
pesquisas em eParticipação que versam sobre o aspecto
colaborativo na eParticipação são escassas. Neste artigo,
apresentamos as atividades de eParticipação sob a ótica do
modelo 3C de colaboração, classificando estas atividades em
coordenação, comunicação e colaboração, a fim de evidenciar
que um ambiente de eParticipação possui características de
sistemas colaborativos, chamando a atenção para investigações
que relacionem estas duas áreas.
Categories and Subject Descriptors
H.5.3. [Group and Organization Interfaces] Collaborative
Computing
General Terms
Design, Human Factors, Theory.
Keywords
eParticipação, Modelo 3C de colaboração, sistemas
colaborativos, ambientes de eParticipação.
1. INTRODUÇÃO
A participação dos cidadãos em assuntos de cunho
governamental é importante tanto para governo quanto para o
cidadão. O cidadão tem maior contato com assuntos de seu
interesse e tem sua voz ouvida, podendo opinar e votar demandas
que influenciem a sociedade. O governo é capaz de ouvir estes
cidadãos e adaptar estas demandas para trazer benefícios para a
sociedade.
Embora participar seja importante, os cidadãos podem enfrentar
obstáculos na tentativa de ter sua voz ouvida pelo governo. Estes
obstáculos podem ser: físicos, quando os cidadãos têm, por
exemplo, que se deslocar para participar; temporais, quando
estes precisam reservar um tempo para discutir um assunto e
chegar a um consenso; ou cognitivos, quando estes cidadãos
precisam memorizar e argumentar sobre um elevado número de
informações para realizar estas discussões. O advento das
tecnologias de informação e comunicação, em especial a internet,
permitiu a redução da distância entre os cidadãos e o governo. A
utilização de ferramentas para participação eletrônica, conhecido
como eParticipação, como chats, blogs, fóruns, ferramentas de
votação, entre outras, possibilitou a interação, troca de opiniões e
deliberação sobre assuntos de seu interesse entre os cidadãos
[1][14].
As ferramentas utilizadas para promover as interações cidadão
para cidadão (Citizen to Citizen - C2C) e governo para cidadão (
Government to Citizen - G2C) também são ferramentas onde a
colaboração é necessária, a fim de atingir um objetivo comum.
Cidadãos implícita ou explicitamente formam grupos para trocar
informações e cooperam entre si para tomar decisões, enquanto o
governo pode atuar na coordenação da eParticipação. Além disto,
estes desempenham várias atividades durante sua participação,
as quais podem variar de acordo com a iniciativa e ferramentas
utilizadas [2].
Alguns autores versam sobre a colaboração como um dos
aspectos relevantes para promover a participação, como em
Wang e French [3]. No entanto, pesquisas em eParticipação
relacionadas à sistemas colaborativos, quando existentes, não
possuem um referencial teórico fundamentado nesta área. É
reconhecido que a participação online pode ser descrita como um
tipo de sistema colaborativo, tendo em vista o interesse em
investigações neste sentido [4]. Todavia, o motivo de poucas
análises sobre os aspectos mencionados pode estar relacionado
com a falta de compreensão sobre como e em que momento
adicionar o elemento multidisciplinar em eParticipação.
O modelo 3C de colaboração, originalmente proposto por Ellis et
al. [12], é uma referência em sistemas colaborativos, sendo
utilizada em diversos domínios para representar a colaboração
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, or
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSC’11, 5–7 Outubro, 2011, Paraty, RJ, Brazil.
Copyright 2011 ACM $10.00.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 92 -
[5]. Este modelo divide a colaboração em 3 aspectos:
comunicação, cooperação e coordenação.
Com vistas a facilitar o entendimento das semelhanças entre
sistemas colaborativos e eParticipação, este artigo apresenta uma
análise do ponto de vista de sistemas colaborativos sobre
ambientes de eParticipação. Classificamos as atividades
realizadas por governo e cidadãos em ambientes de eParticipação
de acordo com cada eixo do modelo 3C de colaboração [5]. Além
disso, apresentamos um conjunto de pesquisas de sistemas
colaborativos que podem ser exploradas em eParticipação.
O artigo se divide da seguinte forma: após a introdução,
descrevemos a área de eParticipação, os interessados e as
atividades presentes nesta. Em seguida descrevemos rapidamente
o motivo da escolha do modelo 3C de colaboração. Na próxima
seção apresentamos a categorização proposta e por fim,
discutimos as implicações do uso de abordagens de sistemas
colaborativos em pesquisas de eParticipação.
2. EPARTICIPAÇÃO
A eParticipação é uma área de pesquisa em governo eletrônico
que investiga a utilização das Tecnologias de Informação e
Comunicação (TIC) para suportar e auxiliar a promover a
participação dos cidadãos em demandas democráticas [6]. Já [7]
descreve a eParticipação como um termo híbrido, que relaciona
diversas áreas, das ciências sociais à computação, pelo estudo
das ferramentas de eParticipação, e ciência da informação,
estudando como dados e conhecimento são produzidos e
distribuídos. Para [8], a eParticipação, ou participação eletrônica,
maximiza as possibilidades da democracia, proporcionando uma
outra forma dos cidadãos participarem da vida pública.
Os principais interessados na eParticipação são os cidadãos e o
governo. Sob a perspectiva do governo estão representantes
eleitos, responsáveis pela implementação das políticas públicas,
criadores de políticas, entre outros. Sob a perspectiva do cidadão
estão representantes civis, organizações não-governamentais,
empresas e os próprios cidadãos agindo individualmente [6].
Para que estes e outros interessados possam participar e interagir
eletronicamente, são utilizadas TIC como blogs, chats, fóruns de
discussão, enquetes, entre outras ferramentas [1][8]. Estas
ferramentas são selecionadas de acordo com a intenção da
eParticipação e os resultados esperados pelos interessados nela.
Com estas ferramentas cidadãos realizam diversas atividades
rumo a um interesse determinado pelo contexto da participação.
Não há um consenso sobre a nomenclatura destas atividades.
Entretanto, é possível analisar que estas são similares em sua
descrição. Em [9], são descritas as seguintes atividades de
eParticipação, as quais usam as TIC para:
• Fornecimento de informações – estruturar, armazenar e
gerenciar informação no contexto da participação;
• Comunidades virtuais – fortalecer a formação de
comunidades;
• Consulta – contribuição das agências públicas ou privadas
com opiniões em assuntos específicos;
• Campanha – criar iniciativas coletivas, como petições,
protestos, lobby, entre outros;
• Eleitorado – auxiliar a promoção de campanhas políticas;
• Deliberação – discutir demandas por cidadãos;
• Discurso – TIC sendo utilizadas para promover a conversa
entre cidadãos e políticos eleitos;
• Mediação – TIC utilizadas para resolver conflitos em um
contexto online;
• Planejamento espacial – TIC para planejamento urbano e
avaliação ambiental;
• Pesquisa de opinião- TIC utilizadas para analisar a opinião
pública sobre um assunto;
• Votação – TIC no contexto de votações públicas.
Saebo, Rose e Flak [6] também apresentam como mais
proeminente atividades de eParticipação as atividades de
eVotação, discurso político online, tomada de decisão online,
eAtivismo, eConsulta, eCampanha e ePetição. Embora tratados
por nomes diferentes, estes estão respectivamente relacionados
com as áreas de Votação, Discurso, Deliberação, Comunidades
Virtuais, Consulta, Eleitorado e Pesquisa de opinião. Assim
como [10] apresenta uma análise sobre iniciativas européias
sobre cada um destes tipos de atividades, Maciel, Roque e Garcia
[8] apresentam exemplos de iniciativas internacionais e nacionais
relacionadas a algumas das atividades acima apresentadas, com
vistas a identificar a formação de comunidades virtuais para
eDemocracia.
Estas diferentes iniciativas de eParticipação ainda podem ser
categorizadas de acordo com o nível de engajamento dos
cidadãos, como apresentado pela IA2P [11]. Muitas vezes, nestas
iniciativas, não há uma integração destas TIC, sendo
selecionadas sem um critério específico [1] [2]. Em outros casos,
os cidadãos utilizam TICs externas para discussão, pois não
existe um ambiente próprio para eParticipação. Esta falta de
critério e a dispersão das opiniões por múltiplas ferramentas
pode dificultar o acompanhamento das opiniões pelos cidadãos e
pelo governo [14].
Neste sentido, pesquisas investigam métodos, teorias e modelos
para compreender e representar a eParticipação de modo a
estabelecer um processo para criação de ambientes de
eParticipação efetivos. Phang e Kankahalli [1] analisam as TIC
utilizadas para eParticipação, evidenciando a necessidade de um
processo de seleção destas para o sucesso da eParticipação.
Slaviero, Garcia e Maciel [1] propõem uma solução para a
construção de processos e ambientes de eParticipação sob a ótica
do projetista destes processos. Nesta visão, é considerada a
utilização de uma ontologia para representar o domínio, modelos
de processos para modelar os processos de eParticipação em si,
além das TIC e principalmente o relacionamento entre estas e os
métodos de participação pública.
2.1 O MODELO 3C DE COLABORAÇÃO
Um sistema colaborativo pode ser descrito sob três aspectos na
interação entre usuários: comunicação, coordenação e cooperação
entre os usuários. Estas três características são descritas por Ellis
et al. [12] em seu artigo. Esta representação, chamada de Modelo
3C de colaboração, é uma referência nesta área de pesquisa,
sendo utilizada em diversos domínios [5][15].
De acordo com [5], este modelo é utilizado principalmente para
classificar sistemas colaborativos, mas os mesmos autores já
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 93 -
passam a considerar o uso do mesmo para análise de um
domínio, como o de ferramentas de groupware.
A escolha desta representação se deu pela sua abrangência com
relação às características de sistemas colaborativos, o que pode
auxiliar na construção de investigações em outras áreas de
pesquisa.
3. O MODELO 3C EM EPARTICIPAÇÃO
Como descrito previamente, as atividades utilizam distintas TIC
para promover a eParticipação. Embora estas nem sempre sejam
escolhidas seguindo um critério específico, elas acabam sendo
utilizadas para atingir um determinado objetivo para cada uma
destas atividades. Considerando as interações e tarefas presentes
em cada uma destas atividades, vamos definir quais delas
possuem elementos de comunicação, cooperação e coordenação.
Realizamos esta categorização tomando como base o modelo 3C
de colaboração, com o objetivo de analisar quais dos três
aspectos são mais relevantes para cada uma das atividades. No
entanto, a divisão não considera que uma área não contenha
outros aspectos do modelo de colaboração, mas leva em conta
qual destes aspectos são mais presentes e necessários em cada
atividade. Utilizamos o conjunto de atividades de eParticipação
descritas em [4] por abrangerem praticamente todos os aspectos
da eParticipação, sendo comumente utilizadas em pesquisas que
necessitam da descrição destas atividades de eParticipação
[1][[10]
3.1 Comunicação
No modelo 3C, a comunicação diz respeito à troca de
informações entre usuários, com um objetivo em comum [5].
Essa comunicação pode ser síncrona ou assíncrona. Em
eParticipação, consideramos que as atividades de Fornecimento
de informações, Comunidades Virtuais, Campanha, Deliberação,
Discurso, Mediação e Planejamento Espacial são atividades de
demandam a comunicação, seja entre cidadãos ou entre cidadãos
e governo. As atividades de Consulta, Eleitorado, Pesquisa de
opinião e Votação não dependem diretamente da comunicação
entre as partes para serem executadas, e por este motivo são
desconsideradas como pertencentes a este eixo.
3.2 Coordenação
A coordenação envolve a garantia do cumprimento das atividades
por meio de mecanismos de coordenação, com esta coordenação
sendo realizada seguindo um protocolo social ou mecanismos
complexos [5]. Em um ambiente de eParticipação, a coordenação
pode ser realizada tanto pelo governo quanto pelo cidadão. Em
[14], por exemplo, os cidadãos podem atuar como moderadores
das opiniões, inserindo ressalvas se necessário, auxiliando desta
forma na organização do ambiente de discussão. O governo é o
responsável por receber os relatórios da eParticipação e tomar
uma decisão, que pode ser ratificar ou retificar o que foi decidido
pelos cidadãos. Apesar da democracia pressupor que as
demandas venham do povo [14], o governo pode coordenar a
sistematização destes processos, com vistas a dar o feedback das
ações tomadas em prol da melhoria pública. Consideramos que
todas as atividades dependem de uma coordenação, seja do
governo, com o intuito de convidar os participantes e divulgar os
resultados da participação, ou então dos cidadãos, como
moderadores, como descrito anteriormente.
3.3 Cooperação
A cooperação em um sistema colaborativo é descrita como a
operação conjunta em um espaço, a fim de atingir um objetivo
comum [5]. Na eParticipação, a cooperação pode estar presente
nos momentos em que cidadãos devem discutir questões em
conjunto buscando soluções, como nas atividades de
comunidades virtuais, campanhas e principalmente deliberação,
ou até mesmo a cooperação espontânea que emerge nas redes
sociais, em função de campanhas sociais e de movimentos
políticos, por exemplo, com alto índice de participação. Sem a
cooperação entre os cidadãos, os objetivos das atividades podem
não ser atingidos, prejudicando a participação como um todo.
A Tabela 1 apresenta de forma resumida a relação entre aspectos
do modelo 3C de colaboração e as atividades de eParticipação
descritos anteriormente.
Tabela 1. Relação entre eixos do modelo 3C e as
atividades/áreas de eParticipação.
Modelo 3C Iniciativas de eParticipação
Comunicação
(síncrona)
Fornecimento de informações
Comunidades virtuais
Campanha
Deliberação
Discurso
Mediação
Planejamento Espacial
Coordenação Fornecimento de informações
Comunidades virtuais
Consulta
Campanha
Eleitorado
Deliberação
Mediação
Pesquisa de opinião
Votação
Cooperação Comunidades virtuais
Campanha
Deliberação
4. DISCUSSÃO
O presente trabalho teve por objetivo colocar uma nova visão
sobre a eParticipação, considerando a aplicação de uma
abordagem sob a ótica do modelo 3C de forma a auxiliar novas
pesquisas em eParticipação, apresentando sob quais aspectos da
colaboração estas atividades podem ser modeladas.
Ao olhar para a eParticipação sob a ótica do modelo 3C de
colaboração, podemos notar uma semelhança que ocorre em
grande parte pela utilização das mesmas ferramentas utilizadas
em sistemas colaborativos. No entanto, poucas pesquisas relatam
a eParticipação como um tipo de sistema colaborativo. A
definição de elementos de eParticipação neste artigo tomando
como base um modelo de colaboração difundido na literatura traz
à tona uma possibilidade de pesquisa pouco visada. Neste
contexto, as investigações em eParticipação podem se apropriar
das teorias e modelos já validados presentes em sistemas
colaborativos, adaptando-as para melhorar a interação entre
governo e cidadão. Por exemplo, podem ser utilizados conceitos
de trabalho colaborativo, como crowdsourcing para definir metas
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 94 -
para participação dos cidadãos de forma a auxiliar o governo a
aplicar soluções propostas pelos próprios cidadãos.
O projeto de ambientes de eParticipação também deve ponderar
características da criação do processo, como técnicas e de
organização das TIC, bem como características de
comportamento esperado e das interfaces que são base para a
externalização destes comportamentos [14]. No projeto das
interfaces se enquadram as características de sistemas
colaborativos, e é neste momento que se espera utilizar teorias e
modelos presentes em sistemas colaborativos, para cobrir as
recomendações que permitam com que a eParticipação tenha
sucesso.
Neste momento, a expressão das atividades de eParticipação sob
a ótica do modelo de colaboração 3C podem ser benéficas para
focar a atenção de designers da interação em eParticipação.
Outro benefício que pode ser visualizado ao utilizar uma
abordagem de um sistema colaborativo é a facilitação da
montagem de ambientes de eParticipação, por meio da definição
de componentes para as distintas TIC [16].
Os benefícios supracitados evidenciam a relevância de pesquisas
relacionadas ao aspecto colaborativo da eParticipação, sendo
estas de fundamental importância para tornar a eParticipação
mais eficiente e possibilitar o sucesso nestas iniciativas. Espera-
se que a abordagem sugerida neste trabalho seja utilizada por
pesquisadores como ponto de partida para novas investigações
unindo as áreas de eParticipação e sistemas colaborativos. Para
que este ponto de vista seja melhor investigado, avaliações
práticas que analisem como a colaboração está inserida dentro de
eParticipação devem ser conduzidas em pesquisas futuras.
5. REFERÊNCIAS
[1] Slaviero, C., Garcia, A.C.B., Maciel, C. (2011). “Towards
an ontology to support the deployment of eParticipation
environments”. In: 2nd International Conference on
Electronic Government and the Information Systems
Perspective - EGOVIS 2011. (em fase de de publicação).
[2] Phang, C.W. and Kankanhalli, A. (2008) “A framework of
ICT exploitation for e-participation initiatives”. In:
Communications of the ACM. vol. 51, ed. 12 p. 128-132.
ACM New York, NY, USA.
DOI=10.1145/1409360.1409385
[3] Wang, W. e French, S. (2008). “A multi-dimensional
framework for facilitating wide participation and common
understanding.” In Proceedings of the hypertext 2008
workshop on Collaboration and collective intelligence
(WebScience '08). ACM, New York, NY, USA, 23-27.
DOI=10.1145/1379157.1379164
[4] DEMO-net (2006), “D4.1: The Initial Demo-net
Landscape”., DEMO-net – The eParticipation Network.
[5] Fuks, H., Raposo, A.B. e Gerosa, M.A.. (2003) “Do Modelo
de Colaboração 3C à Engenharia de Groupware. Pontifícia
Universidade Católica do Rio de Janeiro (PUC-Rio).
[6] Saebo, O., Rose, J. and Flak, L. S. (2008). “The shape of
eParticipation: characterizing an emerging research area”.
In: Government Information Quarterly, vol. 25, n. 3. p. 400-
428, Elsevier.
[7] Macintosh, A., Coleman S. and Schneeberger, A. (2009).
“eParticipation: The research Gaps”. In: Lectures Notes in
Computer Science. Vol. 5694, p. 1-11. Springer Berlin /
Heidelberg
[8] Maciel, C., Garcia, A. C. B., Roque, L. E-Democracy:
Concepts, Experiences and Challenges In: Democracy in
Theory and Action ed.New York : Nova Science Publishers,
Inc., 2011, p. 51-92.
[9] DEMO-net (2006), D5.1: Report on current ICTs to enable
Participation, DEMO-net – The eParticipation Network.
[10] Panopoulou, E., Tambouris, E. e Tarabanis, K. (2009)
“eParticipation initiatives: How is Europe progressing?”. In
European Journal of ePractice.
[11] IAP2 (2004). “IAP2 Spectrum of Public Participation”,
http://www.iap2.org.au/sitebuilder/resources/knowledge/ass
et/files/36/iap2spectrum.pdf
[12] Ellis, C.A., Gibbs, S.J. & Rein, G.L. (1991)” Groupware -
Some Issues and Experiences. Communications of the
ACM, Vol. 34, No. 1, pp. 38-58. .
[13] Maciel, C, Roque, L. and Garcia, A.C.B. (2008).
Comunidade democrática cidadã (CDC): um ambiente para
consulta e votação na web. In Proceedings of the VIII
Brazilian Symposium on Human Factors in Computing
Systems (IHC '08). Sociedade Brasileira de Computação,
Porto Alegre, Brazil, Brazil, 320-321.
[14] Maciel, C., Roque, L e Garcia, A.C.B. (2009) “Principios
para o projeto de comunidades virtuais governamentais com
fins e-Democráticos”. In Anais do XXIX Congresso da
Sociedade Brasileira de Computação - I Workshop de
Computação Aplicada em Governo Eletrônico
(WCGE2009), 2009. p. 1377-1391
[15] Pimentel, M., Gerosa, M.A., Filippo, D., Raposo, A., Fuks,
H., Lucena, C.J.P. (2006) “Modelo 3C de colaboração para
o desenvolvimento de sistemas colaborativos”. In: Anais do
III Simpósio Brasileiro de Sistemas Colaborativos, pp. 58 –
67.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 95 -

S E S S Ã O 5
Recomendação
Creating a Blog Recommendation System Through a
Framework for Building Blog Crawlers
Rafael Ferreira
Informatics Center, Federal
University of Pernambuco
Recife, Brazil
rflm@cin.ufpe.br
Jean Melo
Computing Institute, Federal
University of Alagoas
Maceió, Brazil
jean.melo@ic.ufal.br
Patrick Brito
Computing Institute, Federal
University of Alagoas
Maceió, Brazil
patrick@ic.ufal.br
Evandro Costa
Computing Institute, Federal
University of Alagoas
Maceió, Brazil
evandro@ic.ufal.br
Rinaldo Lima
Informatics Center, Federal
University of Pernambuco
Recife, Brazil
rjl4@cin.ufpe.br
Fred Freitas
Informatics Center, Federal
University of Pernambuco
Recife, Brazil
fred@cin.ufpe.br
ABSTRACT
Blogs have become interesting tools for knowledge genera-
tion and sharing, specially because there are more than 133
million blogs and hundreds of new ones are created every
day. As a matter of fact, the activity on blogs doubles every
two hundred days. Thus, several applications might use the
daily information stored in blogosphere in order to provide
valuable decisions. However, the blogs’ dynamism hinders
the manual information extraction from it, which demands
the development of new computational and automated ap-
proaches. In this context this paper proposes framework
to create blog crawlers. This framework provides services
for preprocessing, indexing, content extraction, classifica-
tion, and tag recommendation. In addition, we present a
recommendation system (as case study) in order to demon-
strate one potential application of blogs a recommendation
system. It helps student interactions in educational forums.
This research takes into account aspects of software engi-
neering to evaluate the framework, as well as a qualitative
analysis related to aspects of the developed application, such
as the evolution impact.
Categories and Subject Descriptors
H.3.1 [Information Storage and Retrieval]: Information
Search and Retrieval; D.3.3 [Language Constructs and
Features]: Frameworks; I.5.4 [Pattern Recognition]: Ap-
plications
General Terms
Algorithms, Experimentation, Human Factors
Keywords
Recommendation Systems, Blog Crawler, Framework
1. INTRODUCTION
“A blogger needs only a computer, Internet access, and an
opinion [23]”, “Weblogs have become so ubiquitous that for
many of us the term is synonymous with ‘personal Web
site’ [4]”, “There are more than 133 million blogs, every day
are created hundreds, and the activity on blogs doubles ev-
ery two hundred days [27]”. These aforementioned phrases
present the two main features that expose why blogs are
largely adopted: simplicity and popularity. They show that
blogs have become a very interesting tool as well. So, it may
be used in various areas, e.g. e-commerce and e-learning.
At the same time, due to the large volume of data generated
on blogs, it becomes infeasible to extract all information
manually. Thus, it is necessary computational approaches
to extract data from blogs in order to make a profitable use
of its content. Some researches have been developed to au-
tomate the data extraction process from blogs [12, 18, 14].
These proposals attempt to solve specific problems such as:
the performance issue, discover most accessed blogs, recom-
mend blogs with similar topics, and discover trends through
blogosphere.
Although both the variability and size of blogosphere demon-
strate the importance of blogs. It also causes two problems:
(i) it is difficult to build a general approach to deal with such
variabilities, and (ii) it is necessary to assist the developer
for solving basic problems like extracting the main content
of the blog, and the preprocessing of the blogs’ text. A solu-
tion which addresses the former problem is the building of a
software framework, while the latter could be addressed by
using several artificial intelligence techniques as natural lan-
guage processing and information extraction, for example.
In this context, this work proposes a software framework to
create blog crawlers. This framework addresses the problems
aforementioned and some issues related to software engineer-
ing. For example, a better evolvability, reuse, and easiness
for instantiating the framework in a software application. It
is important to clarify that each component of the frame-
work can be used independently. Following these issues, the
framework can be used to create applications quickly and
easily, thus facilitating its use.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 97 -
In order to evaluate our approach, the proposed framework
was applied on a case study of a blog recommendation sys-
tem for helping student interactions in educational forums.
The obtained results take into account the effort reduction
when creating a blog crawler application by using our frame-
work, as well as the facility of using their services applied to
the recommendation system.
The rest of the paper has been structured as follows. Sec-
tion 2 provides the background required to understand the
rest of the paper. Section 3 presents the requirements of
the framework, including its hot spots and frozen spots.
Section 4 describes the implementation of the component-
based framework. Section 5 describes a case study through
the building of one blog recommendation system. Section 6
shows some related work. Finally, Section 7 presents our
conclusion and future work.
2. BACKGROUND
In order to facilitate the understanding of the paper this
section presents an overview of: i) framework; ii) features
model; iii) COSMOS* model.
2.1 Framework
There are many definitions of framework, among them the
most used are those of Ralph E. Johnson [17] [16]: i) Frame-
work is a set of classes which include an abstract design
for solutions of a related problems; ii) Framework is a set
of objects collaborating to perform a set of responsibilities
to an application domain, an application that can be easy
customized by the developer.
Frameworks may be classified according to the extension
technique [8]: i) White Box: They are strongly connected
to programming language features, to customize it uses in-
heritance. It requires a good understanding of framework to
create an application; ii) Black Box: It is instantiated from
some kind of configuration file, such as XML. These frame-
works mainly use composition (components or classes) and
delegation to perform customization. It does not require un-
derstanding of details to produce an application, iii) Gray
Box: This kind of framework is designed to avoid the dis-
advantages presented by white box and black box, allowing
some degree of flexibility and extensibility without exposing
internal information unnecessary.
Two important properties in order to understanding a frame-
work are [6] the Hot and Frozen Spots. Hot Spots repre-
sent the framework flexible parts, the developer extends the
framework using these spots. In other hand, the Frozen
Spots are framework’s unchanged parts, it provides basic
components the relationships between them.
Some advantages of using the frameworks is [24] [25]: i) the
developer write few code lines; ii) it reduces costs and devel-
opment time; iii) more reliable and robust code; iv) reduced
maintenance and easier evolution; v) improved consistency
and compatibility among applications; vi) stabilization of
the code (fewer bugs) due to the use in several applications.
2.2 Feature Model
A feature is a system property that is relevant to some stake-
holder and is used to capture similarities and variabilities
between systems [7]. The feature modeling is the activity
of identifying similarities and variability of the products of
a product line, or frameworks applications, in order to or-
ganize them in a model. A feature model represents a hi-
erarchical decomposition of resources, usually including two
types of relationships: aggregation and generalization. The
aggregation relationship is used if a resource can be decom-
posed into a set of sub-functions, and the relationship of
generalization is used when a resource can be specialized
with more specific information [20].
Relationships between a parent feature and its child features
(or subfeatures) are categorized as:
• Mandatory: child feature is required;
• Alternative: one of the sub-features must be selected;
• Optional: child feature is optional, in other words, one
or more children can be instantiated or no child as well.
For instance, in Figure 1 [1], to instantiate the ATM System
is necessary to choose instances of User Identification and
Balance(mandatory relationship). On the other side in order
to have the User Identification is required to choose only one
subtype between Touch Screen e Card Reader(alternative
relationship). Finally, to instantiate Balance it is necessary
one instance of Display(mandatory relationship) and the in-
stance of Printer is optional(optional relationship).
Figure 1: Feature Model
2.3 COSMOS* Model
The COSMOS* model[11] uses programming language fea-
tures and well-known design patterns to represent software
architectures explicitly in the program code. The COS-
MOS* model defines the specification and implementation of
COSMOS* components, COSMOS* connectors, COSMOS*
architectural configurations, and COSMOS* composite com-
ponents.
The COSMOS* model is divided in a specification model,
which a component exposes its specification; an implemen-
tation model, which guides the internal implementation of a
component; a connector model, which specifies the connec-
tion between components using connectors; and a compo-
sition model, which new components or entire systems are
built using existing components.
Therefore, the main goals the COSMOS* model are: First,
provide an accompanying from software architecture to pro-
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 98 -
Figure 2: Features Model
gram code. Second, help maintenance of the implementa-
tion. This, in its turn, is regarded as a model which re-
duces the coupling between architecture’s modules and still
offers software reuse, so we decided to use it for developing
the framework proposal. Although COSMOS* has four sub-
models (specification, implementation, connector and com-
position), this work only uses two which are the specification
model and implementation model because the connectors are
simple classes. It is important quote that all framework’s
components were implemented using COSMOS*.
3. FRAMEWORK REQUIREMENTS
The proposed framework consists of a gray-box framework
for blog crawlers development. In other words, although the
developer can modify the code to build new crawlers, he/she
can instantiate the framework based on high-level interfaces.
For this, the framework was implemented in Java according
to the COSMOS* component implementation model [11].
Figure 2 presents the feature model involving the function-
alities of the framework. This model uses the notation pro-
posed by [13], which represents hot spots and frozen spots
in an explicit way.
Some points in this diagram should be analyzed: i) The
Content Extraction, Indexing, and Tag Parsing features are
mandatory, they have to be instantiated; ii) The Classifi-
cation, and Tag Recommendation features are optional; iii)
The subtypes of all features, except the Preprocessing, are
all alternate, i.e., the developer should choose one of them
for each main feature; iv) The Preprocessing feature has
three mandatory and four optional sub-features. The op-
tional sub-features can be selected when instantiating the
Preprocessing feature of the framework.
The collection of alternative and optional features represent
the hot spots of the framework, whose combination define
the decision model. In the following we present a description
of each hot spot:
• Preprocessing: it removes the information consid-
ered irrelevant to the blog analysis. The current ver-
sion of the framework provides seven types of pre-
processing: (i) Clean HTML, which is responsible for
cleaning all HTML tags; (ii) White Space Remover,
which removes extra white spaces; (iii) Lowercase, which
changes all letters to lowercase; (iv) English Filtering,
it removes English stop words; (v) English Stemming,
it performs a stemming technique to English; (vi) Por-
tuguese Filtering, it removes Portuguese stop words;
and (vii) Portuguese Stemming, it performs a stem-
ming technique to Portuguese.
• Content Extraction: This service extracts the tex-
tual content of blog posts. Four services are already
implemented: (i) Summary Strategy [2], it uses the
blog summary to extract the content; (ii) Document
Slope Curve (DSC) [22], it seeks text blocks based on
document slope curve; (iii) Text-to-Tag Ratio (TTR) [28],
it uses the the ratio of the amount of non-tag charac-
ters by the number of HTML tags per text line to
extract content; and (iv) Boilerplate [19], it is an algo-
rithm based on decision tree to examine shallow fea-
tures of the text.
• Indexing: The service indexes texts for the search
process. Although there is one service implemented
that uses the tool Lucene
1
, the framework allows the
definition of new indexing schemas.
• Classification: it provides text classification services
based on statistical techniques. Three services are
available: (i) Naive Bayes: Provides a trainable naive
bayes text classifier, with tokens as features; (ii) KNN:
implements k-nearest-neighbor classification based on
euclidian distance; and (iii) TF-IDF: Provides a ser-
vice for training discriminative classifiers based on the
weighting of term-frequency and inverse document fre-
quency of features.
1
http://lucene.apache.org
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 99 -
Figure 3: Similarity Component
• Tag Recommendation: it aligns different blog tags.
Four types of alignment have been defined: (i) Sim-
ilarity, it is based on the metric of Levenshtein Dis-
tance [21]; (ii) Dictionary, This service addresses words
with similar semantics, using WordNet [9]; (iii) Clus-
tering, which performs the alignment using a classical
version of the KNN cluster algorithm [26]; and (iv)
Classify, it is focused on a bag of words classifier which
uses the words of blog posts and their respective fre-
quency to generate a Naive Bayes classifier [15];
• Tag Parsing: it executes a search and returns a list
of blog links matching to a given tag. It is currently
available for searching on Technorati
2
and Icerocket
3
blog indexing services.
The features model define the decision model. This model
provides the possible instantiations and configurations of the
framework under different scenarios (products).
The frozen spots implements basic services which are used in
the crawling process. The frozen spots available are: i) file
manipulation, it provides operation with files, like save and
delete; ii) HTTP requests, it handled all web connections;
iii) XML file manipulation, it validates and opens xml files;
iv) string manipulation, it provides operations like compare
strings and count number of words; v) language detection,
it uses the google API to determine the language of a text;
and vi) WordNet, it accesses the database WordNet.
4. COMPONENT-BASEDIMPLEMENTATION
The framework uses a component-based implementation based
on the COSMOS*implementation model in order to improve
2
http://technorati.com
3
http://www.icerocket.com
the traceability between the software architecture and the
source code. COSMOS* uses programming language fea-
tures, like interfaces, classes and packages, and a set of de-
sign patterns to represent software architectures explicitly
in the program code. Moreover, the guidelines defined by
the COSMOS* model also improves the system modularity
and the internal evolution of the software components.
To illustrate the implementation, Figure 3 shows the class
diagram of the Similarity component, which implements a
technique of tag recommendation. It receives two strings
lists as parameters, these must contain the tags to be align.
As return it creates a strings list containing the alignment
rules.
According to the COSMOS* model, the user has access only
to the spec package and the SimilarityFactory class. The
IManager interface is defined by COSMOS* and provides
the component basic operations, for example, operations for
getting instances for the provided interfaces of the compo-
nent (getProvidedInterface) and for binding an object that
implements a required interface (setRequiredInterface). The
ISimilarity interface is a provided interface that contains the
operations to the tag recommendation service.
5. CASESTUDY: ABLOGRECOMMENDA-
TIONSYSTEMFORHELPINGSTUDENTS
IN EDUCATIONAL FORUM INTERAC-
TIONS
This section describes a blog recommendation system cre-
ated using the proposed framework services. This case study
is divided into two parts: i) blog crawling, and ii) blog rec-
ommendation. These applications are designed for helping
students in MASSAYO environment.
MASSAYO [3] aims to build an educational platform based
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 100 -
on Semantic Web technologies, offering the following advan-
tages: i) extensibility, ii) it ensures participatory knowledge
creation; iii) it has a structure that takes into account char-
acteristics of each user, making the system adaptable to
them.
In face of this context, the applications proposed in this case
study deal with these aspects in the forum tool. First, it is
extensible because the developer is allowed to create new
applications by changing few lines of code. Then, it uses
texts from blogosphere ensuring universal and participatory
knowledge creation. Finally, the recommendation system
tracks each student and recommends specific blogs for each
one.
Next section presents the blog crawling and blog recommen-
dation applications.
5.1 Blog Crawler
The application crawlers Tecnhorati’s blogs related to spec-
ified categories, like education, mathematics, geometry, al-
gebra, and stores it in a MySQL database. As a result, an
index with blog’s information is created. The recommenda-
tion system, detailed in next section, use this information to
suggest blogs to students.
In order to create this application is necessary to choose
the alternative components and possible optional compo-
nents. Firstly, we choose Lucene Index (Index), Technorati
(tag parser), TTR (content extraction) as alternative com-
ponents, and English Filtering as optional. In addition, the
application uses Clean HTML, White Space Remover, Lower
Case (preprocesing) as mandatory components, i.e. every
time when the framework is instantiated they are loaded.
These services were chosen because the application require-
ment was performance. Therefore, the TTR and English
Filtering components are more suitable in this case because
they use simple algorithms to perform these operation. Fig-
ure 4 shows the components configuration used directly by
the application.
Given this context, in order to create this application we
only need to create one class specifying the components men-
tioned above. The code follows the model proposed in [11]:
• Instantiate interfaces and their managers;
• Setting the required interfaces;
• Receiving the interfaces provided.
As a result of using architecture-driven and components ap-
proaches, this code uses a high-level representation, i.e. in-
terfaces. Thus, it is clear that the developer does not need
to know specific details of the code. Indeed, if the devel-
oper wishes to change some component she usually needs to
rewrite only on average 4 lines of code.
This fact highlights the low instantiation cost, reuse, and
modularity of the framework.
Figure 4: Component diagram
Finally, in order to run the crawler it is only necessary to
create an instance of the crawler class that is already avail-
able in the framework, and call the runCrawler method, as
shown below.
public static void main(String[] args) {
Crawler crawler =
new Crawler(new TechnoratiSpecification());
crawler.runCrawler();
}
In summary, to create a crawler using the proposed frame-
work the software developer has to:
1. Choose the appropriate components for the application
being developed;
2. Create a class specifying these components and their
interfaces;
3. Run main class showed above.
5.2 Recommendation System
This system recommends blogs for helping students in MAS-
SAYO educational forum. In summary, the system monitors
the forum discussion among the students and, in case of iden-
tifying students questions, the system recommends blogs for
them in order to overcome doubts. The recommended blogs
were crawled using the application described in the previous
section.
The main objective of this system is to highlight the facility
provided by our framework when reusing components. It
uses the naive Bayes component for classification and En-
glish filtering in its preprocessing step.
In the Recommendation system, posts may be classified as
(i) Doubt, student questions appeared in forums; (ii) Expla-
nation, when questions issues are explained; and (iii) Neutral
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 101 -
comment, comments unrelated to any of the above classes.
The system only recommends blogs if a post is classified as
a doubt. Figure 5 shows how the overall recommendation
process works.
Figure 5: Activity diagram
• User interaction: The user interacts with the forum
on the environment, and every post is sent to the rec-
ommendation system;
• Post classification: The recommendation system clas-
sifies (via the Naive Bayes component) a user’s post as
a doubt, an explanation or a neutral comment;
• Post processing: Using the English Filtering com-
ponent, the recommendation system filters out stop
words prior to text processing;
• Post subject detection: In order to determine the
subject of the post, the recommendation system uses
course keywords provided by the MASSAYO environ-
ment. Course keywords are created when a course
starts. Next, the system matches these keywords with
those from user’s post with the aim of find out its sub-
ject;
• Blog Recommendation: The recommendation sys-
tem tests if a post concerns user’s doubts. If that is
the case, then the system suggests a blog to the user;
it does nothing, otherwise.
This system uses two services provided by the proposed
framework. It shows that services can be easily reused by
other applications even if they are not blog crawler.
6. RELATED WORK
The authors in [14] present a solution for blog crawling that
attends specific quality attributes such as performance and
scalability; and [12] describes an application to investigate
blog collections by using learning machine techniques and
natural language processing. This application shares infor-
mation like the most cited sentences, key people, and most
accessed blogs. However, these solution are specific for some
blogs and does not allow variability of different strategies.
Other papers present a more general approach. [5] propose a
framework for blog mining that include spiders, parsers, ana-
lyzers, and visualizers; [2] propose a framework for building
context-based blog crawlers; and [18] proposes a blog min-
ing and search framework that extracts the interests of the
blogger, finds and recommends blogs with similar topics,
and provides blog oriented search functionality. However,
these are white-box object-oriented frameworks that do not
present a clear traceability between the software architec-
ture and the source code. Thus, the developer has to know
the implementation classes for using and extending the men-
tioned frameworks.
The main feature of the proposed work is to provide services
that can be used to create crawlers for specific information,
as in [14][12], and provide high-level interfaces that facilitate
the framework instantiation, dealing with problems found
in[5][10][18].
7. CONCLUSION AND FUTURE WORK
This paper presented a framework for creating blog crawlers.
It was implemented in Java using the COSMOS* implemen-
tation model. The proposed framework provides a large col-
lection of services (section 3) which offers to users the pos-
sibility of creating a large number of applications with dif-
ferent settings. The framework’s source code is available for
download
4
under the GNU General Public License (GPL)
5
.
In order to evaluate it a blog recommendation system was
presented as a case study.
The main advantages identified were: i) Low instantiation
cost, to create an application with the framework is sufficient
to indicate a few hot spots; ii) Understandability, since for
creating an application the user has only to know the specifi-
cation (interfaces) of components that she wants to use (high
granularity); iii) Modularity and Evolvability, specially for
adding a new feature (component); iv) Manageability, spe-
cially related to the parallelism of the development process,
since the components are self-contained and the developer
needs only to know their interfaces; v) Monitoring, it is eas-
ier to monitor separate architectural components than the
entire system; and vi) Reuse, since each component is inde-
pendent and self-contained (low coupling), reuse is simpler.
As future work we intend to: i) evaluate the framework
in large blog databases; ii) apply concepts of distributed
systems in order to have crawlers on several machines con-
nected(parallelism); iii) create new case studies; iv) use the
framework to create web news crawlers.
8. REFERENCES
[1] P. B. Ana Elisa Lobo and C. M. F. Rubira. A
systematic approach for architectural design of
component-based product lines. Technical report,
Instituto da Computa¸ c˜ao - Universidade Estadual de
Campinas, 2007.
[2] Authors. Omitted for blind. 2010.
[3] I. I. Bittencourt, E. de Barros Costa, M. Silva, and
E. Soares. A computational model for developing
4
https://sourceforge.net/projects/retriblog/
5
http://www.gnu.org/licenses/gpl.html
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 102 -
semantic web-based educational systems.
Knowl.-Based Syst., 22(4):302–315, 2009.
[4] R. Blood. How blogging software reshapes the online
community. Commun. ACM, 47(12):53–55, 2004.
[5] M. Chau, J. Xu, J. Cao, P. Lam, and B. Shiu. A blog
mining framework. IT Professional, 11:36–41, January
2009.
[6] P. Clements and L. Northrop. Software product lines:
practices and patterns. 0201703327, 2001.
[7] K. Czarnecki, S. Helsen, and U. Eisenecker. Staged
configuration through specialization and multilevel
configuration of feature models. Software Process:
Improvement and Practice, 10(2):143–169, 2005.
[8] M. E. Fayad, D. C. Schmidt, and R. E. Johnson.
Building application frameworks: object-oriented
foundations of framework design. John Wiley & Sons,
Inc., New York, NY, USA, 1999.
[9] C. Fellbaum, editor. WordNet: an electronic lexical
database. MIT Press, 1998.
[10] R. Ferreira, R. J. Lima, I. I. Bittencourt, D. M. Filho,
O. Holanda, E. Costa, F. Freitas, and L. Melo. A
framework for developing context-based blog crawlers.
Proceedings of the IADIS International Conference on
WWW/Internet, pages 120–126, 2010.
[11] L. A. Gayard, C. M. F. Rubira, and P. A.
de Castro Guerra. COSMOS*: a COmponent System
MOdel for Software Architectures. Technical Report
IC-08-04, Institute of Computing, University of
Campinas, February 2008.
[12] N. S. Glance, M. Hurst, and T. Tomokiyo. Blogpulse:
Automated trend discovery for weblogs. In WWW
2004 workshop on the weblogging ecosystem:
aggregation, analysis and dynamics, 2004.
[13] H. Gomaa. Designing Software Product Lines with
UML: From Use Cases to Pattern-Based Software
Architectures. Addison Wesley, 2004.
[14] M. Hurst and A. Maykov. Social streams blog crawler.
In ICDE ’09: Proceedings of the 2009 IEEE
International Conference on Data Engineering, pages
1615–1618, Washington, DC, USA, 2009. IEEE
Computer Society.
[15] L. Jiang, D. Wang, Z. Cai, and X. Yan. Survey of
improving naive bayes for classification. In Proceedings
of the 3rd international conference on Advanced Data
Mining and Applications, ADMA ’07, pages 134–145,
Berlin, Heidelberg, 2007. Springer-Verlag.
[16] R. E. Johnson. Components, frameworks, patterns.
COMMUNICATIONS OF THE ACM, 40:10–17, 1997.
[17] R. E. Johnson and B. Foote. Designing reusable
classes. Journal of Object-Oriented Programming,
1(2):22–35, 1988.
[18] M. Joshi. Blogharvest: Blog mining and search
framework. In In: Proc. of the International Conf. on
Management of Data COMAD, 2006.
[19] C. Kohlsch¨ utter, P. Fankhauser, and W. Nejdl.
Boilerplate detection using shallow text features. In
Proceedings of the third ACM international conference
on Web search and data mining, WSDM ’10, pages
441–450, New York, NY, USA, 2010. ACM.
[20] K. Lee and K. C. Kang. Feature dependency analysis
for product line component design. pages 69–85, 2004.
[21] F. P. Miller, A. F. Vandome, and J. McBrewster.
Levenshtein Distance: Information theory, Computer
science, String (computer science), String metric,
Damerau? Levenshtein distance, Spell checker,
Hamming distance. Alpha Press, 2009.
[22] D. Pinto, M. Branstein, R. Coleman, W. B. Croft,
M. King, W. Li, and X. Wei. Quasm: a system for
question answering using semi-structured data. In
Proceedings of the 2nd ACM/IEEE-CS joint
conference on Digital libraries, JCDL ’02, pages 46–55,
New York, NY, USA, 2002. ACM.
[23] A. Rosenbloom. The blogosphere - introduction.
Commun. ACM, 47(12):30–33, 2004.
[24] J. P. Sauv´e. Projeto de software orientado a objeto.
http://www.dsc.ufcg.edu.br/ jacques/cur-
sos/map/html/frame/oque.htm, 2000.
´
Ultimo acesso
em Dezembro de 2009.
[25] I. Sommerville. Software Engineering (7th Edition)
(International Computer Science Series). Addison
Wesley, May 2004.
[26] S. Tan. An effective refinement strategy for knn text
classifier. Expert Syst. Appl., 30:290–298, February
2006.
[27] Technorati. State of the blogosphere 2008.
http://technorati.com/blogging/feature/state-of-the-
blogosphere-2008/, 2008. Accessed on March
2011.
[28] T. Weninger and W. H. Hsu. Text extraction from the
web via text-to-tag ratio. In Proceedings of the 2008
19th International Conference on Database and Expert
Systems Application, pages 23–28, Washington, DC,
USA, 2008. IEEE Computer Society.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 103 -
How to Know What Do You Want?
A Survey of Recommender Systems and the
Next Generation
Angelina Ziesemer
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
angelina.ziesemer@acad.pucrs.br
João Batista S. de Oliveira
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
oliveira@inf.pucrs.br
ABSTRACT
Recommender systems are popular tools to deliver relevant
content to users according to the profile information ob-
tained during their interactions with the system. The chal-
lenge is to comprehend how the Web 2.0, e-commerce and
social networks together can reach all kinds of users. This
paper presents a review on the field of recommender systems,
including methods for filtering content, approaches for ob-
taining user feedback and the opportunities that Web 2.0
provides in order to improve the interactions within these
environments. We also present the challenges and prospec-
tives in recommender systems and developing alternatives
to understand user preferences for better content delivery.
Categories and Subject Descriptors
H.3.3 [Information Search and Retrieval]: Information
Filtering
General Terms
Algorithms
Keywords
recommendation; collaborative, recommender system
1. INTRODUCTION
Recommender systems have recently become very popular
[13, 21, 45, 7] due to the advent of social media networks,
Web 2.0 and the rich content provided by user interactions.
Having a huge amount of information available on the Web,
the development of recommender systems has become neces-
sary to users in a personalized way. A recommender system
shows relevant content to users, filtering what could be in-
teresting to the profile and trying to identify the relationship
between users and items to develop the recommendation and
personalization. The personalization involves the dynamic
content delivery such as textual elements, links, videos, im-
ages and the recommendation of products, tailored to the
needs or interests of a user or set of users [26]. For instance,
a set of users U = {u1
, u
2
, . . . , u
m
} can relate to a set of
items I = {i
1
, i
2
, . . . , i
n
} through a relationship (R ⊆ U×I).
Despite some recommender system approaches have already
been developed, there is much research trying to improve
the effectiveness and the quality of content delivered to users
[27, 48, 31, 2, 36]. There are surveys about recommender
systems [5, 1, 47, 9] and all have a contribution to the rec-
ommender area. Our main contribution in this work, is to
group traditional recommender system approaches, new ap-
proaches, and analyze how/what kind of data are explored
to suggest content. Moreover, we discuss the current recom-
mender system approaches and its peculiarities according to
each environment, the challenges and trends due to the Web
2.0 advent [28].
This paper has been organized as follows: In the next Sec-
tion we will present how the approaches of recommender
systems are divided. Section 3 introduces the data collec-
tion to improve the recommendation; Sections 4 and 5 will
discuss the challenges and prospects, and the conclusions
based on the presented overview.
2. BACKGROUND
Information retrieval [37] is the key method to the discovery
of personalized information and recommendation of content.
According to Adomavicius [1] recommender systems are di-
vided into three categories: collaborative filtering, content-
based and hybrid recommendation approaches. Mobasher
[26] also considered the rule-based recommender systems re-
lated to business rules with goals and specific interests for
the systems. In this paper we also show the graph-based
recommender approach, a recently technique to explore re-
lationships in social networks and recommendation.
2.1 Collaborative Filtering Approach
Recommender systems that use collaborative filtering (CF)
[47] assume that if two users rate n items similarly or ac-
cess items in the same category, they will rate or access
other items similarly. This association relates the interests
between users and suggest to the created groups by the rat-
ings of the preferences more products or contents that may
be of their interest.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 104 -
One of the first approaches was the k-Nearest-Neighbor (k-
NN) [4, 10] used to compare the profile of a user to other
profiles and find the k users who have similar interests.
CF systems are divided into memory-based algorithms, that
use techniques to identify users with similar behaviors, and
model-based algorithms, that use collections of ratings to
learn a model to predict new recommendations [1].
According to Liu [23] there are two main disadvantages in
CF method: these systems can not recommend content that
was not previously rated/clicked/read by others and also
not all users have the same interests. In spite of this, this
technique has grown in popularity because of its simplicity
to implement and ease of initial training. Both memory-
based and model-based approaches to CF will be explained
in the next subsections.
2.1.1 Memory-Based Approach
Memory-based algorithms use the similarity between users
(user-based) [43] or items (item-based) [22, 11] to predict
new items in order to recommend to the active user. In
the user-based approach, the grouping happens as users rate
similarity the items.
The rating value a
u,i
is the relation between the user u and
the item i. I.e., a set of users that rated the same item in
a similar way will be part of a neighborhood with the same
interests [1].
According to Su e Khoshgoftaar [47] in the neighborhood-
based CF algorithm is necessary to calculate the similarity
between users or items and produce a prediction for the
active user by taking the weighted average of all the ratings
of the user or item on a certain item or user.
Similarity: there are distinct approaches to calculate the
similarity sim(u
i
, u
j
) between users u
i
and u
j
from U and
between items I. Among the most popular approaches there
are the correlation and vector cosine.
One of the most widely used techniques to compute the sim-
ilarity is by calculating the Pearson correlation coefficient
[32, 35]. For instance, to find the similarity in user-based
approach between u
1
e u
2
, the correlation coefficient is given
by
sim(u
1
, u
2
) =
P
i∈I
(a
1,i
− ¯ a
1
)(a
2,i
− ¯ a
2
)
q
P
i∈I
(a
1,i
− ¯ a
1
)
2
q
P
i∈I
(a
2,i
− ¯ a
2
)
2
where I is the set of all item ratings by users u
1
and u
2
and
a
k,i
represents the ratings of user k on item i.
To compute the similarity on user-based approach between
u
1
and u
2
by vetor cosine [4] we can use the following formula
cos(u
1
, u
2
) =
(u
1
.u
2
)
u
1

2
× u
2

2
where the user ratings u
1
and u
2
are treated as vectors, then
the similarity between two vectors can be computed by the
angle cosine between them.
Aggregation: from the similarity among users, we can rec-
ommend the rating items from the set of other similar users
whose the active user belongs. For instance, in last.fm
1
on-
line radio, a set of users usually listens and rates the rock
music category in a positive way. The users receive other
content well rated to the set which is the network developed
according to the similarity obtained. The most common ag-
gregation approach is to use the weighted sum of user ratings
where
ˆ
G is the subset of users which are similar to the active
user u [1].
ru,i
= k
X
g


ˆ
G
sim(u, g

) × r
g

,i
In this approach the similarity between the active user u and
the user g

of the subset is used in the aggregation formula
for the weighted sum. These approaches were applied to the
user-based technique but it can be adapted to item-based
approach [38]. Item-based algorithms were developed to fix
the scalability problem (Section 4.3) that happens in user-
based algorithms.
2.1.2 Model-Based Approach
Model-based techniques calculate utility (rating) predictions
based on a model learned from the underlying data using sta-
tistical and machine learning techniques [1]. This is the main
difference between the content-based filtering presented in
the next Section.
CF systems which use model-based approaches use the past
ratings to predict new recommendations [8]. This approach
is different from memory-based algorithms, because in this
case the system needs to learn the tastes of only one user
at a time to define the profile according to the ratings and
then make new recommendations. Thus, rating models are
created based on behavior recognition using data mining or
machine learning in the previously rated data of the active
user.
Breese [4] developed two probabilistic models to CF model-
based approach. The first uses clustering, where the users
are grouped in classes and their ratings are independent.
The second model uses Bayesian networks where the states
of each node corresponds to possible rating values for each
item. Recent models include the Markov decision processes
[41], Latent Dirichlet Allocation [15] and PLSI (probabilistic
latent semantic indexing) [14].
2.2 Content-Based Approach
Generally a content-based [33] (CB) recommender system
analyzes a set of document ratings by one user and then
uses the content of these documents as well as the ratings
to infer a profile that could be used to recommend relevant
items [43].
In contrast to CF, in the CB approach the profiles are indi-
vidual and developed only from the individual associations
with items previously visualized and rated by the active user
[26]. The recommendation is given by the similarity between
documents, analyzed by the content regularity compared to
others. For this reason, this kind of approach is hard to ap-
ply in documents like images, videos and music. However,
1
http://www.lastfm.com
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 105 -
what characterizes the CB approach is the close relation-
ship between users and items. CB approach was developed
to provide recommendations mainly based on textual items,
because the content in this case is usually described with
keywords [1].
TF-IDF (term frequency/inverse document frequency) is a
well known approach to information retrieval. In this ap-
proach TF is the frequency of times that the keyword i oc-
curs in a document j and IDF is the inverse frequency of a
document j to the keyword i, then the weight p of TF-IDF
for the keyword is given by
p
i,j
= TF
i,j
× IDF
i
.
The kind of profile derived by CB recommender system de-
pends on the method of learning being used. Decision trees,
neural networks and vector-based representation have al-
ready been developed [5].
2.3 Rule-based
Rule-based recommender systems generally use user infor-
mation, provided in an explicit way to recommend content.
The system rules can be adapted to the user data like de-
mographic location or information provided by them. For
instance, it is possible to recommend news or products ac-
cording to the region where users are located or to other
information provided in their profile such as age, gender,
tastes, etc. According to Mobasher [26] the primary draw-
backs of rule-based techniques emanate from methods used
for the generation of user profiles. The input is usually the
subjective description of users or their interests, and thus
is prone to bias. In addition, in systems like e-commerce,
the user taste is not updated and thus the system perfor-
mance degrades over time as the profiles age. However,
rule-based recommender systems have shown good results
to workaround the cold start problem [29].
2.4 Graph-based
Recently, the Web started a transformation process where
the collaboration between users and system became essen-
tial to disseminate information, changing also the relation-
ship among users in the web environment. Along with these
environment changes, appeared graph-based recommender
systems for social networks to explore the relationships be-
tween users and recommend content [49, 20, 51, 40]. This
approach in combination with CF could be a solution to the
cold start problem (Section 4.1), making initial content rec-
ommendations using the relationships among users in the
social network. The popularity of these environments is
due to the spontaneous user interaction, given the system
a large amount of data to analyze the user preferences. Fur-
thermore, on social media networks the information is more
specific because the users can express his/her tastes by using
ratings, reviews and tags.
The graph-based recommendation is a link prediction prob-
lem where connection nodes show how the relationship be-
tween user-user, user-resource or resource-resource occurs
and the challenge is to use this information to predict rec-
ommendations. Huang et. al. [16] developed a graph-based
recommender system using CF and CB approaches to sug-
gest books on a digital library. The graph model was devel-
oped with two layers: books and customers. Links between
book nodes represent the similarity among the books and
the same rule is used for the similarity among users.
Graph-based recommender approach is a growing research
area mainly because the popularity of social networks reaches
all kinds of people and can be applied in distinct environ-
ments such as e-commerce, social media, blogs, and so forth.
2.5 Hybrid Systems
Hybrid recommender systems join two or more approaches
and come from the effort to overcome the known problems
frequently related to new users and new items. New items
do not have previous ratings, therefore are not recommended
to the users. The new user problem happens because a new
user has no interaction with the system and there is no data
to create the personalized profile.
According to Burke [6], hybrid systems can be classified as
follows:
Weighted: a hybrid recommender system merges results from
different techniques.
Switching: different recommender systems are used accord-
ing to the recommendation criteria;
Mixed: recommendations from different systems are pre-
sented together;
Cascade: one recommender refines recommendations given
by another;
Feature combination: features from different recommenda-
tion data sources are combined into a single recommendation
algorithm.
Feature augmentation: one recommender system is used to
compute a result and then use this result as input values to
another recommendation system;
Fab [3] was developed using a combination of CF and CB.
In Spiegel’s work [46] ratings and content information are
used in a unified model to reduce the number of parameters
and get better recommendations. In [23], Google News
2
used CF and started to use together a CB system to predict
user interests by a Bayesian framework. The main objective
in hybrid systems is try to solve problems existing in each
recommender systems approach.
The next Section presents techniques to obtain data to use
in the recommender approaches presented so far.
3. DATA COLLECTION
Content recommendation is generated mainly from feedback
about user activities. In order to obtain the relevance of
each topic, product or content there must exist an interface
to allow us to analyze the user behavior and get feedback
about the users preferences. The feedback may be extracted
through an explicit [17, 21, 11, 2, 43] or implicit [31, 30, 50]
way, both described as follows:
2
http://news.google.com.br/
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 106 -
Implicit approach: uses techniques developed for monitoring
the user interactions with the systems. The main advantage
of this technique is to exempt the user effort to provide rat-
ings or feedback to the accessed content [19]. In the Ama-
zon
3
site, e.g., the user’s search history is used to identify
the item category being searched and suggest other items
from the same category.
Explicit approach: there are researches showing that despite
the good results of implicit approach, the explicit approach
is more effective to identify the profile to receive recommen-
dations [17, 19, 18]. It happens because, in this approach the
user is the one who informs the content relevance. In this
kind of approach the user usually has a link with the system,
i.e., it may be necessary the user’s registration to obtain rec-
ommendations. In Youtube
4
, site to share and view online
videos, it is possible for logged users to rate video relevance
and add them to the favorite list. This approach assumes
that when the video rating is relevant, the user will also be
interested in other videos from the same category. However,
recent researches show that the feedback of explicit approach
still needs to be improved: the information consistency pro-
vided by the user, in a recommender system that uses rating,
should be refined to characterize the relevant content to the
profile. This problem is related to the repetitive ratings that
cause noise, damaging the content relevance [2].
Initially, a recommendation system could extract content
from the user activities by the number of clicks and search
queries. However, with the advent of the Web 2.0 the space
for user interaction has increased, and other sources of infor-
mation began to be explored in order to generate recommen-
dations. For instance, the on-line radio last.fm requires users
to register in order to access content such as smart playlists
or personalized radio. This enables the system to moni-
tor actions such as content searches, mouse clicks, ratings,
and store information such as usage statistics and others.
Furthermore, tags and comments made explicitly by users
are also used now. With this information, the system per-
forms the data collection that will shape the user profile or
the group in which it will be included. Figure 1 illustrates
recommendation approaches and the type of data used to
extract information from the user interactions and to model
the user profile according to each distinct environment.
3.1 Clickstreams
Clickstreams are the records of the user actions on the Web
environment. This technique of data collection is used to
identify a user and the accessed items during his interaction
with the page or document, which enables a remote server to
maintain the records of identification and actions [12]. The
idea of storing mouse clicks supposes that if the user clicks
on a hiperlink the information contained in this link is con-
sidered more interesting than others that were not clicked in
that same document [50]. This analysis is important because
the communication with a user in the Web environment is
more restricted than communicating directly with that user
outside the system environment. Therefore, every user ac-
tion in the Web becomes important, since the access to a
content, subject or advertisement is made spontaneously by
3
http://www.amazon.com
4
http://www.youtube.com
hybrid system
Collaborative Filtering
Rule-based
Content-based
data
user interface
Graph-based
Tags
Query
Rating
Clicks
Figure 1: Recommender system approaches and in-
teraction possibilities for the user environment.
necessity, interest or curiosity.
In [8] click records are used to generate new recommenda-
tions in Google News. For instance, if a user clicks on the
same category over and over, e.g. sports, the recommenda-
tion system will identify the group of users that also access
this category, by measuring the similarity between the user
and the rest of the group to recommend content not yet vis-
ited by that user. The recommendation also occurs when a
news article appears in the list of Top Stories, which contains
the most accessed news by online readers. This recommen-
dation system fits in the context of CF systems, which use
content evaluation performed by user groups that share the
same interests, in order to generate future recommendations.
Once observing the user behavior by the clicks, it is possible
to monitor the passing parameters on the URLs. For exam-
ple, if a URL brings into its structure the user u and item
i that means that the recommendation of content will use
this information to develop the profile P of u or of i through
the relationship between them. This approach is important
because it does not rely on manual user ratings to identify
relevant content to his/her, since this information can be
inferred by analyzing how many clicks a given category is
receiving compared to the others.
3.2 Query history
It is common to find Web search engines that complement
the results of a search with a list of related searches [36].
The searching records from a user contain one of the im-
plicit feedbacks more currently used because typed words
in a search are directly related with the content of interest
of the user at the time of the access. The main challenge
is to identify the different interests of the users from their
research records. For example, when a user searches for the
word “latex” he/she can be searching for the set of macros
L
A
T
E
X or simply for the tree that originates latex, because
the interests of each user are different and, since the system
does not know the user, any information may be returned.
Moreover, new approaches are trying to improve the search
results by the combination between social bookmarking and
CF approach [25]. Regardless of the kind of approach used,
the aim of the query history technique is to identify the rel-
evance of the information that was delivered and then the
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 107 -
system learns by the user interactions which are the user’s
preferences.
On the Amazon site, the search records are used to suggest
unknown products to the active user and already seen by
similar users. This suggestion infers that the user that is
searching for an item i
1
can also be interested in the prod-
uct i
2
already seen by his neighbors. This is the same result
obtained by the CF technique, in other words, the same al-
gorithm that is used to find the similarity between users and
to group them with their neighbors. Similarly the ranking
related to the access of a given user to a given category of re-
sults helps the recommendation system to understand that
the content accessed makes part of his/her list of preferences.
3.3 Tags
Tags are terms freely chosen by users of online systems to
classify a subject, image, video, music or any content related
to a category or theme. It is a simple assignment of keywords
to the content being published.
In the Web 2.0 the use of explicit textual information is
becoming more popular [44, 13, 21, 24, 42], because the
assigning of meaning to the content sent by a user would
be laborious, in the case it was performed by system ad-
ministrators, so it became convenient to let users the free
classification of what is being published.
Categorizing subjects or things is known as a taxonomy and
generally performed by specialists. In the case of tags we call
those sets of assignments folksonomy for being performed by
people (folks), i.e., users that assign keywords according to
their preferences to classify the kind of publishing content.
In recommendation systems that use CF the tags are used
in order to define the users interests. Those systems are
based on the idea that users with similar interests share
similar tags [9]. According to Shepitsen et. al. [42] the
hierarchical clustering of tags to recommend personalized
navigation is effective to identify the interests of users as
well as to determine the topic of a content.
The popularity of systems that use tags is due to the user
freedom to define the category according to his/her prefer-
ences and quick proliferation of social media networks that
use this resource such as Flickr
5
, last.fm and YouTube be-
sides systems of bookmarking such as del.icio.us
6
, digg
7
etc.
Tags may classify content that characterizes the document
and relevance of the subject being published, using words
that give emphasis to the information, author, kind of pub-
lished document, date, region and events. More than one
tag is often associated to the document, ending up as tips
to the subject of which is being assigned.
In [52] an approach was developed with the goal of improv-
ing the result of the searches on Web 2.0: the social ranking
explores the similarity between users and tags. Gemmel [13]
proposed the adaptation of the k-NN neighborhood to the
users and tags and so identify the group which they belong.
5
http://www.flickr.com
6
http://www.delicious.com
7
http://www.dig.com
This kind of technique is the adaptation of the recommen-
dation systems of the CF to the recent area of folksonomy
that is ascending.
Initially the social networks used tags in order to ease the
navigation and as alternative of search, since those are the
information that will be related, for example, an image on
Flickr. However, the tags presented themselves in a wider
context when compared to links for content search, mainly
through the similarity between users and items, becoming
more popular in the recommendation area.
3.4 Ratings
When user feedback is performed spontaneously we call this
technique “explicit approach”. The evaluation of content
in the explicit approach consists on providing mechanisms
for the system to receive feedback from the user through
rating or manifestation of relevance of the content. Rating
approaches avoids the discrepancy that occurs in the evalua-
tion performed by ratings or quantity of stars. According to
Amatriain [21], extreme evaluations, i.e., maximum or mini-
mum ratings, are more consistent than the medium opinions
for the definition of the user preferences.
Considering feedback by evaluation, a recommendation sys-
tem defines and personalizes the order of importance to the
content that will be available [9].
4. CHALLENGES AND PROSPECTS
Many challenges were faced by each technique for content
recommendation. Among them we find the challenges re-
lated to deliver content to new users and items for recom-
mendation that were not rated. Both cases are known as
the cold start problem [39]. Other challenges include over-
specialization in CB systems and scalability in CF systems.
However, new methods of information retrieval are been de-
veloped, trying to analyze the relationship between users in
social networks, bringing new perspectives for recommender
systems. In this Section we will discuss the problems and
challenges being investigated to workaround the shortcom-
ings of each recommender approach and the perspectives
using new interaction techniques.
4.1 Cold start
The cold start problem occurs early in the development and
use of recommendation systems. To generate personalized
content, it is mandatory that the user have some previ-
ous interaction with the system and thus provide data to
the system to understand the tastes and define its profile.
That is, the cold start problem is related directly with new
users, new items [3] and new systems. In CB recommender
approach the new user problem occurs primarily because
when a user begins to use the system, there are not enough
clicks or search queries history to understand his/her profile
tastes. The same problem occurs to CF technique that uses
ratings to identify the similarity between users and, thus,
group them to suggest content. Hybrid systems like [3] were
developed to bypass this problem. however, there are other
researches being developed [34, 29] to recommend content to
new users and suggest new items, because the development
of the hybrid approach is usually laborious. The rule-based
approach may be a initial solution to the cold start problem,
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 108 -
using demographic rules to suggest content according to the
user location.
4.2 Overspecialization
In CB approach the user profile is based on his interactions
with the system and there is not a relationship with other
users. Furthermore, when a user evaluates an item, the rec-
ommendation will occur based only on the item category
which was accessed. This problem is known as overspecial-
ization, i.e., the user is limited to recommend items that are
always similar to those already rated because there is not
enough information to produce more recommendations. For
instance, a user in a news environment that access political
content will receive most of the content about this category.
It happens because the system learns that this kind of con-
tent is interesting to the active user. The problem is that
the user can be overloaded with repeated suggestions of the
same categories and maybe it is only a momentary interest.
To solve this problem there are implementations of hybrid
systems to take initial user’s characteristics and recommend
content rated by similar users.
4.3 Scalability
One of the main problems found in CF approach is related
to scalability. It happens because of the need of comput-
ing the similarity among users every time they have a new
item rating. The computational complexity of the method
grows linearly with the number of users, which is typical
in social networks and e-commerce sites, reducing system
performance that has a large daily access or with frequent
changes.
One of the ways to improve the system scalability in rec-
ommender approaches is using item-based algorithms [11]
to recommend similar items that were rated positively by
other users.
4.4 Social Networks and E-commerce
The combination between social networks and e-commerce
is a recent approach and still has under construction. We
observe this technique mainly among ebay
8
customers where
each user can be a seller, a buyer or both. The social graph
on e-commerce is given basically by the user’s interests for
other users. The relationship among users occurs when some
buyer saves a seller in his/her list of sellers. In e-commerce
environments it can be assumed that this seller has some in-
teresting product for this buyer. Having a huge of informa-
tion in social networks and e-commerce stores the potential
of the union between these environments could improve the
e-commerce using recommender systems and thus it reaches
distinct levels of end users.
5. CONCLUSION
In this paper we have discussed the main techniques to rec-
ommend content, the alternatives and challenges for infor-
mation retrieval and new perspectives to recommender sys-
tems.
The Web 2.0 provides new ways of interaction between users
and systems and the user feedback became essential to bet-
ter understand user tastes and interests. This is the main
8
http://ebay.com
reason for the explicit approach to get better acceptance
than other techniques for information retrieval, e.g., content
rating in social media networks. We have noticed a growing
popularity in CF approach due to the easy implementation
and quick initial training. Also, the folksonomy is showing
nice results as a way to obtain information and to recom-
mend content based on tags to categorize personal content.
This kind of categorization is growing and creating depen-
dent systems from tags provided by users and associations
created in the content posted.
We know that to deliver content in a more effective way, hy-
brid systems, ruled-based recommendation and social net-
works are being studied to promote the recommendation in
distinct environments. This is a growing area and there are
many approaches and techniques still under research. We
believe that the recommendation area is in a development
stage characterized by the user interactions through explicit
feedback, by CF approach, folksonomy and rating. The next
generation of recommender systems is expected to be based
on relationships through social networks in all kinds of en-
vironments such as e-commerce sites.
6. REFERENCES
[1] G. Adomavicius and A. Tuzhilin. Toward the next
generation of recommender systems: A survey of the
state-of-the-art and possible extensions. IEEE Trans.
on Knowl. and Data Eng., 17:734–749, June 2005.
[2] X. Amatriain, J. M. Pujol, N. Tintarev, and N. Oliver.
Rate it again: increasing recommendation accuracy by
user re-rating. In Proceedings of the third ACM
conference on Recommender systems, RecSys ’09,
pages 173–180, New York, NY, USA, 2009. ACM.
[3] M. Balabanovic and Y. Shoham. Fab: Content-based,
collaborative recommendation. Communications of the
ACM, 40:66–72, 1997.
[4] J. S. Breese, D. Heckerman, and C. Kadie. Empirical
analysis of predictive algorithms for collaborative
filtering. pages 43–52. Morgan Kaufmann, 1998.
[5] R. Burke. Hybrid recommender systems: Survey and
experiments. User Modeling and User-Adapted
Interaction, 12:331–370, November 2002.
[6] R. Burke. The adaptive web. pages 377–408, Berlin,
Heidelberg, 2007. Springer-Verlag.
[7] S. C. Cazella, E. Reategui, and L. O. C. Alvares.
E-commerce recommenders’ authority: applying the
user’s opinion relevance in recommender systems. In
Proceedings of the 12th Brazilian Symposium on
Multimedia and the web, WebMedia ’06, pages 71–78,
2006.
[8] A. S. Das, M. Datar, A. Garg, and S. Rajaram.
Google news personalization: scalable online
collaborative filtering. In Proceedings of the 16th
international conference on World Wide Web, WWW
’07, pages 271–280, New York, NY, USA, 2007. ACM.
[9] A. Dattolo, F. Ferrara, and C. Tasso. The role of tags
for recommendation: a survey. In Proc. of the 3rd
International Conference on Human System
Interaction - HSI’2010, pages 548–555, Rzeszow,
Poland, May 2010. IEEE press.
[10] J. Delgado and N. Ishii. Memory-based
weighted-majority prediction for recommender
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 109 -
systems, 1999.
[11] M. Deshpande and G. Karypis. Item-based top-n
recommendation algorithms. ACM Trans. Inf. Syst.,
22:143–177, January 2004.
[12] M. Eirinaki and M. Vazirgiannis. Web mining for web
personalization. ACM Trans. Internet Technol.,
3:1–27, February 2003.
[13] J. Gemmell, T. Schimoler, M. Ramezani, and
B. Mobasher. Adapting K-nearest neighbor for tag
recommendation in folksonomies. In S. S. Anand,
B. Mobasher, A. Kobsa, and D. Jannach, editors,
ITWP, volume 528 of CEUR Workshop Proceedings.
CEUR-WS.org, 2009.
[14] T. Hofmann. Probabilistic latent semantic analysis. In
In Proc. of Uncertainty in Artificial Intelligence,
UAI?99, pages 289–296, 1999.
[15] T. Hofmann. Latent semantic models for collaborative
filtering. ACM Trans. Inf. Syst., 22:89–115, January
2004.
[16] Z. Huang, W. Chung, T.-H. Ong, and H. Chen. A
graph-based recommender system for digital library.
In JCDL, pages 65–73. ACM, 2002.
[17] G. Jawaheer, M. Szomszor, and P. Kostkova.
Characterisation of explicit feedback in an online
music recommendation service. In Proceedings of the
fourth ACM conference on Recommender systems,
RecSys ’10, pages 317–320, New York, NY, USA,
2010. ACM.
[18] T. Kamba, H. Sakagami, and Y. Koseki.
Anatagonomy: a personalized newspaper on the world
wide web. Int. J. Hum.-Comput. Stud., 46:789–803,
June 1997.
[19] D. Kelly and J. Teevan. Implicit feedback for inferring
user preference: a bibliography. SIGIR Forum,
37:18–28, September 2003.
[20] I. Konstas, V. Stathopoulos, and J. M. Jose. On social
networks and collaborative recommendation. July 20
2009.
[21] H. Liang, Y. Xu, Y. Li, R. Nayak, and L.-T. Weng.
Personalized recommender systems integrating social
tags and item taxonomy. In Proceedings of the 2009
IEEE/WIC/ACM International Joint Conference on
Web Intelligence and Intelligent Agent Technology -
Volume 01, WI-IAT ’09, pages 540–547, Washington,
DC, USA, 2009. IEEE Computer Society.
[22] G. Linden, B. Smith, and J. York. Amazon.com
recommendations: Item-to-item collaborative filtering.
IEEE Internet Computing, 7:76–80, January 2003.
[23] J. Liu, P. Dolan, and E. R. Pedersen. Personalized
news recommendation based on click behavior. In
Proceeding of the 14th international conference on
Intelligent user interfaces, IUI ’10, pages 31–40, New
York, NY, USA, 2010. ACM.
[24] P. Lops, M. de Gemmis, G. Semeraro, P. Gissi,
C. Musto, and F. Narducci. Content-based filtering
with tags: The first system. In ISDA, pages 255–260.
IEEE Computer Society, 2009.
[25] B. Merlin and C. d. Souza. Implicit social
bookmarking to improve web searches. In Proceedings
of the 2009 Simposio Brasileiro de Sistemas
Colaborativos, SBSC ’09, pages 36–43, Washington,
DC, USA, 2009. IEEE Computer Society.
[26] B. Mobasher. Data mining for web personalization. In
The Adaptive Web: Methods and Strategies of Web
Personalization, chapter 3, pages 90–135. 2007.
[27] B. Mobasher, H. Dai, T. Luo, and M. Nakagawa.
Effective personalization based on association rule
discovery from web usage data. In Proc. of the 3rd int.
workshop on Web information and data management
(WIDM ’01), pages 9–15, New York, NY, USA, 2001.
ACM.
[28] S. Murugesan. Understanding web 2.0. IT
Professional, 9(4):34–41, 2007.
[29] A.-T. Nguyen, N. Denos, and C. Berrut. Improving
new user recommendations with rule-based induction
on cold user data. In J. A. Konstan, J. Riedl, and
B. Smyth, editors, RecSys, pages 121–128. ACM, 2007.
[30] D. M. Nichols. Implicit rating and filtering. In In
Proceedings of the Fifth DELOS Workshop on
Filtering and Collaborative Filtering, pages 31–36,
1998.
[31] J. Oh, S. Lee, and E. Lee. A user modeling using
implicit feedback for effective recommender system. In
Proceedings of the 2008 International Conference on
Convergence and Hybrid Information Technology,
pages 155–158, Washington, DC, USA, 2008. IEEE
Computer Society.
[32] S. G. W. L. S. A. Patricia Cohen, Jacob Cohen.
Applied multiple regression/correlation analysis for
the behavioral sciences, 2002.
[33] M. J. Pazzani and D. Billsus. Content-based
recommendation systems. In The Adaptive Web:
Methods and Strategies of Web Personalization,
chapter 10, pages 325–341. 2007.
[34] A. M. Rashid, I. Albert, D. Cosley, S. K. Lam, S. M.
McNee, J. A. Konstan, and J. Riedl. Getting to know
you: learning new user preferences in recommender
systems. In IUI, pages 127–134, 2002.
[35] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, and
J. Riedl. Grouplens: an open architecture for
collaborative filtering of netnews. In Proceedings of the
1994 ACM conference on Computer supported
cooperative work, CSCW ’94, pages 175–186, New
York, NY, USA, 1994. ACM.
[36] E. Sadikov, J. Madhavan, L. Wang, and A. Halevy.
Clustering query refinements by user intent. In
Proceedings of the 19th international conference on
World wide web, WWW ’10, pages 841–850, New
York, NY, USA, 2010. ACM.
[37] G. Salton and M. J. McGill. Introduction to Modern
Information Retrieval. McGraw-Hill, Inc., New York,
NY, USA, 1986.
[38] B. Sarwar, G. Karypis, J. Konstan, and J. Reidl.
Item-based collaborative filtering recommendation
algorithms. In Proceedings of the 10th international
conference on World Wide Web, WWW ’01, pages
285–295, New York, NY, USA, 2001. ACM.
[39] A. I. Schein, A. Popescul, L. H. Ungar, and D. M.
Pennock. Methods and metrics for cold-start
recommendations. In Proceedings of the 25th annual
international ACM SIGIR, SIGIR ’02, pages 253–260,
New York, NY, USA, 2002. ACM.
[40] A. Seth and J. Zhang. A social network based
approach to personalized recommendation of
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 110 -
participatory media content. In E. Adar, M. Hurst,
T. Finin, N. S. Glance, N. Nicolov, and B. L. Tseng,
editors, ICWSM. The AAAI Press, 2008.
[41] G. Shani, D. Heckerman, and R. I. Brafman. An
mdp-based recommender system. J. Mach. Learn.
Res., 6:1265–1295, December 2005.
[42] A. Shepitsen, J. Gemmell, B. Mobasher, and
R. Burke. Personalized recommendation in social
tagging systems using hierarchical clustering. In
Proceedings of the 2008 ACM conference on
Recommender systems, RecSys ’08, pages 259–266,
New York, NY, USA, 2008. ACM.
[43] Y. Shi, M. Larson, and A. Hanjalic. Exploiting user
similarity based on rated-item pools for improved
user-based collaborative filtering. In Proceedings of the
third ACM conference on Recommender systems,
RecSys ’09, pages 125–132, New York, NY, USA,
2009. ACM.
[44] S. Siersdorfer and S. Sizov. Social recommender
systems for web 2.0 folksonomies. In Proceedings of the
20th ACM conference on Hypertext and hypermedia,
HT ’09, pages 261–270, New York, NY, USA, 2009.
ACM.
[45] E. M. Silva, E. R. Pinto, R. A. Costa, L. R. B.
Schmitz, and S. R. L. Meira. Recommending domain
experts in a social network. In Proceedings of the 2009
Simposio Brasileiro de Sistemas Colaborativos, SBSC
’09, pages 184–192, 2009.
[46] S. Spiegel, J. Kunegis, and F. Li. Hydra: a hybrid
recommender system [cross-linked rating and content
information]. In Proceeding of the 1st ACM
international workshop on Complex networks meet
information &#38; knowledge management, CNIKM
’09, pages 75–80, New York, NY, USA, 2009. ACM.
[47] X. Su and T. M. Khoshgoftaar. A survey of
collaborative filtering techniques. Adv. in Artif. Intell.,
2009:4:2–4:2, January 2009.
[48] X. Tan, M. Yao, and M. Xu. An effective technique for
personalization recommendation based on access
sequential patterns. In APSCC, pages 42–46. IEEE,
2006.
[49] Z. Wang, Y. Tan, and M. Zhang. Graph-based
recommendation on social networks. In W.-S. Han,
D. Srivastava, G. Yu, H. Yu, and Z. H. Huang, editors,
APWeb, pages 116–122. IEEE Computer Society,
2010.
[50] S. Xu, H. Jiang, and F. C. Lau. Personalized online
document, image and video recommendation via
commodity eye-tracking. In Proceedings of the 2008
ACM conference on Recommender systems, RecSys
’08, pages 83–90, New York, NY, USA, 2008. ACM.
[51] M. Ye, P. Yin, and W.-C. Lee. Location
recommendation for location-based social networks. In
Proceedings of the 18th SIGSPATIAL International
Conference on Advances in Geographic Information
Systems, GIS ’10, pages 458–461, New York, NY,
USA, 2010. ACM.
[52] V. Zanardi and L. Capra. Social ranking: Finding
relevant content in web 2.0. In Intl. Workshop on
Recommender Systems, 2008.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 111 -
Ativistas, passageiros, ocasionais e especialistas
Perfis de usuário na construção de um site de Q&A

Adabriand Furtado
Universidade Federal de Campina Grande
Av. Aprígio Veloso, 882,
Campina Grande - PB
+55 83 2101 1684
adabriand@lsd.ufcg.edu.br
Nazareno Andrade
Universidade Federal de Campina Grande
Av. Aprígio Veloso, 882,
Campina Grande - PB
+55 83 2101 1684
nazareno@computacao.ufcg.edu.br

RESUMO
Entender a estrutura e dinâmica de funcionamento de sistemas de
Question and Answer (Q&A) é imprescindível no
desenvolvimento de mecanismos para incentivar e melhor
aproveitar a produção de conteúdo por parte dos usuários. Neste
artigo, exploramos os padrões de comportamento de usuários em
um site de Q&A de grande porte segundo métricas de motivação
(quantidade de contribuições) e habilidade (qualidade das
contribuições) dos usuários. Nossos resultados revelam quatro
perfis principais: ativistas, usuários que contribuem muito por um
longo período; passageiros, usuários com uma curta permanência
e que fazem contribuições de qualidade mediana ou baixa;
ocasionais, usuários que permanecem por um longo período,
porém contribuindo esporadicamente; e especialistas: usuários
semelhantes aos ocasionais, mas que são hábeis na execução de
um tipo de atividade. Ao examinar a parcela de contribuição dos
grupos formados por esses perfis, observamos que passageiros e
ocasionais colaboram com os ativistas na construção da ampla
maioria do corpo de contribuições, e que a ausência de qualquer
um destes perfis possivelmente degradaria o desempenho do
sistema. Com respeito aos especialistas, identificamos que a sua
representatividade no total de contribuições é pequena. Esta
descoberta motiva o desenvolvimento de mecanismos para
incentivar a participação desses usuários.
Palavras-chave: Comunidade de Pergunta e Resposta,
comportamento de usuários, perfis de usuários.

ABSTRACT
Understanding the structure and dynamics of operating Question
and Answer (Q&A) systems is essential for the development
mechanisms that encourage and better leverage the content
production of different user profiles. In this paper, we explore the
patterns of user behavior according to metrics capturing
motivation (amount of contribution) and ability (quality of the
contributions). Our results reveal four main user profiles:
activists, users who make a large number of contributions for a
long period; passengers, those users with a short permanence and
who make medium or low quality contributions; occasionals,
users who stay for a long period, however sporadically contribute;
and specialists, similar to occasionals users, but who are skilled in
performing a kind of activity. By analysing the parcel of
contribution of each group formed by these profiles, we observed
that passengers and ocassionals collaborate with activists in the
construction of the majority of contributions, and the lack of any
of these profiles possibly would degrade the system performance.
In regard of the specialists, we discovered that their representation
in the total of contributions is small. This finding motivates the
development of mechanisms to stimulate the participation of these
users.
Keywords: Question and answer community, user behavior,
user profiles
ACM Classification Keywords: H5.3. Group and
Organization Interfaces: Computer-supported cooperative work.
General Terms: Measurement, Human Factors
1. INTRODUÇÃO
Recentemente, o modelo de produção de conhecimento Question
and Answer (Q&A) tem sido amplamente utilizado: o site Yahoo
Answers chegou à marca de 24 milhões de questões resolvidas [3]
e o Naver Knowledge iN, maior site de Q&A da Coreia do Sul,
agrega mais de 60 milhões de postagens (perguntas e respostas)
geradas por usuários [4]. Outros sites de Q&A se destacam pelo
seu alto desempenho, como é o caso do StackOverflow, onde 92%
de um total de mais de um milhão e meio de perguntas sobre
programação possuem respostas, e o tempo mediano para se obter
uma resposta é de aproximadamente 11 minutos [5].
A compreensão da estrutura e da dinâmica de sites de Q&A é
importante no desenvolvimento de novas comunidades, bem como
no aperfeiçoamento da operação das existentes. Em particular,
conhecer os padrões de comportamento dos usuários - por
exemplo quanto às suas motivações [4] (desejo de aprender,
altruísmo, hobby, etc.) - auxilia o desenvolvimento de
mecanismos para incentivar e melhor aproveitar a produção de
conteúdo dos diferentes perfis de usuários.
Neste contexto, diversos trabalhos [3][4][5] têm procurado
identificar padrões de participação de usuários e o efeito desses
padrões no funcionamento do sistema. No entanto, estes estudos
em geral identificam perfis de usuários considerando apenas
aspectos de seu comportamento relacionados ao volume de
contribuições gerado, como a frequência de postagem de
perguntas e respostas. Em contraste, há pouco conhecimento

.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 112 -
sobre padrões de comportamento de usuários considerando não só
quantidade, mas também qualidade de sua atuação no sistema,
como por exemplo a avaliação das respostas geradas por um
usuário. De fato, Gazan [8] revisou a literatura de estudos em
Q&A e observou que faltam concepções mais refinadas dos
participantes e de seus papéis com relação às atividades de
perguntar, responder e avaliar.
Neste trabalho, exploramos os padrões de comportamento de uma
comunidade de Q&A segundo aspectos da quantidade e qualidade
das contribuições geradas pelos usuários do sistema. Nosso estudo
analisa a comunidade de Q&A Super User, com cerca de 64 mil
usuários e 230 mil postagens. A Super User é baseada na
plataforma para comunidades de Q&A StackExchange
1
, que
publica periodicamente uma base completa de dados
2
sobre suas
comunidades. Nossa abordagem para extrair padrões de
comportamento dos dados parte de um conjunto de métricas de
motivação (quantidade de contribuição) e de habilidade
(qualidade das contribuições) do usuário. Partindo das métricas
que definimos, identificamos grupos de usuários com
comportamento semelhante combinando dois algoritmos de
agrupamento de usuários, um hierárquico e outro não hierárquico.
Nossos resultados revelam nove perfis de usuários que podem ser
classificados em quatro tipos principais: ativistas (cerca de 1% do
total), usuários que contribuem muito, passam um longo tempo no
sistema e têm bom desempenho nas métricas de habilidade;
passageiros (cerca de 74%), usuários com pequena contribuição,
que abandonam a comunidade rapidamente e cujas contribuições
são medianas ou de baixa qualidade; ocasionais (cerca de 18%),
usuários que permanecem no sistema por um longo período, mas
que contribuem esporadicamente e não se sobressaem nas
métricas de habilidade; e especialistas (cerca de 7%), usuários
que se assemelham aos ocasionais quanto à motivação, mas
apresentam uma alta habilidade na execução de um tipo específico
de atividade, como perguntas, respostas ou comentários.
Aliada à descoberta dos perfis na comunidade, utilizamos a
categorização dos usuários para examinar o quão importante cada
grupo é para o funcionamento do site de Q&A que examinamos.
Desta análise, observamos que usuários poucos ativos como os
dos perfis Passageiros e Ocasionais, colaboram com os ativistas
na construção da ampla maioria do corpo de contribuições, tanto
sob a perspectiva da quantidade quanto da qualidade. Ao
examinar cada grupo separadamente, notamos que o sistema
possivelmente sofreria uma perda significativa de desempenho
caso os usuários de qualquer um destes tipos de perfis não
estivessem presentes na comunidade.
Ademais, ao observar a contribuição conjunta do grupo de
especialistas, identificamos que embora eles se mantenham na
comunidade por um longo período e sejam hábeis, a sua
representatividade no total de contribuições é pequena. Esta
observação motiva o desenvolvimento de mecanismos para
incentivar a participação deste tipo de usuário.
No restante deste artigo, posicionamos o nosso estudo dentro dos
trabalhos relacionados (Seção 2); descrevemos o funcionamento
de um site típico da plataforma StackExchange (Seção 3) e
esclarecemos o método utilizado para agrupar os usuários da
comunidade Super User (Seção 4). Em seguida, apresentamos

1
http://stackexchange.com/
2
http://blog.stackoverflow.com/category/cc-wiki-dump/
uma interpretação dos perfis observados (Seção 5) e o
desempenho de cada grupo no funcionamento do site (Seção 6).
Por fim, discutimos as implicações destes resultados no estudo de
sistemas de computação social, em especial os sites de Q&A.
2. REVISÃO DA LITERATURA
Trabalhos anteriores buscaram identificar e explicar
comportamentos típicos dos usuários na construção do
conhecimento coletivo em sites de Q&A.
Mamykina et al. [5] conduziram um estudo na comunidade
StackOverflow, maior comunidade da plataforma para sites de
Q&A StackExchange. Na análise de desempenho do
StackOverflow, padrões de uso do sistema foram identificados
com base na frequência com que usuários proveem respostas
durante sua participação no sistema. Como resultado, foram
observados 4 tipos de perfis: ativistas da comunidade; shooting
stars, usuários registrados com um único pico atividade; low-
profile, usuários registrados que nunca tiveram alta atividade;
lurkers e visitantes, usuários sem atividade. Apesar da pequena
presença de ativistas da comunidade e shooting stars, a
contribuição total destes usuários chega a quase metade das
respostas no sistema.
Um estudo similar foi realizado por Nam et al. [4] na comunidade
Naver Knowledge-iN. Este estudo de caso também teve por
objetivo identificar padrões na participação dos usuários e
explicar os fatores que motivam a contribuição dos usuários,
complementada por uma análise qualitativa. Neste contexto, os
seguintes padrões foram observados: separação clara dos usuários
com o perfil de questionador e respondedor; os usuários mais
ativos, cerca de 1%, proveem aproximadamente metade de todas
as respostas do sistema, e a grande maioria dos usuários tem uma
participação altamente intermitente.
Com o objetivo de entender a atividade de compartilhamento na
comunidade de Q&A Yahoo Answers, Adamic et al. [3]
identificaram padrões nas interações entre usuários nas diversas
categorias (sub-fóruns). Além dos perfis de perguntador e,
respondedor, observou-se em certas categorias um perfil de
usuários que tem ambas as características, denominado de
'discutidores¨.
Kang et al [2] também buscaram entender como os usuários agem
dentro de uma comunidade de Q&A, analisando como os
relacionamentos criados pelos usuários influenciam seu próprio
comportamento. A partir de uma análise focada apenas nos
usuários ativistas, foram observados indícios de que estes usuários
estão mais interessados em ajudar e obter reconhecimento.
Alguns destes trabalhos também tentaram mostrar uma relação
entre métricas de participação e habilidade dos usuários: Nam et
al. [4] observaram uma correlação positiva entre a quantidade de
períodos ativos e a qualidade das respostas dos usuários,
indicando que usuários mais comprometidos com o sistema são
mais propensos a prover boas respostas. Kang et al. [2]
identificaram que a competição repetida com certos usuários
desestimulou a produção de respostas de qualidade de alguns
usuários, supostamente pela menor chance de ter a resposta aceita.
Farzan et al. [1] combinaram métricas de motivação e habilidade
para identificar potenciais experts, utilizando dados de atividade
das suas primeiras semanas.
De forma geral, observamos que há bastante esforço dedicado a
compreensão das diversas formas de participação de um usuário
em comunidades de Q&A, geralmente sob a perspectiva de
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 113 -
quantidade de contribuição provida. Contudo, faltam estudos que
considerem em conjunto quantidade e qualidade das
contribuições, com o propósito de revelar padrões que relacionem
estas duas dimensões. Apenas um estudo [1] observou as
dimensões de quantidade e qualidade de comportamento dos
usuários de sites de Q&A em conjunto, e ele focou em apenas um
perfil, os experts. Nosso estudo complementa o estado da arte
investigando que perfis descrevem todos os usuários de um site de
Q&A de grande porte segundo dimensões de quantidade e
qualidade das contribuições realizadas no sistema.
3. FUNCIONAMENTO DE UMA
COMUNIDADE DO STACKEXCHANGE
As comunidades do StackExchange seguem o modelo comum de
sites de Q&A. Na Figura 1, temos uma página típica de uma
questão com suas respostas e comentários. As etapas comuns no
processo de um usuário obter uma resposta são as seguintes:
1. O usuário posta uma questão.
2. A pergunta criada é visualizada por outros usuários, que
podem votar sobre a utilidade ou não da questão e
marcar a questão como favorita.
3. Caso um usuário poste uma resposta, ela será agregada à
pergunta, e também será avaliada através de votos da
comunidade. Os votos são utilizados para definir a
ordem em que perguntas e respostas são apresentadas.
4. O perguntador e os respondedores podem fazer
comentários tanto na questão em si quanto nas
respostas. De forma semelhante a perguntas e respostas,
os comentários também podem ser votados.
5. Por fim, o perguntador escolhe qual das respostas lhe
foi mais útil, e marca esta como a melhor resposta.
Para um novo usuário de uma das comunidades do
StackExchange, as seguintes funcionalidades são oferecidas:
postar perguntas e respostas, fazer edições e comentários nestas,
definir qual a melhor resposta recebida de suas perguntas e
adicionar questões aos seus favoritos.

Figura 1. Página referente a uma questão na plataforma
StackExchange.
À medida que o usuário participa da comunidade e as suas
contribuições são avaliadas, este usuário adquire pontos de
reputação. Ao atingir uma quantidade pré-estabelecida de
reputação, o usuário ganha acesso a certas funcionalidades, que
são geralmente meios para a realização de atividades de
moderação. Por exemplo, com 15 pontos, o usuário pode dar
votos positivos nas questões, respostas e comentários. Com 50
pontos, o usuário pode fazer comentários nas postagens de outros
usuários.
Com base nesta descrição do funcionamento de uma comunidade
do SE, vemos que um usuário pode desempenhar diversas
atividades. Estes usuários perguntam, respondem, comentam e
avaliam o conteúdo gerado, e fazendo isto, além de estarem
construindo colaborativamente a comunidade, estão socializando
entre si.
4. METODOLOGIA
Duas perguntas de pesquisa guiam este estudo:
P1. Que perfis de usuários são identificados em um site típico de
perguntas e respostas considerando as perspectivas de
quantidade e qualidade da atividade dos usuários?
P2. Que papel cada um desses grupos desempenha no
funcionamento do site?
A primeira pergunta visa contribuir para o entendimento dos tipos
de usuário que existem no sistema, enquanto a segunda foca na
visão da importância de cada grupo no funcionamento da
comunidade. A observação da quantidade e da qualidade da
contribuição agregada de cada grupo nos dá indícios de como
estes grupos em conjunto constroem a comunidade.
A estratégia de investigação é empírica e consiste em um estudo
de caso aplicado numa das comunidades da plataforma SE, o
Super User. Nesta comunidade as perguntas são focadas em
software e hardware de computadores. Esta escolha se deve a dois
motivos: é a segunda maior comunidade da plataforma, com cerca
de 64 mil usuários registrados e 230 mil postagens, e o seu
tamanho não é proibitivo para o processamento que realizamos.
Os dados completos das atividades dos usuários estão disponíveis
publicamente sob a licença Creative Commons, e compreendem o
período entre a criação do sistema em julho de 2009 e março
de 2011. No processamento desses dados, não tratamos nem
contamos as pessoas que usam o site sem se registrar.
O estudo de caso que realizamos é ao mesmo tempo exploratório
e confirmatório. Por um lado, desconhecemos os padrões de
comportamento do Super User e a distribuição de usuários nos
perfis definidos por esses padrões. Nosso estudo de caso explora
esses aspectos do sistema. Por outro lado, o estudo também é
confirmatório, pois nos permite verificar se os perfis identificados
no Super User se assemelham a perfis já encontrados na literatura.
O problema de identificar perfis de usuários na comunidade é
equivalente ao de identificar grupos homogêneos de usuários
segundo seu comportamento no sistema. Neste estudo, abordamos
essa busca por uma estrutura natural nos dados através de técnicas
de análise de agrupamento [9]. Essa técnica é particularmente
adequada para o aspecto exploratório deste trabalho, onde não
sabemos que grupos serão observados nos dados a priori.
Na análise de agrupamento, objetos são agrupados com base na
sua similaridade segundo um conjunto de características. As
métricas que consideramos para caracterizar os usuários e realizar
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 114 -
os agrupamentos são de dois tipos, motivação e habilidade, e
estão listadas a seguir:
Métricas de motivação
x Número de respostas fornecidas pelo usuário.
x Número de perguntas feitas pelo usuário.
x Número de comentários fornecidos pelo usuário.
x Número de moderações realizadas. São consideradas
atividades de moderação: votos dados e a marcação de
questões como favorito.
x Tempo de vida do usuário no sistema, que consiste no
intervalo de tempo entre a criação da sua conta e seu
último acesso à comunidade.
Métricas de habilidade
x Guru Score: métrica definida por Nam et al. [4], que
avalia o conhecimento de um usuário segundo o
julgamento feito pelo criador da pergunta que ele
respondeu. O seu cálculo é feito a partir do número de
respostas marcadas como melhor resposta. Além de
incluir o número de melhores respostas no cálculo, o
Guru Score também considera o contexto em que ela foi
obtida. Por exemplo, caso haja muita concorrência para
responder uma dada questão, o Guru Score computado
do usuário será alto.
x Utilidade média das respostas (UMRespostas): avalia o
conhecimento do usuário, mas diferentemente do Guru
Score, leva em consideração o julgamento da
comunidade. A utilidade média das respostas de um
usuário é definida comparando a pontuação (diferença
entre votos positivos e votos negativos) das respostas
que o usuário gerou com a pontuação das demais
respostas para as mesmas questões. Mais precisamente,
definimos a utilidade de cada resposta de um usuário
como a pontuação da resposta normalizada (z-score)
considerando as demais respostas para a mesma
questão. Este valor representa o quanto a resposta se
destacou. Consideramos então a utilidade média das
respostas de um usuário como sendo a média aritmética
deste valor para todas as suas respostas.
x Utilidade média das perguntas (UMPerguntas): medida
através das pontuações e da quantidade de favoritos
recebidos nas questões criadas por um usuário.
Consideramos a pontuação e o voto de favorito com
peso igual, logo a utilidade total de uma questão é soma
destes dois valores.
x Utilidade média dos comentários (UMComentários):
medida pela pontuação dos comentários do usuário, de
maneira análoga à utilidade média das respostas. No
cálculo desta métrica, os comentários que um usuário
faz nas suas próprias questões foram desconsiderados.
Observamos que estes comentários geralmente não são
avaliados por outros usuários, porque tipicamente
apresentam um teor de conversação, requisição ou
esclarecimento, e não de informação.
O conjunto de métricas consideradas define o espaço onde a
similaridade entre os usuários será calculada. Nosso agrupamento
é feito utilizando a medida mais comum de similaridade para
agrupamento, a distância euclidiana generalizada para um espaço
multidimensional. De forma a evitar resultados distorcidos pela
escala, as métricas foram normalizadas, calculando seu z-score.
A análise de agrupamento envolve também a escolha do método
de agrupamento. Na literatura, há dois tipos principais de
algoritmos: nos hierárquicos, os objetos são combinados (ou
divididos) iterativamente em grupos. Como resultado, é produzida
uma estrutura similar a uma árvore (dendrograma), a qual
descreve a formação dos grupos e contém N - 1 possíveis soluções
de agrupamento, onde N é o número de objetos. O segundo tipo
de algoritmo é o não-hierárquico: este tipo de técnica produz uma
única solução de grupo de tamanho K, onde K é a quantidade de
sementes passadas como parâmetro. Essas sementes são valores
iniciais para os centros do agrupamento.
O tamanho da população da comunidade Super User cerca de 64
mil usuários torna impraticável aplicar um método hierárquico,
pois esse tipo de método exige a computação de uma matriz de
similaridade NxN. Os métodos não-hierárquicos, por sua vez, são
mais eficientes para o processamento de grandes massas de dados,
mas têm a qualidade do agrupamento final diretamente ligada às
sementes fornecidas como parâmetro de entrada. Por essa razão,
tipicamente não é uma abordagem segura utilizar sementes
randômicas. Considerando as desvantagens de ambos os métodos
em nosso contexto, optamos por uma combinação dos dois que
provê ao mesmo tempo precisão e escalabilidade [7].
Essa combinação funciona da seguinte maneira: inicialmente,
selecionamos uma amostra aleatória da população e aplicamos o
método hierárquico. Com base nestes resultados, avaliamos que
solução de agrupamento é representativa para nosso estudo e a
utilizamos para gerar as sementes iniciais para um procedimento
não-hierárquico. A seguir, usamos as sementes derivadas no
método hierárquico para aplicar o método não-hierárquico em
toda a população do sistema. Ao usar as sementes produzidas pelo
método hierárquico, esperamos resultados mais acurados de
agrupamento.
Como método hierárquico, usamos o algoritmo proposto por
Ward [10]. Neste método, grupos são combinados minimizando a
soma do quadrado dos erros internos dos grupos. Esse algoritmo
se adapta bem a nosso contexto devido a sua tendência a não
formar grupos com uma única observação. Para o método não
hierárquico, usamos o método k-means clássico de Hartigan &
Wong [6].
5. IDENTIFICANDO PERFIS NA
COMUNIDADE SUPER USER
Nesta seção, aplicamos a metodologia descrita para identificar os
perfis de usuários na comunidade Super User. Esse processo está
dividido em três etapas: decisão do número de grupos a serem
usados, agrupamento e interpretação dos grupos encontrados.
5.1 Decisão do número de grupos
Uma amostra aleatória de 11 mil usuários foi extraída dos dados
do Super User, representando aproximadamente 17% do total de
usuários. O algoritmo hierárquico de Ward foi executado nesta
amostra, utilizando as métricas e medidas de similaridade
especificadas. Na Figura 2, observamos que ao aumentar o
número de grupos, ganhamos em homogeneidade, qualidade que
desejamos. No entanto, uma solução com uma quantidade alta de
grupos torna a interpretação impraticável. Desta forma,
consideramos os resultados de grupos com tamanhos na faixa
entre 8 e 10, onde a variação do ganho em homogeneidade é
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 115 -
pequena. A solução com 9 grupos foi determinada como a melhor
neste estudo, pois ao reduzir a quantidade de grupos para 8, um
grupo notadamente distinto desaparece; ao considerar 10 grupos,
um novo grupo sem destaque surge.

Figura 2. Análise da heterogeneidade dos grupos em função do
número de grupos utilizado.
5.2 Agrupamento combinando algoritmos
hierárquico e não-hierárquico
Em seguida, uma estimativa dos centros do agrupamento do
hierárquico foi computada através da média do valor das métricas
em cada grupo. Estes centros são fornecidos como sementes
iniciais do algoritmo k-means, que é executado com os dados de
todos os usuários da comunidade. Como resultado deste
agrupamento, obtivemos 9 centros com os valores normalizados
expostos na Figura 3 e os não normalizados na Tabela 1.
5.3 Interpretação dos grupos
Nesta etapa, examinamos o centro de cada grupo, com objetivo de
dar uma interpretação para os agrupamentos observados. Os
rótulos destes grupos, e que serão discutidos no restante do
trabalho, estão apresentados abaixo:
1. Passageiros: os usuários deste grupo participam pouco da
comunidade, passam um tempo relativamente pequeno no sistema,
cerca de um mês, e são neutros em agregar conteúdo de qualidade,
devido aos valores próximos à zero nas métricas de habilidade.
2. Passageiros imperitos: os usuários deste grupo são
semelhantes ao perfil Passageiros, com uma diferença que eles
respondem mais e suas respostas não são bem avaliadas, tanto
pelo perguntador (baixo Guru Score) quanto pela comunidade
(baixa utilidade média das respostas).
3. Ocasionais e fiéis: estes usuários estão há bastante tempo no
sistema, têm uma quantidade de participação moderada e não se
destacam em nenhuma das métricas de habilidade.
4. Bons respondedores: estes usuários contribuem com poucas
respostas, que são boas ao julgamento da comunidade em geral,
mas apresentam um guru score médio não tão alto. Por alguma
razão as respostas destes usuários não são comumente
selecionadas como a melhor pelo perguntador.
5. Gurus casuais: são usuários com um excelente desempenho na
contribuição de respostas. Eles são avaliados positivamente tanto
na métrica Guru Score quanto na utilidade média das respostas, e
de maneira similar aos Bons respondedores, não são muito ativos.
6. Perguntadores cidadãos: a característica principal deste grupo
é a alta qualidade de perguntas geradas. Além disso, estes usuários
são relativamente ativos em produzir perguntas, respostas,
comentários, e principalmente moderações. A combinação destas
características sugere que estes usuários estão bastante alinhados
às políticas da comunidade.
7. Comentaristas oportunos: estes usuários são moderadamente
ativos, mas se destacam pela boa avaliação dos seus comentários.
8. Ativistas da comunidade: os usuários deste grupo estão há
bastante tempo no sistema, e se sobressaem em todas as métricas
de motivação, principalmente na geração de perguntas. Além
disso, as perguntas geradas por esse tipo de usuário são
frequentemente úteis. Estes valores altos nas métricas de
motivação são indicativos de que estes usuários são altamente
comprometidos com a comunidade.
9. Hiperativos especialistas: estes usuários são tão motivados
quanto o perfil Ativistas da comunidade, mas se destacam na
quantidade desproporcional de respostas (1,4 por dia, em média),
comentários (2,3 por dia, em média) e moderações (3,4 por dia,
em média) realizadas. Com relação às métricas de habilidade, eles
se destacam por serem ótimos respondedores, perguntadores e
comentaristas.
O tamanho de cada um dos grupos, exposto na Tabela 1,
demonstra que grande parte dos usuários se concentra em 3 perfis:
Passageiros (~62,2%), Passageiros imperitos (~11,7%) e
Ocasionais fiéis (~18,4%). Uma característica comum entre estes
usuários é o fraco índice de motivação. Por outro lado, os grupos
restantes somam juntos apenas 7,7% e se destacam por serem
especializados em pelo menos um tipo de contribuição.
6. EXAMINANDO A ECOLOGIA DE
CONTRIBUIDORES
A análise do comportamento comum dos usuários de cada grupo
não dá a informação de quanto cada grupo contribuiu para a
formação da base de conhecimento da comunidade. Para tal,
examinamos a parcela de contribuição de cada grupo, utilizando
as seguintes métricas: o número de respostas, perguntas, questões,
comentários e moderação, como métricas de motivação; além de
representantes das métricas de habilidade, o número de melhores
respostas e o número de votos positivos recebidos em respostas,
perguntas e comentários.
Na Figura 4, observamos que o grupo Passageiros imperitos, em
conjunto com o grupo dos usuários especialistas (Bons
respondedores, Gurus casuais, Perguntadores cidadãos e
Comentaristas oportunos) agregam uma pequena parcela do total
de contribuições nas métricas de motivação. Com relação ao seu
desempenho nas métricas de habilidade, a parcela de contribuição
destes usuários também é pequena, com a exceção do grupo
Perguntadores cidadãos, que somam 14% da quantidade de votos
positivos recebidos em perguntas. O grupo dos Passageiros
imperitos se destaca pela quantidade de respostas, cerca de 9%,
porém estas respostas não são comumente bem avaliadas pela
comunidade.
Notadamente, os grupos pouco ativos, Passageiros e Ocasionais e
fiéis, juntamente com os ativos, Ativistas da comunidade e
Hiperativos especialistas, somam praticamente o total de
contribuições e quase todo o valor agregado nas métricas de
habilidade.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 116 -

Figura 3. Z-scores dos centros dos grupos identificados. Desta forma, a média da população de todos os usuários para cada métrica é
zero, e o valor representado é a distância do centro do grupo para essa média em unidades de desvio padrão. Note que a escala nos
três grupos de gráficos é diferente.

Figura 4. Proporção de contribuição agregada de cada grupo no sistema.

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 117 -
Tabela 1. Quantidade de usuários e valores não normalizados dos centros de cada grupo.
Nome do
grupo
Usuários
Respos-
tas
Pergun-
tas
Comen-
tários
Mode-
rações
Tempo de
vida (dias)
Guru
Score
UMRes-
postas
UMPer-
guntas
UMCo-
mentários
Passageiros
40.138
(62,2%)
0,33 0,41 0,50 0,45 34,00 -0,01 0,00 0,25 0,00
Passageiros
Imperitos
7.600
(11,78%)
1,77 0,45 0,97 1,48 71,32 -0,63 -0,85 0,22 -0,01
Ocasionais e
fiéis
11.878
(18,4%)
4,62 2,43 6,68 14,56 453,22 -0,07 -0,08 0,87 -0,02
Bons
respondedores
2.232
(3,46%)
2,15 0,90 2,03 4,21 200,51 -0,01 1,14 0,47 -0,02
Gurus casuais
956
(1,48%)
2,10 2,17 4,02 8,49 283,76 3,48 0,77 0,96 -0,01
Perguntadores
cidadãos
720
(1,11%)
7,00 2,37 9,15 28,28 336,35 -0,02 0,00 10,43 0,01
Comentaristas
oportunos
659
(1,02%)
3,14 1,94 4,50 11,39 343,70 -0,05 0,03 0,89 1,19
Ativistas da
comunidade
321
(0,5%)
94,24 39,40 173,34 387,46 521,18 0,16 -0,06 2,50 0,03
Hiperativos
especialistas
30
(0,05%)
757,10 19,53 1243,67 1873,57 544,64 0,19 0,22 4,446 0,08
População 64534 2,3 1,06 3,37 6,63 134,21 -0,04 -0,06 0,51 0,00

Na Figura 5, comparamos o desempenho entre estes dois grandes
grupos e observamos que o grupo dos pouco ativos superam os
ativos em quase todas as métricas, com exceção de duas métricas
de habilidade: a quantidade de melhor resposta e o número de
votos positivos recebidos pelos comentários.
No grupo dos pouco ativos, observamos que os Passageiros (62%
dos usuários) e Ocasionais e fiéis (18% dos usuários) não se
destacam individualmente nas métricas de habilidade, e se
diferenciam pelo tempo de vida na comunidade. Apesar da grande
diferença do tamanho entre os dois grupos, os Ocasionais e fiéis
agregam mais contribuições tanto nas métricas de motivação
quanto nas de qualidade.
Dentro do grupo de usuários ativos, os Ativistas da comunidade
possuem um desempenho individual inferior nas métricas de
motivação e habilidade. No entanto, observamos que a
contribuição conjunta dos Ativistas da comunidade é superior aos
Hiperativos especialistas nestas duas dimensões.

Figura 5. Comparação da contribuição agregada dos usuários
muito e pouco ativos no sistema. As barras em preto são os
intervalos de confiança, calculados para um nível de
significância de 5%.

7. DISCUSSÃO DOS RESULTADOS
A exploração da presença de grupos dentro da comunidade Super
User considerando métricas de motivação e habilidade nos
forneceu indícios de quais grupos são mais importantes no
funcionamento de um site típico de Q&A. Observamos que o
conjunto dos usuários de perfis pouco ativos e sem nenhuma
habilidade marcante, Passageiros e Ocasionais e fiéis, juntamente
com o os usuários ativos, Ativistas da comunidade e Hiperativos
especialistas, contribuem com a maior parte dos recursos do
sistema. Com a ausência dos usuários de algum destes perfis, a
comunidade possivelmente perderia em desempenho. Em
contraste com vários trabalhos da literatura, os quais tipicamente
afirmam que uma pequena minoria dos usuários faz a grande
maioria das contribuições, os nossos resultados mostram a maioria
dos usuários do Super User construindo o corpo de contribuições
do sistema. Os usuários dos quatro perfis que mais contribuem
somam aproximadamente 80% da população.
É importante destacar que os usuários Ocasionais e fiéis dão
indícios de ter uma participação altamente intermitente no
sistema. Usuários deste grupo em geral estão ativos no sistema por
um longo período e participam pouco. Todavia, pelo seu tamanho,
este grupo possui ao mesmo tempo a maior contribuição agregada
dentre os grupos identificados neste estudo. A atividade conjunta
do grande número de usuários que não aparentam ser especialistas
no sistema supera a contribuição dos especialistas e ativistas.
Outro grupo que merece destaque são os Passageiros imperitos.
Nossos dados não permitem a análise de porque estes usuários
não são bem avaliados, embora tenham uma quantidade
significativa de respostas. Uma hipótese é que, pelo curto tempo
no sistema, esses usuários não assimilaram as políticas e costumes
da comunidade, e assim não fizeram contribuições adequadas aos
olhos dos outros usuários.
A descoberta dos grupos com um alto nível de especialidade em
uma das métricas de habilidade pode interessar projetistas de
comunidades. Os usuários dos perfis, Bons respondedores, Gurus
casuais, Perguntadores cidadãos e Comentaristas oportunos se
mantêm ativos por bastante tempo na comunidade, embora
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 118 -
contribuindo quantitativamente pouco. Nossos resultados sugerem
que há uma oportunidade no desenvolvimento de mecanismos
para encorajar a participação destes usuários. Pela sua habilidade,
o aumento da atividade desses usuários contribuiria na qualidade
do conteúdo disponível para a comunidade.
Ainda sobre os grupos com um alto nível de especialidade e
participação moderada, é interessante destacar que estes usuários
demonstraram apenas um tipo de habilidade, enquanto que os
usuários mais ativos, Ativistas da comunidade e Hiperativos
especialistas, apresentam mais de uma. Os Hiperativos
especialistas, em especial, são bons em todas as métricas de
habilidade. Estas observações dão indícios de quanto maior o
comprometimento do usuário com a comunidade, maior é seu
desempenho em prover conteúdo de qualidade.
Nam et al. [4] constatou que os usuários mais comprometidos e
consistentes são mais propensos a prover boas respostas em sites
de Q&A. Em nossos resultados, esta característica é observada no
pequeno grupo de usuários mais ativos. No entanto, identificamos
grupos de usuários com valores moderados nas métricas de
motivação que são ao mesmo tempo eficientes em uma das
métricas de habilidade. Um exemplo disso são os Gurus casuais,
que em média contribuem com apenas 2 respostas, mas elas são
consideradas muito boas pela comunidade.
O agrupamento também revelou usuários com o perfil de
respondedor, perguntador e discutidor (papel similar em produzir
perguntas e respostas). Os Hiperativos especialistas e Passageiros
imperitos tem uma participação maior na contribuição do total de
respostas do que perguntas, já os Passageiros, Ocasionais e fiéis e
Gurus casuais possuem uma maior participação na criação de
perguntas. Os grupos restantes, Bons respondedores,
Perguntadores cidadãos, Comentaristas oportunos e Ativistas da
comunidade, tem uma participação similar nas duas atividades,
estes usuários se aproximam do perfil de discutidor. Os padrões
observados confirmam os resultados de Nam et al. [4] e Adamic et
al. [3], os quais identificaram estes padrões na comunidade Naver
Knowledge iN e Yahoo Answers, respectivamente.
8. CONCLUSÃO
Neste artigo, propomos a identificação de padrões de
comportamento dos usuários segundo métricas de motivação e
habilidade. Como forma de revelar estes padrões, dois algoritmos
de agrupamento um hierárquico e outro não-hierárquico foram
utilizados sob os dados de atividade da comunidade Super User.
Neste agrupamento foram observados 4 grandes grupos: Ativistas,
Passageiros, Ocasionais e fiéis e Especialistas. Em seguida,
discutimos a importância de cada um destes grupos no
funcionamento de um site Q&A.
Nossos resultados contribuem para um retrato mais rico de sites
de Q&A e têm diversas implicações. De forma geral, o
entendimento do Super User através dos perfis de seus usuários e
da atividade gerada pelo conjunto que se adequa a cada perfil
revela um sistema mantido em partes iguais por um núcleo de
ativistas e por um grande número de usuários de atividade
esporádica e sem destaque quanto à habilidade empregada.
Esse retrato ressalta a importância dos usuários de perfis com
pouca atividade no sistema para o seu desempenho. Tal resultado
indica a relevância de incluir o melhor uso dos recursos providos
por esses usuários na agenda de pesquisa sobre sites de Q&A.
Um resultado que observamos e carece de mais investigação é a
identificação de um perfil de usuários que contribui para o sistema
mas tipicamente têm suas contribuições mal avaliadas, os
Passageiros imperitos. Entender o processo que leva esses
usuários a este estado certamente contribuirá pra aperfeiçoar o
processo de integração de novos usuários à comunidade.
Diversos pontos limitam a generalidade de nossos resultados.
Consideramos apenas um site de Q&A. Sites com escala ou
comunidade-alvo diferentes podem revelar outros perfis e outra
composição para sua população. Trabalhos futuros devem
estender nossos resultados considerando outros sites de Q&A.
Outra linha que complementaria o presente estudo é a análise de
perfis de usuários utilizando outros métodos de classificação e
métricas que capturem mais detalhadamente a participação dos
usuários na comunidade.
AGRADECIMENTOS
Este trabalho foi parcialmente financiado pelo CNPq
(480855/2010-2).
REFERÊNCIAS
[1] Pal, R. Farzan, J. A. Konstan, R. E. Kraut. 2011. Early
Detection of Potential Experts in Question Answering
Communities by A. International Conference on User
Modeling, Adaptation, and Personalization (UMAP '11).
[2] Minhyung Kang, Byoungsoo Kim, Peter Gloor, and Gee-
Woo Bock. 2011. Understanding the effect of social
networks on user behaviors in community-driven knowledge
services. J. Am. Soc. Inf. Sci. Technol. 62, 6 (June 2011),
1066-1074.
[3] Lada A. Adamic, Jun Zhang, Eytan Bakshy, and Mark S.
Ackerman. 2008. Knowledge sharing and yahoo answers:
everyone knows something. In Proceeding of the 17th
international conference on World Wide Web (WWW '08).
ACM, New York, NY, USA, 665-674.
[4] Kevin Kyung Nam, Mark S. Ackerman, and Lada A.
Adamic. 2009. Questions in, knowledge in?: a study of
naver's question answering community. In Proceedings of
the 27th international conference on Human factors in
computing systems (CHI '09). ACM, New York, NY, USA,
779-788.
[5] Lena Mamykina, Bella Manoim, Manas Mittal, George
Hripcsak, and Björn Hartmann. 2011. Design lessons from
the fastest q&a site in the west. In Proceedings of the 2011
annual conference on Human factors in computing systems
(CHI '11). ACM, New York, NY, USA, 2857-2866.
[6] Hartigan, J. A., & Wong, M. A. 1979. Algorithm AS 136: A
K-Means Clustering Algorithm. Journal of the Royal
Statistical Society, Series C (Applied Statistics) 28 (1): 100
108.
[7] Milligan, G. 1980. An examination of the effect of six types
of error perturbation on fifteen clustering algorithms.
Psychometrika 45 (September):325-42.
[8] Gazan, Rich. 2011. Social Q&A. Journal of the American
Society for Information Science and Technology, Advances
in Information Science.
[9] Aldenderfer, Mark S., and Roger K. Blashfield. 1984.
Cluster Analysis. Thousand Oaks, CA: Sage.
[10] Ward, J. H. JR. 1963. Hierarchical grouping to optimize an
objective function. J. Am. Stat. Assoc. 58, 236244.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 119 -
Content Recommendation Based on Data Mining in
Adaptive Educational Social Networks
Marcel Pinheiro Caraciolo
Informatics Center
Federal University of Pernambuco
Recife, Pernambuco , Brazil
mpc@cin.ufpe.br
ABSTRACT
Social network sites (SNS) have been advanced as poten-
tially transformative in the area of education in general and
learning in particular. The web technologies are present-
ing new opportunities for developing diverse online learning
enviroments and enhancing interactivity, participation and
feedback between students, their peer groups and teachers.
All this informal learning is accomplished by the exchange
of information among people with similar interests. Mecha-
nisms to support this knowledge acquisition processes have
been proposed, including intelligent and data mining sys-
tems. Among them, one in special are the recommender
systems, which may provide decision aid and information
filtering functions that have a great potential application
in the educational social network sites (SNS). In this pa-
per, we shall describe a personalized recommender system
that uses web mining techniques for recommending a stu-
dent useful content such as new friends, peer groups and
classes within an adaptable educational social network site.
We present a specific recommender engine that we are devel-
oping in the social network AtePassar, a popular brazilian
educational network, in order to help the students to im-
prove their learning process by exploring new relationships
and content discovery.
Categories and Subject Descriptors
D.2.8 [Data Mining]: Recommender Systems; H.4 [Social
network sites]: Miscellaneous—community; learning; data
mining
General Terms
Recommender Systems; Social Network Sites; e-learning
Keywords
social network sites; recommender systems; community; learn-
ing; data mining
Adaptive and intelligent web-based educational systems pro-
vide an alternative to the traditional push approach in the
development of web-based educational courseware [1]. With
the advent of the social networks, its role in the students
learning experience has become increasingly relevant in re-
cent years. Several educational social networks exist which
employ student’s stored profile data, identifying matches for
collaboration. In fact, social interaction within an online
social network can act as a pedagogical agent, helping stu-
dents share experiences and collaborate on relevant topics.
The social software applications applied in education have
attracted researchers and industry to investigate and discuss
novel ways of providing effective web-based courses to stu-
dents, specially as a mode of delivery for distance learners [2,
3].
One of the main challenges is to provide features that can
enhance online social learning enviroment and student ex-
perience in different ways. One particular area where those
social softwares offers values is within recommendations for
learning material and sources of information. Recommender
systems help users find and evaluate items of interest. Such
systems have become powerful tools in many domains from
electronic commerce to digital libraries and knowledge man-
agement [4]. Some recommender systems have also been
applied to web-based educational systems for recommending
lessons (learning objects or concepts) that students should
study next [5] or for providing course recommendation abou
courses offered that contribute to the student’s progress to-
wards career goals [6]. In the educational context, its main
objective is to adapt and personalize learning to the needs
of each student by deliverig personalized content.
Recommender systems can use data mining techniques for
making recommendations using knowledge learnt from the
action and profile information of users on such educational
social networks [4]. Using machine learning and data min-
ing techniques such as prediction, classification, clustering
and association rule mining it is possible to discover and
extract novel and useful knowledge from all the available in-
formation about users/students on the social network site
in order to learn user models and to use these models for
personalization.
Currently, there is a particular interest in applying artificial
intelligence and data mining on educational systems, making
them a new and growing research community [7], [8]. Our
research focuses on methodologies and techniques for rec-
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 120 -
ommending friends, study groups and educational resources
(books, video classes, etc.) to students in a social envi-
ronment. We are currently developing a recommender en-
gine framework that may incorporate different recommenda-
tion techniques for general recommendation called Crab [15].
This framework can be used in several domains, including
the educational context which is to suggest online learn-
ing activities to students, based on their preferences, knowl-
edge of other students with similar interests. The system is
already deployed in a brazilian educational social network
called AtePassar, which connects students, helping them to
get approved in the public exams [9]. The innovative aspect
of our approach is the use of data mining on social networks
as also the incorporation of explanations at the given rec-
ommendation which will bring the student more confidence
on the recommendations and better learning understanding.
Only a few other recommender systems use data mining and
explanations in the recommendations [5].
This paper is arranged as follows: first we describe the re-
lated background about recommender engines and their use
in educational social learning. Then, we describe the recom-
mender framework that we are developing, integrated into
the Atepassar social network. Finally, we will describe our
current results that we have performed, our expected results
based on the experiments that we will carry out, conclusions
and future works.
2. RECOMMENDER SYSTEMS
Recommender systems are applications that offer personal-
ized suggestions and provide to users information for facil-
itating the decision process by incorporating the user char-
acteristiscs [10]. These systems implicitly assume what the
user wishes by using appropriate recommendation algorithms,
converting in item recommendations. Although recommen-
dation approaches were first proposed and applied in e-commerce
web sites to sugest products, there are also several works
about the application of recommender systems in E-learning
[11], [6].
The recommendation algorithms can be classified into three
different categories: rule based filtering systems, content
filtering-based systems and collaborative filtering systems [12].
The rule-based systems rely on a generated set of rules that
are used to recommend items to users. Content-based fil-
tering systems recommend items according to the similarity
between the item features and the content description in
the user profile. Collaborative filtering systems can be de-
scribed as techniques that match the rating of a current user
for items with those of similar tasted users (neighborhood)
in order to produce recommendations, for items not yet seen.
In our work we have developed a recommender system frame-
work to support machine learning researchers and develop-
ers in order to build, evaluate and deploy customized rec-
ommender approaches. This system is called Crab and it
is open-source available for the community [15]. For testing
our recommender engine, we have integrated into the social
network AtePassar, which enables the suggestion of classes,
friends and study data groups for the resgistered users. The
system also integrates explanations, which can enhance the
quality of the recommendations produced.
SLudenL
8ecommender
Lnglne
..
..
..
8ecommendauons
CnLlnL
CllLlnL
SLudenL's Log
lnformauon
lllLerlng
1echnlques
Figure 1: Architecture proposal for the recom-
mender system
3. CONTENTRECOMMENDATIONINED-
UCATIONAL SOCIAL NETWORKS
3.1 Objectives
The overall objective of this research project is to design
a methodology for social recommender systems that incor-
porate different knowledge sources from the interaction be-
tween students within a social network site. Those sources
could be structured or not. In the first case, we consider the
student’s information stored in personal profile and at his
timeline, a variation of a microblog where students can post
comments, share links by simple text messages. They are
described at our recommender engine with feature vectors,
that can be easily queried with standard query languages.
In the second case, we consider the additional information
provided from the students that are generated by interact-
ing with a web site. Examples of this interaction include the
relationships with other users (friends and followers), study
groups that they participate, classes that the student has
watched and study plans created with disciplines and sub-
jects. To extract knowledge from this type of data reposito-
ries we use social-filtering algorithms.
At our current architecture illustrated at the Figure 1, we
integrate the mentioned sources of knowledge by using data
mining techniques in order to exploit the appropriate fil-
tering algorithm for each available source. Additional ob-
jectives will be derive from an empirical study, that will be
performed, such as the tuning parameters of each recommen-
dation algorithm and evaluate new strategies for aggregating
results of the various algorithms.
Our recommender engine at AtePassar uses a hybrid rec-
ommendation approach which analyzes the user interaction
and produces daily recommendations with several compo-
nents available from the social network. Moreover, we also
provide an improved explanation of the recommendation to
the user. Generally, in the currently available systems, the
user only receives the recommended item together with an
overall score indicating the appropriateness of such recom-
mendation [13]. We improved this explanation by provid-
ing detailed explanations, increasing the recommendation
acceptance rate. The educational social networks are pow-
erful source of knowledge and provide many features that
can serve the learning sector in different ways. In distance
learning and virtual universities , the recommendation can
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 121 -
user Þroñle
user Soclal
lnLeracuon


Content 8ased I||ter|ng

lrlends [101,102]
Locauon: 8eclfe
Scholarshlp: CraduaLed



Co||aboranve 8ased I||ter|ng

5elect stoJy qtoops ftomqtoops
tbot slmllot osets ote lo

MeLa 8ecommender
ÞarameLers
8ecommendauons
Figure 2: Meta Recommender Components Interac-
tion
be highly beneficial given that students do not meet phys-
ically. It may result in their becoming more socially con-
nected, thereby enhancing their social learning environment
and student experience.
3.2 The Methodology
In order to design our recommender engine for an adaptative
learning environment, we investigated the user behavior in a
educational social network, in our scenario the AtePassar so-
cial network and incorporated our own ideas into the system
design. We have concluded that the knowledge data shared
between students in the learning context are quite different:
likeness, text messages, social graphs, etc. For this reason,
we have adopted an meta recommender system architecture
[14].
A meta recommender approach provides users with cus-
tomized control over the generation of a single recommen-
dation list, generated from a aggregation of rich data. This
personalized control can be implemented analyzing the na-
ture of a specific data source. In our approach, for instance,
if the item to be recommended is a new friend, where for
privacy concerns, in term of attributes, only the relation-
ships (list of friends) are available, then the system relies
more on collaborative filtering. In other hand, if the item to
be recommended has a rich structured description such as a
course, then the system tends to use more the content-based
approach. The final recommendation score is computed by
aggregating the results of both recommenders. The Figure
2 illustrates an overview of our approach.
For new users at the social network, which can suffer from
the cold start problem, that is a common problem in rec-
ommender systems for new users that don’t have historical
records in the system, we provide popular recommendations
which were accepted from another users registered in the
network. We hypothesize that popular items recommended
for the new users would help the users to even interact more
within the social network, as the system learns from his ini-
tial interests.
At this moment, we are still studying different approaches in
Figure 3: AtePassar Recommender System Inter-
face
how to compute the final score for the recommendation. The
current approach takes either the final scores of each recom-
mender as input to a weighted average function, where the
weights can be derived for implicit or explicit user prefer-
ences for a certain recommender.
3.3 The Atepassar based Mining and Recom-
mender System
We have developed a recommendation framework called Crab,
which is a recommender framework that aims to provide a
rich set of components from which you can build a personal-
ized recommender system from a set of algorithms. It is writ-
ten in Python, which is a popular programming language
designed for scability, flexibility and performance, making
use of scientific optimized packages in order provide efficient
and easy-to-use solutions in several contexts [15].
We have integrated this engine with easy-to-use interface for
students into the popular brazilian social network AtePas-
sar, an educational virtual learning environment with more
than 70.000 students registered interested at studying for
the public examinations in order to get a civil job. The
Figure 3 presents a screenshot of our recommender system
at AtePassar. Each recommendation comes with a explana-
tion, allowing the student to better understand the reason of
the given suggestion by the system. Another functionality
is that the user can accept or refuse the recommendation,
and in this processs the feedback and result obtained can be
directly applied to future recommendations.
3.4 The Current Results
In the current recommender system, we are providing friends,
study groups and products (e.g. video classes) to the active
users at AtePassar. The recommender engine is running
since January 2011 and recommended more than 100.000
items to over than 60.000 users. We are currently devel-
oping new features by recommending another components
present in the social network such as studyplans, disciplines
and questions.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 122 -
In March 2011 we also performed a questionnaire with the
feedback of the users about the current recommender en-
gine. From 83 users who filled out, 67 said that liked the
suggestions provided by the recommender. This brought
us confidence to keep developing and ehancing the quality
of the recommendations, pushing it into more personalized
content discovery.
3.5 The Expected Results
3.5.1 Improve the Learning Proccess
Those collective intelligence tools enable social networking
to take place. Our idea is to analyze how the recommen-
dations can increase the learning process by providing to
users new learning resources to maintain the interaction of
students in online educational networks. We believe that
mining those knowledge rich data provided in online educa-
tional networks in forms of recommendations will improve
the student learning experience.
3.5.2 Explore the Hidden Knowledge
We hypothesize that there are several knowledge sources in
a educational social network. For instance, the hours of the
day where the user is logged in or even the location of the
user. All this information could be used to improve the
recommendation process. Explore this hidden information
would serve as basis for discovery of novel content and ex-
plore more the learning resource materials, one of the goals
of the e-learning system.
3.5.3 Better Recommendation Understanding
The explanations can be quite helpful for users to better
understand if the given resource is (or is not ) suitable for
them. Those explanations can be beneficial in how to for-
mulate a better learning interaction and hence to simply and
shorten the human/computer interaction.
4. CONCLUSIONS
In this paper, we presents a personalized recommender sys-
tem that incorporate different types of sources of knowledge
in a adaptative educational social network by using a meta-
recommender approach. We believe that this technique will
bring more personalized and better recommendations for the
students.
Although we have integrated the system in the AtePassar, it
can, in principle, also be used in other web-based educational
systems. More research need to be conducted in the area
of the recommendation systems in social learning and how
they can influence the student satisfaction, motivation and
learning process.
Bringing machine learning and artificial intelligence to edu-
cational social networks is one of the main contributions of
this work, which is resulting on a new generation of web-
educational systems. The task of recommendation in web-
based education can be considered as special type of col-
laborative learning, due to the fact that they help student
with similar interests to find an optimal path through the
learning material and facilitate the social network design to
be effectively be used to achieve these targets. We provide
a video demonstrating the recommender system in action at
AtePassar, which can be accessible at œ[16].
5. REFERENCES
[1] Brusilovsky, P., Peylo, C.: Adaptive and Intelligent
Web-based Educational Systems. International Journal
of Artificial Intelligence in Education. 13, 2003, 156 -
169.
[2] Conole, G. & Culver, J.: The design of Cloudworks:
Applying social networking practice to foster the
exchange of learning and teaching ideas and designs In:
Computers & Education , Vol. 54 , Nr. 3 Elsevier, 2010
, S. 679-692 .
[3] Gogoulou, A., Gouli, E., Grigoriadou, M., Samarakou,
M., and Chinou, D.: A Web-based Educational Setting
Supporting Individualized Learning, Collaborative
Learning and Assessment. In Proceedings of
Educational Technology & Society. 2007, 242-256.
[4] Schafer, J.B.: The application of data-mining to
recommender systems. In J. Wang (Ed.), Encyclopedia
of data warehousing and mining. Hershey, PA. Idea
Group 2005 44 - 48.
[5] Farzan, R., Brusilovsky, P.: Social Navigation Support
in a Course Recommendation System. In proceedings of
4th International Conference on Adaptive Hypermedia
and Adaptive Web-based Systems. Dublin, 2006.
91-100.
[6] Ksristofic, A.: Recommender System for Adaptive
Hypermedia Applications. In Proceeding of Informatics
and Information Technology Student Research
Conference, Bratislava, 2005. 229-234.
[7] Romero, C., Ventura, S.: Educational Data Mining: a
Survey from 1995 to 2005. Expert Systems with
Applications. Elsevier 1:33, 2007. 135-146.
[8] Romero, C., Ventura, S.: Data mining in e-learning.
Wit Press, 2006.
[9] Atepassar. Available at: http://atepassar.com
[10] J. B. Schafer, J. A. Konstan, and J. Riedl.:
E-commerce recommendation applications. Data Mining
and Knowledge Discovery, 2001.
[11] Shen, L.P., Shen, R.M.: Learning Content
Recommendation Service Based-on Simple Sequencing
Specification. In Proceedings of Advanced in Web-based
Learning 2004 363-
[12] M. Montaner, B. L’opez, and J. Rosa.: A taxonomy of
recommender agents on the internet. In Artificial
Intelligence Review, volume 19, pages 285-330. Kluwer
Academic, 2003.
[13] J. Herlocker, J. Konstan, and J. Riedl.: Explaining
collaborative filtering recommendations. In In
proceedings of ACM 2000 Conference on Computer
Supported Cooperative Work, 2000.
[14] B. Schafer, J. Konstan, and J. Riedl.:
Meta-recommendation systems: user-controlled
integration of diverse recommendations. In Proceedings
of the 11th conference on Information and knowledge
management, pages 43-51. ACM Press, 2002.
[15] Crab. Available at: http://muricoca.github.com/crab
[16] AtePassar Video. Available at:
http://www.youtube.com/watch?v=gzn7I1EJmb4
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 123 -
Social Tag Collaborative Recommendation:
Mining the Meaning
Angelina Ziesemer
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
angelina.ziesemer@acad.pucrs.br
João Batista S. de Oliveira
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
oliveira@inf.pucrs.br
ABSTRACT
Social media systems such as Flickr, Youtube and Picasa
have become very popular as they provide a collaborative
environment to share photos and videos supporting tags,
ratings and comments. This kind of interaction includes
a lot of content provided by the users, which may bring
meaningful information to recommendation systems. The
aggregation of tags is also a way to cluster items and provide
a tag-based search content. In this paper we investigate how
to support tag recommendation by ranking the popularity
and relevance of commonly-used tags in similar items and by
similar users. We developed a tag recommendation system
to make automatic suggestions of possibly relevant tags. We
use Flickr’s dataset to analyze our algorithm’s behavior and
present the preliminary results.
Categories and Subject Descriptors
H.3.3 [Information Search and Retrieval]: Information
Filtering
General Terms
Algorithms
Keywords
tag recommendation; collaborative tagging; folksonomies
1. INTRODUCTION
In everyday life, people rely on recommendations from other
people by spoken words, reference letters, news reports, gen-
eral surveys, travel guides, and so forth [14]. With the ad-
vent of Web 2.0, the room for user interaction has increased
and sources of information began to be explored in order
to generate recommendations. Among those are included
the attribution of tags to items like photos to improve their
context and be used by search engines to find results in the
web [9, 11]. Tags provide freedom for users to classify their
content and add meaning to shared resources.
In general, the taxonomical categorization of subjects or
things is made by experts. However on the Web environ-
ment, it is made by common users, and is known as folk-
sonomy. Each resource is submitted as a posting containing
the resource, the identification of the user posting it and a
set of tags [8]. More than one tag may be assigned to each
resource and that set of tags is a hint to the meaning of
the resource. This practice allows for self-organization and
clustering of content by the meaning of the attributed tags.
Despite all advantages of the folksonomy, tagging is a repet-
itive, tedious work and sometimes the users do not tag when
there are many resources to classify. Moreover, typograph-
ical errors in the tagging process may also affect the result
of tag-based search.
To workaround these issues we developed a tag recommender
system to improve the tag aggregation. Recommender sys-
tems [1] have recently become very popular [5, 7, 13, 3] due
to the advent of social media networks and the rich content
provided by user interaction. Our approach relies on the
collaboration of other users to suggest relevant tags. We
use the Flickr social media dataset to show the system re-
sults and the ranking of tag recommendations perform by
our algorithm.
2. RELATED WORKS
Manual insertion of tags allows for resource classification
by common users on social media systems such as Flickr
1
,
Youtube
2
and Picasa
3
. This freedom to classify may require
a significant amount of work when there are too many re-
sources to be tagged. Moreover, there is a bias on each tag
provided by the user, causing noise in the cluster tag search
result to community users. Sigurbjornsson et al. [12] ana-
lyzed how users tag photos and the tags they provide and
concluded that most photos have only few tags, mostly hints
to where, who/what and when the photo was taken. Their
investigation made a substantial contribution to understand-
ing the long tail [2] on tags distribution. Also, there are col-
laborative tag recommendation systems that use resource
metadata associated by users to analyze the tags relevance.
For example, AutoTag [10] uses information retrieval mea-
sures to estimate the similarity between weblog posts and
then weigh each associated tag based on its frequency to
recommend a list of tags for new content. However, it is not
1
http://www.flickr.com
2
http://www.youtube.com
3
http://picasaweb.google.com
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 124 -
a personalized tag recommendation [4] as personalized tag
recommendation systems are being developed to rate the tag
relevance considering the current user tag preferences. In [6]
a neighbor voting algorithm was developed to estimate tag
relevance by counting votes on tags. Shepitsen et. al. [11]
show that hierarchical agglomerative clustering of tags is an
effective way to personalize navigational recommendations
in collaborative tagging systems. Gemmell et. al. [5] use
the K-nearest neighbor approach to recommend tags. In our
approach, however, we estimate the tags relevance and pop-
ularity by the ternary relationship between users, resources
and tags.
3. THE ALGORITHM
The tagging process on social media systems consists mainly
in two steps: selecting resources and assigning a set of tags
to each resource or to set of them. We intent recommend
a set of relevant tags during the tag assignment process, to
ease the folksonomy task. In order to recommend relevant
tags to users we developed a tag recommendation system
that uses hints given by the active user to find the most
popular and relevant tags by the analysis of the aggregated
tags on Flickr community.
Each new post in a social tag system is a ternary relation-
ship, for which exists a set of posts P =< P1
, P
2
, P
3
, ...P
n
>
of triples P
i
=< u
i
, r
i
, T
i
> where T
i
= {t
1
, t
2
...t
n
} is a set
of tags attributed to some resource r
i
posted by some user
u
i
. For instance, a user u posting a picture r from London
on Flickr, and adding a set of tags like: england, uk, tele-
phone and others. The folksonomy can indicate the picture
context helping other users to find resources by the set of
tags.
Our model has three measures for recommendation: co-
occurrence, relevance and popularity. We use the main tag
t provided by the user as a hint to take the context of the
resource and suggest other similar tags. For example, if a
user is posting a set of photos from some city, in general
the tags will indicate who/what, where and when the photo
was taken. Figure 1 shows some examples of photos tagged
by distinct users where the main tag is eiffel. The search
results on Flickr showed other photos that have the main
tag eiffel (t) and a set of tags (Ti
) for each photo. Such as
in the tags resulting by the Flickr search, we intend use the
tags association like in Figure 1 to suggest similar others to
the users. Observing the folksonomy on Flickr, we model
our algorithm as follows:
P(t) = {P
i
|t ∈ T
i
}
where P(t) represents all the triples that contain t in T
i
.
Using the main tag given by the active user we take the co-
occurrence, relevance, and popularity to compute values, in
order to obtain a geometric mean to show better result on
the ranking of recommend tags.
3.1 Preliminary Ranking
Before calculating co-occurrence, popularity and relevance
we must rank the tags that will be analyzed by frequency in
the dataset. To obtain the ranking of k-most co-occurrence
Figure 1: Group of photos and set of tags result by the
search on Flickr, using the tag eiffel as t.
tags in the set P(t), we define
exist(t, T
i
) =

1, t ∈ T
i
0, t / ∈ T
i
This function will signal the existence of t in the set T
i
from
each resource on the dataset. Once we have all the resources
which have t and the number of exist(t, T
i
), we get the pairs
(t, t
j
) where
t
j

P
i
∈P(t)
T
i
and rank the set of k-most t
j
that appears in pair with t by
ranking(t, t
j
) =

P
i
∈P(t)
exist(t, T
i
) ∗ exist(t
j
, T
i
)
The result of k-most co-occurrence tags will be use to cal-
culate the next measures.
3.2 Measures
Since the frequency of tags is not a good measure to rank
and suggest tags due to the presence of tags with personal
significance, we present in this section the measures defined
to our recommender system in order to tune the preliminary
tag ranking and improve the final ranking of tags.
3.2.1 Co-occurrence
To obtain the measures of the previous ranking of tags we
calculate the number of resources containing both t and t
j
and divide by the number of resources with t.
coo(t, t
j
) =
ranking(t, t
j
)

P
i
∈P
exist(t, T
i
)
The coo(t, t
j
) value for each tag t
j
will result between [0, 1].
This measure will allow us to calculate the final ranking
when the weight to each t
j
is calculated and then sorted.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 125 -
3.2.2 Relevance
Considering the tags relevance becomes necessary once the
number of times that it occurs does not mean that it is the
best choice to be in the top of the ranking.
We have observed in the dataset a users category that we
will refer to influencer users (i-users). In general i-users add
the same set T
i
of tags to a set of resources even when some
words do not have contextual links with some of the items. It
produces noise in the co-occurrence list, showing no relevant
results to the community on the ranking of candidate tags.
To fix it, we use the item-based and user-based tag frequency
to compute the relevance of t
j
. We model the relevance of
tags by the number of users that have at least one resource
r with both t and t
j
and divided it by the total number of
resources r which have t and t
j
:
rel(t, t
j
) =
|users(t)

users(t
j
)|
ranking(t, t
j
)
The rel(t, t
j
) will give low values to less relevant tags and put
them on the bottom of the ranking since there are several
resources tagged with t
j
but only by few users.
3.2.3 Popularity
Tag popularity is related to the frequent use of tags to the
users community. The result will measure how popular t
j
is to the set of users which use t in their resources. The
popularity measure is given by the number of users with
both tags divided by the number of users with t:
pop(t, t
j
) =
|users(t)

users(t
j
)|
|users(t)|
Furthermore, to analyze the opposite relationship among
tags, we calculate how popular t is in the universe of users
using t
j
as main tag. For example, for the tag“love”we have
a set of co-occurrence tags such as: hand, couple, flower, dog.
The opposite analysis will show the popularity of “love” to
user owners of resources using the tag “dog”. That is, now
the tag “dog” is treated as t and “love” as t
j
. If “love” is not
a popular tag in resources using mainly “dog”, the pop value
will be low. We combine both values pop(t, t
j
) and pop(t
j
, t)
by the arithmetic mean, producing the popularity result:
pop =
1
2
(pop(t, t
j
) + pop(t
j
, t))
3.3 Final Ranking
The co-occurrence, relevance and popularity values are im-
portant measures to produce good results to the final tag
ranking. However, we need to combine these results and
give to the user the most relevant tags based on history of
community tag aggregations. To merge the results we take
the preliminary ranking and get the co-occurrence, relevance
and popularity values. Through theses measures we define
the final ranking of tags by the geometric mean:
mean(t, tj
) =
3

coo(t, t
j
) ∗ rel(t, t
j
) ∗ pop
The mean(t, t
j
) will set the position of t
j
on the final tag
ranking.
4. DATASET
Our recommendation system takes into account the distri-
bution of tag frequency and the number of tags per photo
to define the minimum and maximum number of tags per
resource to receive a relevant feedback in the tag ranking. In
[12] they discovered how users usually tag photos on Flickr.
They indicated that in 52 million of photos the long tail
consists of more than 15 million photos with only a single
tag annotated and 17 million photos having only 2 or 3 tags.
They defined classes showing that photos with one tag rep-
resent 29.82% of the total, photos with 2-3 and 4-6 tags in
the same class represent 56.72% and photos with more than
6 tags represent 13.46% in the dataset. We take a repre-
sentative number of tags assigned to photos submitted on
Flickr social media. We filtering the dataset
4
to comprise
resources tagged between 2-6 tags. After filtering and clean-
ing the dataset we have restricted to 87.454 of tags given by
users to analyze the space and recommend tags in real-time.
The details of the dataset are described in Table 1.
Table 1: Flickr Dataset with total of tags, resources and
users.
tags users resources
distinct total distinct total
17.463 87.454 11.700 19.859
5. PRELIMINARY RESULTS
This section presents the experiment performed by our algo-
rithm to recommend tags. To calculate the co-occurrence,
relevance and popularity measures on the dataset, we take
the 10 top tags by the preliminary ranking using the tag
brazil as main tag t. In Table 2 the values of each measure
and the geometric mean are shown, in order to obtain the
final ranking by sorting the mean value.
Table 2: Results from the tag recommender algorithm show-
ing the relevance, popularity, co-occurrence and geometric
mean values to sort the final ranking and suggest to the user.
Preliminary
Ranking
coo pop
rel
mean
Final
Ranking
airplane 0.21 0.06 0.50 0.18 brasil
brasil 0.21 0.45 1.00 0.45 curitiba
driver 0.15 0.06 0.66 0.18 brasilia
trip 0.15 0.04 0.33 0.13 bus
bus 0.10 0.09 1.00 0.21 stop
stop 0.10 0.08 1.00 0.20 airport
curitiba 0.10 0.56 1.00 0.39 driver
brasilia 0.10 0.53 0.50 0.30 airplane
airport 0.10 0.06 1.00 0.19 highway
highway 0.10 0.06 0.50 0.15 trip
The measures are being computing by the algorithm and
each tag on the preliminary ranking is being sorted by the
4
Systems Lab Amsterdam, University of Amsterdam.
http://staff.science.uva.nl/˜xirong/index.php?n=Main.Dataset
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 126 -
geometric mean value. The new tag position on the ranking
will be present to the user, showing better order results of
tags based on his/her hints.
5.1 Discussion
The results showed that the calculated values provide an
accurate representation of the actual relationships on the
dataset, such as i-user using the same tags and giving in-
fluential results on ranking of top tags. This behavior has
been observed when a tag on the top of the ranking has
high values to the co-occurrence measure but low relevance
and popularity values. As an example we use the tag trip
shown on Table 2 to analyze how some tags could have a
high co-occurrence value but low popularity and relevance
values. This behavior means that there are many resources
using some tag but to the community in general the tags are
not relevant or popular to the users, since there are many
resources using the tag trip but only by few users. The ge-
ometric mean takes the tag trip to the bottom ranking and
put relevant tags on the top given better options of tags to
aggregation. We perform the algorithm to other tags, and
the results present similar behavior, putting irrelevant tags
on the bottom of the ranking as shown in Table 3 and 4. In
the Table 3 we observe the tag “08” initially positioned on
the top of the rank and after computing the measures this
tag is on the bottom of the ranking.
P. Ranking F. Ranking
zoo zoo
08 safari
stages statue
safari king
park cub
statue park
king stages
seaview seaview
the 08
cub the
Table 3: result from lion
tag hint.
P. Ranking F. Ranking
barns lamb
vermont farm
farms schaf
lamb animal
animal wales
schaf barns
nici nici
farm uk
wales farms
uk vermont
Table 4: result from sheep
tag hint.
6. CONCLUSIONS AND FUTURE WORKS
In this paper we have shown that collaborative tag recom-
mendation can produce good results when the preliminary
ranking of tags given by tag co-occurrence is improved by
measures that take into account the popularity and the rel-
evance value to each tag on the ranking. Preliminary exper-
iment show the result of our algorithm to each measure and
the final ranking to recommend tags to resources based on
the history of community tag aggregations on Flickr social
media network. We intend to evaluate a completely new
dataset using this algorithm and calculating the acceptance
of each tag before and after the recommendation to analyze
the homogeneity and clustering results by tags suggested.
7. REFERENCES
[1] G. Adomavicius and A. Tuzhilin. Toward the next
generation of recommender systems: A survey of the
state-of-the-art and possible extensions. IEEE Trans.
on Knowl. and Data Eng., 17:734–749, June 2005.
[2] C. Anderson. The Long Tail: Why the Future of
Business Is Selling Less of More. Hyperion, New York,
2006.
[3] S. C. Cazella, E. Reategui, and L. O. C. Alvares.
E-commerce recommenders’ authority: applying the
user’s opinion relevance in recommender systems. In
Proceedings of the 12th Brazilian Symposium on
Multimedia and the web, WebMedia ’06, pages 71–78,
2006.
[4] A. Dattolo, F. Ferrara, and C. Tasso. The role of tags
for recommendation: a survey. In Proc. of the 3rd
International Conference on Human System
Interaction, HSI’2010, pages 548–555, Rzeszow,
Poland, May 2010.
[5] J. Gemmell, T. Schimoler, M. Ramezani, and
B. Mobasher. Adapting K-nearest neighbor for tag
recommendation in folksonomies. In S. S. Anand,
B. Mobasher, A. Kobsa, and D. Jannach, editors,
ITWP, volume 528 of CEUR Workshop Proceedings.
CEUR-WS.org, 2009.
[6] X. Li, C. G. M. Snoek, and M. Worring. Learning
social tag relevance by neighbor voting. IEEE
Transactions on Multimedia, 11(7), 2009.
[7] H. Liang, Y. Xu, Y. Li, R. Nayak, and L.-T. Weng.
Personalized recommender systems integrating social
tags and item taxonomy. In Proceedings of the 2009
IEEE/WIC/ACM International Joint Conference on
Web Intelligence and Intelligent Agent Technology -
Volume 01, WI-IAT ’09, pages 540–547, 2009.
[8] M. Lipczak and E. E. Milios. Learning in efficient tag
recommendation. In Proceedings of the fourth ACM
conference on Recommender systems, RecSys ’10,
pages 167–174. ACM, 2010.
[9] P. Lops, M. de Gemmis, G. Semeraro, P. Gissi,
C. Musto, and F. Narducci. Content-based filtering
with tags: The first system. In ISDA, pages 255–260.
IEEE Computer Society, 2009.
[10] G. Mishne. Autotag: a collaborative approach to
automated tag assignment for weblog posts. In
Proceedings of the 15th international conference on
World Wide Web, WWW ’06, pages 953–954. ACM,
2006.
[11] A. Shepitsen, J. Gemmell, B. Mobasher, and R. Burke.
Personalized recommendation in social tagging
systems using hierarchical clustering. In Proceedings of
the 2008 ACM conference on Recommender systems,
RecSys ’08, pages 259–266, 2008.
[12] B. Sigurbj¨ornsson and R. van Zwol. Flickr tag
recommendation based on collective knowledge. In
Proceeding of the 17th international conference on
World Wide Web, WWW ’08, pages 327–336. ACM,
2008.
[13] E. M. Silva, E. R. Pinto, R. A. Costa, L. R. B.
Schmitz, and S. R. L. Meira. Recommending domain
experts in a social network. In Proceedings of the 2009
Simposio Brasileiro de Sistemas Colaborativos, SBSC
’09, pages 184–192, 2009.
[14] X. Su and T. M. Khoshgoftaar. A survey of
collaborative filtering techniques. Adv. in Artif. Intell.,
2009:4:2–4:2, January 2009.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 127 -
Proposta de Uso de Modelos de Objetivos na Engenharia
de Requisitos de Sistemas Colaborativos
Mariana Maia
DCE/CCAE
Universidade Federal da Para’ ba
58.297-000 – Rio Tinto – PB – Brasil
mariana.maia@dce.ufpb.br
Carla Silva
DCE/CCAE
Universidade Federal da Paraíba
58.297-000 – Rio Tinto – PB – Brasil
carla@dce.ufpb.br
Stephany Vitório
DCE/CCAE
Universidade Federal da Paraíba
58.297-000 – Rio Tinto – PB – Brasil
stephany.vitorio@dce.ufpb.br
ABSTRACT
Requirements Engineering (RE) is the activity of understanding
user needs in the context of the problem to be solved, as well as
the discovery and specification of the solution characteristics. A
system based on the Collaboration principle is an environment
that offers a set of features that enables communication,
coordination and cooperation among users. This paper proposes
the use of the i* framework as a RE approach for Collaborative
Systems.
RESUMO
A Engenharia de Requisitos (ER) corresponde à atividade de
entendimento das necessidades do usuário no contexto do
problema a ser resolvido, bem como da descoberta e especificação
das características da solução. Um Sistema que se baseia no
princípio da Colaboração é um Ambiente que oferece um
conjunto de funcionalidades para ocorrer a comunicação,
coordenação e cooperação entre usuários. Este artigo propõe o uso
do framework i* como uma abordagem de ER para o
desenvolvimento de Sistemas Colaborativos.
Categories and Subject Descriptors
D.2.1 [Software Engineering]: Requirements/Specifications –
methodologies.
General Terms
Human Factors, Theory, Verification, Experimentation,
Performance.
Keywords
Requirements Engineering, Collaborative Systems, i*.
1. INTRODUÇÃO
Um dos principais objetivos da Engenharia de Requisitos (ER) é
entender e modelar os requisitos desejados pelas partes
interessadas (stakeholders) e garantir que tais requisitos sejam
satisfeitos pelo sistema de software [3]. Requisitos
são características que um dado sistema deve possuir e, portanto, a
qualidade da especificação dos requisitos de um software pode ser
responsável pelo sucesso ou fracasso de um projeto de software.
Espera-se que uma abordagem de requisitos considere os
objetivos dos stakeholders de forma a resultar no
desenvolvimento de um software que satisfaça estes objetivos,
contribuindo positivamente para a realização das tarefas dos
usuários do software, de forma efetiva e eficiente.
Esta preocupação está presente também no contexto de
desenvolvimento de ambientes de trabalho cooperativo apoiado
por computador (do inglês, Computer Suported Cooperative Work
- CSCW) [2], que se baseiam nos princípios de comunicação,
coordenação e cooperação. A comunicação se realiza por meio da
troca de mensagens; a coordenação se realiza através do
gerenciamento de pessoas, atividades e recursos; e a cooperação
se realiza por meio de operações num espaço compartilhado para
a execução das tarefas [4].
Os sistemas CSCW proporcionam aos usuários a possibilidade de
realizar um trabalho colaborativo, pois os indivíduos têm que
trocar informações (comunicar-se uns com os outros), organizar-
se (coordenar entre si) e operar em conjunto num espaço
compartilhado (cooperar entre si) [1]. Para elicitar de forma
adequada os requisitos de sistemas de ambientes colaborativos, é
preciso entender, sobretudo, o contexto das atividades realizadas
pelas pessoas envolvidas na utilização do software.
Uma abordagem de Engenharia de Requisitos que permite realizar
análises sócio-organizacionais do domínio do problema através do
uso de modelos de objetivos é o framework i* [6]. Os modelos
definidos neste framework servem para o engenheiro de requisitos
relacionar o ambiente organizacional do sistema com seus
usuários, compreender o seu contexto e, a partir daí, projetar o
sistema. Este artigo propõe o uso do framework i*, para elicitar e
modelar os requisitos de sistemas CSCW, por ser uma abordagem
capaz de capturar, em um mesmo modelo, os objetivos dos
stakeholders, os requisitos funcionais e os requisitos não-
funcionais (RNFs) do sistema.
2. UMA ABORDAGEM DA ENGENHARIA
DE REQUISITOS PARA CSCW
Para desenvolver o trabalho apresentado neste artigo, realizou-se
um estudo do trabalho realizado por Teruel e outros [5] sobre a
modelagem em i* do sistema Google Docs. Após este estudo,
percebeu-se que o framework i* não havia sido utilizado de forma
adequada na modelagem deste sistema. Isto nos motivou a utilizar
o Google Docs como exemplo para ilustrar o uso correto do i*
como abordagem adequada de ER para o desenvolvimento de
sistemas CSCW. De fato, o Google Docs é um sistema bastante
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference’10, Month 1–2, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010…$10.00.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 128 -
popular e torna evidente a ideia de colaboração entre usuários. Ele
inclui serviços de processador de texto, planilha, apresentação de
slides, formulário e desenho, que permite aos usuários
compartilhem e colaborem uns com os outros, em tempo real, na
web.
Usuários que compartilham o mesmo documento cooperam entre
si, editando este documento ao mesmo tempo. Para tanto, cada
editor possui um cursor com cor única e nome próprio, que podem
ser visualizados por outro editor em tempo real. Isto permite que
todos percebam onde a alteração está sendo feita e por quem.
Usuários também podem comunicar-se utilizando um bate papo,
que fica fora do documento, quando acharem necessário. O bate
papo possui a lista de editores que estão online visualizando o
documento. A coordenação das tarefas pode ser realizada tanto
por meio do uso do cursor como pelo histórico de revisões e
discussões. O primeiro recurso diz respeito à uma lista de todas as
alterações no documento e de quem as executou. A segunda é uma
lista de discussões que os usuários podem utilizar para possíveis
comentários no documento e que também possibilita observar
uma estatística, na forma de gráfico, das visualizações e
discussões referentes ao documento.
O i* é uma abordagem orientada a objetivos que permite
descrever tanto dependências sociais e intencionais no ambiente
organizacional, como também atributos de qualidade e
funcionalidades do software [6]. O i* tem dois níveis de
abstração: o modelo SD (Strategic Dependency – Dependência
Estratégica) e o modelo SR (Strategic Rationale – Raciocínio
Estratégico).
O modelo SD apresenta os atores e suas dependências, enquanto
que o modelo SR apresenta os detalhes internos dos atores. No
modelo SD um ator (representado por círculo) pode depender de
outro para satisfazer um objetivo, para executar uma tarefa,
fornecer um recurso ou satisfazer um softgoal. Os softgoals
(representados por nuvens) estão relacionados a RNFs, enquanto
objetivos (representados por elipses), tarefas (representados por
hexágonos) e recursos (representados por retângulos) estão
relacionados a funcionalidades do software [6]. Na Figura 1
aparece o ator GoogleDocs, que representa o software, e os atores
Dono do Documento e Colaborador, que representam as pessoas
que irão editar o documento colaborativamente. Observe que o
Dono do Documento é uma especialização do ator Colaborador
Relacionados através do link Is-A). O Dono do Documento
depende do GoogleDocs para realizar a Edição Colaborativa de
Documento e para alcançar o Compartilhamento de Documento.
Ele também depende do Colaborador para alcançar a Realização
de Trabalho Colaborativo. Já o Colaborador depende do
GoogleDocs para ter a Visualização as Ações do Outro Usuário
do documento, para ter o Conhecimento da Autoria das
Mudanças, para obter a Visualização de Quem está Online e para
ter o Conhecimento da Lista de Participantes. Cada uma destas
dependências serão alcançadas por tarefas internas ao ator
GoogleDocs, conforme ilustrado na Figura 1.
Figura 1. Modelo SR Parcial para o Google Docs.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 129 -
O modelo SR é usado para descrever como as dependências
externas e os softgoals são alcançados por elemento internos ao
ator expandido. Neste modelo aparecem novos tipos de
relacionamentos, tais como decomposição-tarefa e contribuição.
Um relacionamento de decomposição-tarefa existe entre uma
tarefa e suas partes, mostrando como uma tarefa é executada.
Na Figura 1, o ator GoogleDocs apresenta a tarefa raiz Gerenciar
Trabalho Colaborativo que é refinada, nas tarefas Disponibilizar
Bate-papo Colorido, Apresentar Cursor Colorido de Edição,
Armazenar Histórico de Revisões, Disponibilizar Lista de
Discussão e Compartilhar Documento. O relacionamento do tipo
contribuição descreve uma contribuição de um meio (tarefa) para
a realização de um fim (softgoal), através de um raciocínio
qualitativo (e.g., Help e Hurt significam Ajuda e Prejudica,
respectivamente). Como o Google Docs é um sistema através do
qual as pessoas pretendem realizar um trabalho colaborativo, os
softgoals que precisam ser alcançados são Comunicação,
Coordenação e Cooperação. Na Figura 1, as tarefas Apresentar
Cursor Colorido de Edição, Armazenar Histórico de Revisões e
Disponibilizar Lista de Discussão ajudam a alcançar o softgoal
Coordenação. As tarefas Disponibilizar Bate-Papo Colorido e
Disponibilizar Lista de Discussão ajudam a alcançar a satisfação
do softgoal Comunicação. Por fim, a tarefa Compartilhar
Documento contribui para a satisfação do softgoal Cooperação.
Em [5], o i* foi usado para modelar sistemas colaborativos, porém
a linguagem de modelagem do i* foi utilizada de forma
inadequada, sem respeitar a sua sintaxe e semântica. Na Figura 2,
é apresentado um fragmento desta modelagem, no qual se observa
que RNFs de Colaboração, Comunicação e Coordenação foram
modelados como tarefas. Tarefa é um elemento de modelagem
usado para representar requisitos funcionais.
Os requisitos funcionais do Google Docs (Cursor Remoto, Lista
de Participantes e Bate-Papo, Histórico de Revisão) estão
representados como recursos, quando deveriam ser tarefas.
Recurso é um elemento de modelagem usado para representar
informações manipuladas. Além destes maus usos dos elementos
de modelagem do i*, também encontramos o uso de dependências
de objetivos sem a presença de nenhum ator no modelo. Uma
dependência só pode existir de um ator para outro, conforme
mostrado na Figura 1.
Figura 2. Modelo orientado a objetivos apresentando em [5].
3. CONCLUSÃO E TRABALHOS
FUTUROS
Neste artigo, propomos o uso de uma abordagem de modelagem
sócio-organizacional chamada de framework i*, para o
desenvolvimento de ambientes colaborativos. O trabalho
apresentado ainda está em desenvolvimento, mas a partir da
modelagem parcial do Google Docs, apresentada na Figura 1,
observamos vários benefícios do uso dos modelos i* no
desenvolvimento de sistemas que visem a colaboração. Por
exemplo, os modelos i* representam como o sistema pretendido
atende aos objetivos dos seus usuários, como os requisitos não-
funcionais são alcançados, além de modelar os relacionamentos
entre os atores e entre o ator e o sistema. Neste artigo, foi
apresentado o uso correto do i* para modelar os requisitos de
sistemas colaborativos, indicando o mau uso do i* na modelagem
apresentada em [5]. Como trabalhos futuros, pretende-se propor
um conjunto de diretrizes para construir modelos i* voltados para
sistemas CSCW e para guiar a identificação dos requisitos
funcionais que o sistema precisa ter para alcançar os RNFs de
comunicação, coordenação e cooperação.
4. AGRADECIMENTOS
Este trabalho é financiado pelo CNPq e pela CAPES.
5. REFERÊNCIAS
[1] Fuks. H., Raposo. A. B., Gerosa. M. A. 2003. "Do Modelo
de Colaboração 3C à Engenharia de Groupware". In: IX
Simpósio Brasileiro de Sistemas Multimídia e Web –
Webmidia 2003, Trilha especial de Trabalho Cooperativo
Assistido por Computador, 03-06 de Novembro, Salvador-
BA, pp. 445-452.
[2] Neto. G. G. C., Gomes, A. S., Tedesco. P. 2003. Elicitação
de Requisitos de Sistemas Colaborativos de Aprendizagem
Centrada na Atividade de Grupo. In: XIV Simpósio
Brasileiro de Informática na Educação - NCE - IM/UFRJ
2003.
[3] Neto. G. G. C. 2008. Estudos qualitativos para elicitação de
requisitos: Uma abordagem que integra análise sócio-cultural
e modelagem organizacional. In: Tese de Doutorado,
Universidade Federal de Pernambuco - Centro de
Informática – Pós-Graduação em Ciência da computação.
[4] Pimentel. M., Gerosa. M. A., Filippo. D., Raposo. A., Fuks.
H., Lucena. C. J. P. 2006. Modelo 3C de Colaboração para o
desenvolvimento de Sistemas Colaborativos. In: Anais do III
Simpósio Brasileiro de Sistemas Colaborativos, pp. 58-67.
[5] Teruel. M. A., Navarro. E., López-Jaquero. V., Montero. F.,
González. P. 2011. “An Empirical Evaluation of
Requirement Engineering Techniques for Collaborative
Systems,”. In : 15th Int. Conf. on Evaluation and Assessment
in Software Engineering, Durham, UK: 2011.
[6] Yu, E. Towards modelling and reasoning support for early-
phase requirements engineering, Proceedings of the 3rd IEEE
International Symposium on Requirements Engineering (RE
97), Annapolis, USA, IEEE Computer Society, p. 226-235,
1997.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 130 -

S E S S Ã O 6
Disseminação de Conhecimento
Sensemaking na Passagem de Serviço em Centros de
Terapia Intensiva
Jivago Medeiros
ADDLabs – Instituto de Computação
(IC) – UFF – Universidade Federal
Fluminense
Av. Gal. Milton Tavares de Souza, s/nº
Campus da Praia Vermelha, Niterói,
RJ
jmedeiros@ic.uff.br
Rodrigo Andrade
ADDLabs – Instituto de Computação
(IC) – UFF – Universidade Federal
Fluminense
Av. Gal. Milton Tavares de Souza, s/nº
Campus da Praia Vermelha, Niterói,
RJ
randrade@ic.uff.br
Ana Cristina Bicharra Garcia
ADDLabs – Instituto de Computação
(IC) – UFF – Universidade Federal
Fluminense
Av. Gal. Milton Tavares de Souza, s/nº
Campus da Praia Vermelha, Niterói,
RJ
bicharra@ic.uff.br
RESUMO
Ambientes médicos e hospitalares necessitam da cooperação entre
varios proIissionais de saude para garantir a continuidade dos
processos através dos diIerentes turnos. Para manter a qualidade e
eIiciência das tareIas apos varias trocas de turno (hanaoff) é
necessario não apenas a geração, manutenção e disponibilização
de inIormações para os proIissionais que assumirão os proximos
turnos, mas também a utilização de Ierramentas que auxiliem na
tomada de sentido (sensemaking) das inIormações geradas e
Iornecidas a esses proIissionais. Este trabalho investiga as
diversas variaveis existentes por tras dos processos de hanaoff e
sensemaking Iocando em ambientes médicos e hospitalares com o
objetivo de desenvolver uma Ierramenta capaz de apoiar o
sensemaking durante o hanaoff médico em centros de terapia
intensivo.
ABSTRACT
In medical and hospital environment it is imperative that
physicians cooperate with each other across several shiIts to
ensure existing processes continuity. In order to maintain the
eIIiciency oI this processes aIter many handoIIs it is necessary not
only the creation, maintenance and provision oI the inIormation to
the in-shiIt proIessionals, but also the need oI technological tools
to assist them in the Sensemaking process in order to better
understand the inIormation and data that has been provided. This
work investigates the many variables behind the handoII and
sensemaking process Iocusing on medical and hospital
environment in order to developing an technological tool to
support and improve the awareness during medical handoII in a
pediatric intensive care .
Categories and Subject Descriptors
H.4.2 |Decision Support|
General Terms
Experimentation, Human Factors.
Keywords
passagem de serviço, hanaoff, sensemaking, cti pediatrico, sistema
de suporte a decisão
1. INTRODUÇÃO
Atividades em hospitais são executadas por grupos distintos de
proIissionais que revezam seguindo turnos objetivando garantir a
continuidade dos processos ali existentes.
Os proIissionais que participam desses processos são treinados
para serem capazes de dar continuidade as tareIa em andamento
quando o seu turno é iniciado e de repassar essas tareIas para os
agentes de saude dos proximos turnos. Ha também proIissionais
que atuam no auxilio a construção de modelos mentais
compartilhados das tareIas com o objetivo de minimizar a
ocorrência de mal-entendidos.
Mesmo assim, ainda registra-se ocorrências de Ialhas nos
processos realizados dentro de hospitais. Sendo que muitas dessas
Ialhas estão relacionadas a problemas de comunicação ou perda
de inIormação durante trocas de turno. ConIorme citado por
Flanagan et al. |1| ao relatar que dois terços dos erros médicos
nos Estados Unidos no periodo de 1994 a 2004 Ioram causados
por Ialhas na comunicação, sendo o hanaoff troca de turno /
passagem de serviço uma Iase critica e com grande propensão a
perda de inIormações. Hanaoffs são tidos como processos
colaborativos assincronos e serial, estando presente em diIerentes
cenarios e por diIerentes razões |2|.
Problemas decorrentes da comunicação, e.g. documentação
médica imprecisa e Ialta de dados clinicos, são apontados por
Arora et al. em |3| como um dos principais empecilhos na
realização de hanaoff satisIatorio. Esses problemas trazem
incertezas durante o processo de tomada de decisão médica, e
essas incertezas por sua vez acarretam repetição de exames,
pedidos exames adicionais e retrabalho na investigação clinica; e
que, além de incrementar os gastos de recursos e de tempo, podem
culminar em danos diretos e indiretos aos pacientes.
Dowing |4| aponta o hanaoff como o principal evento na garantia
de continuidade do tratamento dos pacientes. A Ialta de
inIormação ou inIormação com pouca qualidade durante o
hanaoff comprometem a capacidade de determinar o estado dos
pacientes e de planejar ações e tareIas necessarias no tratamento e
recuperação dos mesmos. Tornam-se necessarias Ierramentas que
auxiliem a troca e a percepção de inIormações entre os agentes
para garantir um tratamento eIetivo.
Fazer sentido sobre o que esta ocorrendo, sensemaking |7|, é
Iundamental para garantir continuidade num trabalho em grupo
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 132 -
assincrono. Ferramentas para dar suporte a este trabalho
colaborativo podem enIatizar a percepção e a colaboração
assincrona, mitizar os desaIios do hanaoff.
Este artigo tem por objetivo apresentar uma Ierramenta para
apoiar o sensemaking durante o hanaoff médico em centros de
terapia intensiva.
Para tal, sera necessario entender os problemas relacionados a
perda de percepção durante a passagem de serviço e as
necessidades dos diversos proIissionais de saude que colaboram
em diIerentes etapas e diIerentes turnos nos processos que
mantém a continuidade dos serviços prestados nos centros de
terapia intensiva.
O dominio de aplicação da nossa pesquisa sera a passagem de
serviço em um centro de terapia intensiva de um hospital da rede
SUS do Rio de Janeiro. A escolha deve-se ao interesse da
instituição na participação dos experimentos, dando-nos acesso
aos dados necessarios.
Na proxima seção do trabalho sera apresentada Iundamentação
teorica reIerente ao sensemaking e ao hanaoff em ambientes
hospitalares. Na sequencia apresentaremos o dominio no qual o
trabalho esta sendo realizado juntamente com uma ontologia que
descreve a realização das tareIas através dos turnos no dominio.
Por Iim, Ialaremos sobre a Ierramenta que esta sendo
desenvolvida com o andamento da pesquisa.
2. FUNDAMENTAÇÃO TEÓRICA
De acordo com Klein et al. em |5|, a noção de sensemaking
emerge na computação na década de 90, com o aparecimento de
algumas deIinições e alguns modelos, como os propostos por
Dervin, Russell et al. e Weick, respectivamente em |6|, |7| e |8|.
Weick deIine o sensemaking como sendo um processo de
entender uma determinada situação, em um determinado contexto
por meio do preenchimento de lacunas cognitivas.
Em |7|, sensemaking é descrito como sendo um processo iterativo
de busca pela representação mais adequada para responder
questões especiIicas de determinada tareIa. Como ilustrado pela
Figura 1, o modelo de Russell et al. |7| é uma abordagem
centrada na realização de tareIas.
Figura 1. Modelo de sensemaking proposto por Russell et al.
em ¡7]
ConIorme nota-se pela Figura 1, a realização de uma tareIa é o
evento motivador do sensemaking. Cada tareIa a ser realizada
possui uma série de requisitos que devem ser levados em
consideração durante o sensemaking. Durante o processo,
representações são criadas e testadas iterativamente, até que seja
obtida a representação que se considere como a mais adequada na
resolução da tareIa.
Weick apresenta o sensemaking como a tentativa natural de
criação de expectativas do que vai acontecer a partir de estimulos
externos. Essas expectativas são geradas a partir de um
enquadramento temporal e espacial especiIico.
Em nosso trabalho abordaremos o sensemaking com um enIoque
cognitivo, buscando entender os motivos que Iazem com que
inIormações indispensaveis para o processo de hanaoff não sejam
reportadas ou mesmo quando essas inIormações são reportadas ha
ocorrência de casos relacionados a não-percepção ou ainda a
percepção errônea dessas inIormações por parte dos agentes
envolvidos nos processos.
ConIorme citamos ao longo do trabalho, o hanaoff em ambientes
médicos e hospitalares esta sujeito a diversas Ialhas que levam a
perda de percepção, principalmente a Ialhas relacionadas a
manutenção de inIormações relevantes para a continuidade dos
processos. Sarcevic e Burd apresentam em |9| um estudo que
demonstra a perda de inIormação em um ambiente de resgate e
emergência médica no qual a equipe de emergência que eIetua o
resgate; transIere o paciente e as inIormações necessarias a
continuidade nos processos de tratamento desse paciente para a
equipe de emergência médica do hospital que dara continuidade
ao tratamento. O primeiro Iato apontando por Sarcevic e Burd
para a ocorrência na Ialha da transmissão de inIormações é a
inexistência de estrutura e modelos para a criação de relatorios
pela equipe de resgate. E em segundo lugar, o Iato do hanaoff do
paciente ser executado em paralelo ao hanaoff das inIormações o
que acaba Iazendo com que a equipe médica que recebe o
paciente tenha maior atenção pelas inIormações que serão
necessarias em um primeiro momento, não tomando sentido de
inIormações que são necessarias em um segundo momento. O
objetivo de Sarcevic e Burd é apoiar o desenvolvimento de
tecnologia para transIerência de inIormação identiIicando os
desaIios especiIicos enIrentados pela equipe de resgate e de
trauma durante o hanaoff.
O hanaoff em ambientes hospitalares, bem como a geração e
manutenção de inIormações a serem utilizadas nesses processos
também são estudados por Goldsmith et al. em |11|. Eles
apresentam um estudo realizado no Brigham ana Womens
Hospital (BWH) em Boston, onde mesmo ocorrendo cerca de dois
milhões de hanaoffs anualmente, a padronização das inIormações
necessarias para um hanaoff (eIiciente) mostrou-se bastante Ialha
por parte do departamento de enIermagem do hospital. O que
aumenta o risco de aIunilamento e perda de inIormações e
consequentemente gera Ialhas no tratamento aos pacientes.
Goldsmith et al. |11| levantam os requisitos para o
desenvolvimento de um sistema baseado em plataIorma web que
seria capaz de evitar problemas relacionados ao hanaoff da
enIermagem no BWH como: imprecisão na transIerência de
dados, Ialta de inIormação critica, aIunilamento de inIormações,
erro na transcrição dos dados para preparação e entrega dos
relatorio durante o hanaoff.
ConIorme apresentado por |9| e |11|, a Ialta de padronização na
geração e manutenção de inIormações contribui negativamente
para a continuidade dos processos através dos hanaoffs em
ambientes médicos e hospitalares. Porém, apenas manter e
apresentar inIormações não é o suIiciente para que as atividades
continuem a serem executadas de maneira satisIatoria apos as
trocas de turno. E necessario também que a tomada de sentido
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 133 -
dessas inIormações pelos agentes participantes dos eventos seja
apoiada por Ierramentas que auxiliem o sensemaking das
inIormações. O Apolo é uma Ierramenta que que tem por objetivo
guiar o usuario de maneira incremental e interativa na exploração
de um grande volume de inIormações por meio da combinação de
visualização, interIaces ricas e aprendizado de maquina,
auxiliando assim o usuario no sensemaking dessas inIormações
|12|. O Apolo trabalha com uma abordagem bottom-up do
sensemking, o que signiIica dizer que o usuario vai Iazendo
sentindo das inIormações de maneira incremental a medida com
que interage com elas. A Ierramenta Ioi inicialmente desenvolvida
para trabalhar com citações da literatura cientiIica e apresentou
um melhor desempenho em um teste de laboratorio do que outras
Ierramentas tradicionalmente utilizadas para esse Iim |12|.
Em complemento a Ierramentas de sensemaking como por
exemplo o Apolo |12|, ha também propostas que abordam a
utilização de arteIatos cognitivos para apoiar a tomada de sentido.
Norman deIine arteIatos cognitivos como sendo dispositivos
artiIiciais que conservam, exibem ou operam sobre inIormações
com o objetivos de Iornecer meios de modelar ou representar
essas inIormações de tal maneira que incremente a perIormance
cognitiva humana |13|.
Ha varias propostas de desenvolvimento e utilização de arteIatos
cognitivos em ambiente médicos, como por exemplo Bossen,
Wears et al. e Xiao et al., que exploram o uso do quadro branco
como arteIato cognitivo no suporte a comunicação, na
colaboração entre os diversos agentes de saude em e na resolução
de problemas de problemas e tareIas respectivamente no
departamento de hematologia em |14|, salas de emergência em
|15| e salas de operação em |16|.
ConIorme vimos nessa seção, ha uma grande necessidade de se
realizar trabalhos que apresentem métodos, modelos e Ierramentas
que sejam capazes não apenas de padronizar, gerar e manter
inIormações através dos hanaoffs em ambientes médicos e
hospitalares, mas também é necessario que essas mesmas
Ierramentas apoiem o sensemaking das inIormações.
3. DOMINIO DE APLICAÇÃO: CTI
PEDIÁTRICO DE UM HOSPITAL
PÚBLICO FEDERAL
O Ioco do estudo se da no dominio do Centro de Tratamento
Intensivo Pediatrico (CTI-PEDIATRICO) de um hospital Iederal
localizado no Rio de Janeiro. A seguir, descreveremos a dinâmica
do cenario hospitalar e suas caracteristicas.
3.1 CTI-PEDIÁTRICO
O Centro de Tratamento Intensivo Pediatrico (CTI-
PEDIATRICO) situa-se no Hospital Geral da Lagoa Hospital da
Lagoa hospital publico Iederal localizado no bairro Jardim
Botânico na cidade do Rio de Janeiro. O hospital possui um
atendimento mensal de aproximadamente 20 mil pacientes,
realizando cerca de 810 internações e 650 cirurgias mensais.
Conta com 243 leitos e cerca de 100 médicos atuantes na pediatria
e areas correlacionadas.
Atualmente, cerca de 20° dos médicos são contratados, cedidos
ou do municipio gerando uma rotatividade e risco de
descontinuidade de trabalho muito maior, pois em qualquer
momento podem desligar-se. Além disso, como a contratação é de
carater temporario, medidas de inovações podem vir a ser
prejudicadas devido a essa rotatividade do trabalhador.
O CTI-PEDIATRICO é uma unidade de tratamento intensivo
inIantil que objetiva prover o cuidado ideal de pacientes
criticamente enIermos e promover a monitoração continua dos
pacientes instaveis.
A carga de trabalho é organizada em turnos ocorridos duas vezes
ao dia, acompanhada com um rouna diario e troca de turno
prevista as 7h e as 13h. A equipe de trabalho atuante no CTI-
PEDIATRICO é composta por dois médicos responsaveis pelo
plantão, residentes, médicos especialistas, enIermeiros e técnicos.
O rouna é um evento realizado no CTI-PEDIATRICO durante o
hanaoff das 13h. No rouna são discutidas individualmente cada
internação sendo analisadas inIormações de diagnosticos,
evolução do quadro clinico, tareIas passadas e propostas de novas
tareIas, diIerentes abordagens para tratamento, entre outras.
Durante o rouna as discussões e decisões são registrados em livro
ata do turno. Posteriormente ao rouna, as inIormações pertinentes
são atualizadas no quadro branco.
A passagem de turno no CTI-PEDIATRICO é apoiada por alguns
arteIatos cognitivos, tais como, quadro-branco, livro ata de turno
no qual além de conter inIormações discutidas no rouna, contém
o registro das atividades desenvolvidas e das intercorrências
ocorridas durante o turno; e o prontuario do paciente.
Pretendemos no decorrer da pesquisa realizar um estudo
etnograIico no dominio da aplicação que nos Iornecera
caracteristicas e evidências necessarias ao desenvolvimento da
Ierramenta proposta nesse trabalho.
A revisão bibliograIica até então realizada (vide por exemplo |1| e
|9|) nos permite notar que alguns dos processos e modelos
descritos anteriormente poderiam ser modiIicados objetivando
maior eIiciência na troca de inIormações entre os proIissionais
plantonistas. Como por exemplo a utilização de modelos na
representação de inIormações no livro de turno o que Iacilitaria
também a visualização e tomada de sentido dessas inIormações;
Uma vez que o grande volume de inIormações relacionado a cada
internação é registrado de maneira prolixa, diIicultando a analise
do estado corrente do paciente e consequentemente a tomada de
decisão médica.
3.2 ONTOLOGIA
Segundo |17| Ontologia é uma especiIicação explicita de uma
conceitualização. Em outras palavras, a ontologia é a
representação de um dominio em um modelo abstrato contendo
seus conceitos e suas restrições inerentes, representados em um
conjunto de decisões explicitas. Portanto, uma ontologia deve ser
explicita, Iormal (passivel de ser processada por uma maquina) e
compartilhada (descrever um conhecimento comum a um grupo).
A ontologia ilustrada pela Figura 2 representa o dominio para o
qual estamos propondo o desenvolvimento da Ierramenta para
apoiar o sensemaking durante o hanaoff médico em centros de
terapia intensiva. Essa ontologia resulta da elicitação preliminar
de requisitos, reuniões com a equipe médica do CTI-
PEDIATRICO, acompanhamento da passagem de serviço e
acompanhamento de rounas. Foram realizadas também reuniões
com stakeholaers do hospital, onde validamos as inIormações
coletadas nas reuniões, nas observações (de hanaoffs e rounas) e
na revisão bibliograIica. Espera-se no entanto que a ontologia
ilustrada pela Figura 2 soIra alterações a medida que progredimos
com a pesquisa.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 134 -
Figura 2. Ontologia do Domínio de Aplicação
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 135 -
Figura 3. Quadro Branco - Parte da ferramenta que está sendo desenvolvida
Na ontologia vemos representada a necessidade dos agentes de
atuarem nas internações realizando tareIas que tem por objetivo
alterar o estado de uma variavel para um novo estado considerado
ideal. Na maioria dos casos é necessario que um historico
composto de: TareIas previamente realizadas, estados do paciente
ao longo da internação e os valores da variaveis a medida que
essas são alteradas, seja consultado para auxiliar os agentes a
atuarem da maneira mais eIiciente possivel. Ha também a
necessidade de que esse historico esteja armazenado e disponivel
em midias que Iacilitem o acesso e melhore a tomada de sentido.
4. FERRAMENTA PARA APOIAR O
HANDOFF MÉDICO EM CENTROS DE
TERAPIA INTENSIVA
Este trabalho ainda encontra-se em andamento e como citado
anteriormente, pretendemos realizar um amplo estudo etnograIico
no CTI-PEDIATRICO do Hospital da Lago que nos ajude a
compreender com maior exatidão não apenas as peculiaridades e
caracteristicas envolvidas no hanaoff e sensemaking mas o
impacto causado por esses na continuidade dos processos ali
existentes.
Porém a Ierramenta aqui proposta esta sendo desenvolvida de
maneira iterativa a medida que avançamos com nossa pesquisa, o
que ja nos Iorneceu uma versão preliminar da Ierramenta e que em
breve devera sem implantada em nivel experimental no CTI-
PEDIATRICO do Hospital da Lagoa.
A Figura 3 representa uma parte da Ierramenta que consiste em
uma versão digital do quadro branco utilizado no CTI-
PEDIATRICO. Averiguamos que no CTI-PEDIATRICO um
angente ao iniciar o seu turno veriIica o quadro branco para ter
uma visão preliminar da situação de cada paciente internado.
Apos essa veriIicação preliminar, o agente da inicio a suas
atividades. Acreditamos que disponibilizando um quadro branco
digital que Iorneça maior riqueza e clareza das inIormações ao
mesmo tempo que Iacilite a tomada de sentido da situação
corrente do setor seria de bastante valia para os agentes de saude
não apenas no inicio do turno mas também no decorrer das
atividades.
As três primeiras colunas estão relacionadas a identiIicação do
paciente. A primeira é o leito associado a internação, a segunda
lista as pulseiras utilizadas pelo paciente (azul indica inIecção
resistente, amarela risco de queda e vermelha alergia), sendo que
o sistema permite que sejam adicionados comentarios a cada
pulseira, comentarios esses que podem ser visualizados quando
clicamos na pulseira. A terceira coluna contem o ultimo nome,
primeiro nome, e data de nascimento do paciente. A quarta coluna
tras o estado (Estavel, Instavel, IndeIinido) atual do paciente,
juntamente com um comentario em relação a situação do paciente,
data, hora e o agente que realizou o cadastro daquela situação. O
sistema permite também que um historico da situação do paciente
seja visualizado ao clicarmos na 'lupa¨ proxima as inIormações.
Assim sendo, o nosso objetivo é apoiar o agente na tomada de
sentido dos estados dos pacientes internados nesse setor por meio
da exibição de inIormações como o estado do paciente, o leito que
ele se encontra e a avaliação mais recentes das variaveis mais
relevantes para internação. O sistema permite que o agente
visualize um historico do estado do paciente e também um
historico da avaliação das variaveis da internação com o objetivo
de auxiliar o agente na tomada de decisão de suas primeiras ações
no turno. A coluna 'Avaliação¨ lista a ultima avaliação das
principais variaveis (temperatura, pressão, Irequência cardiaca,
entre outras) associadas a internação, juntamente com a data, hora
do registro da inIormação no sistema e assim como na coluna
'Situação¨ é possivel visualizar o historico de avaliações. Por
ultimo, a coluna 'Admissão¨ tras a data e hora de admissão do
paciente no CTI-PEDIATRICO juntamente com um comentario
relacionado a essa admissão. Também é possivel visualizar outras
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 136 -
inIormações adicionais da internação clicando na 'lupa¨ da
coluna 'Admissão¨.
O sistema esta sendo desenvolvido para a plataIorma web
utilizando JAVA Enterprise Eaition (EE) em sua versão 6.0 e
frameworks como Spring Framework, Java Server Faces (JSF) e
Hibernate, o que permitira maior portabilidade, manutenibilidade
e continuidade no desenvolvimento do projeto.
Um importante ponto levado em consideração no
desenvolvimento da Ierramenta é a quantidade e a Iorma de
interação dos agentes com o sistema. Pois essas devem causar o
menor impacto possivel na rotina desses agentes, como por
exemplo, não criando um monte de novas tareIas que devem ser
executadas apenas para garantir a alimentação do sistema. Assim,
a arquitetura projetada nos Iaz prever um cenario onde os
diIerentes agentes poderão interagir com o sistema sem um custo
maior na realização de suas tareIas rotineiras. Os inIermeiros por
exemplo, utilizando-se de dispositivos como tablets seriam
capazes de Iazer a leitura das variaveis dos pacientes (temperatura,
pressão, Irequência cardiaca, entre outras) diretamente no sistema
e posteriormente imprimir os relatorios das avaliações para Iins de
arquivamento, enquanto os médicos, durante o rouna por
exemplo, também utilizando tablets atualizariam diretamente no
sistema inIormações como a situação de cada paciente e também
tareIas realizadas e a realizar, intercorrências e eventos adversos
ocorridos durante o ultimo turno; e posteriormente, imprimiriam
do proprio sistema um relatorio do rouna para anexa-lo junto ao
livro de turnos. Outros importantes pontos para o
desenvolvimento de uma Ierramenta que possa Iuncionar de
maneira eIiciente no ambiente pesquisado também Ioram
levantados, e serão amadurecidos com o andamento da pesquisa,
como por exemplo a necessidade de importar inIormações de
sistemas ja em utilização no Hospital da Lagoa.
5. CONSIDERAÇÔES FINAIS
De acordo com o que Ioi apresentado no decorrer do trabalho
Iicou evidente que a geração, manutenção e disponibilização de
inIormações que possam contribuir para a continuidade dos
processos é um ponto de suma importância em um ambiente onde
ha colaboração entre diIerentes proIissionais. Ambientes onde ha
passagem de turno (hanaoff) a geração e disponibilização de
inIormações entre os turnos é um ponto critico em virtude da
necessidade dos proIissionais dos proximos turnos necessitarem
dessas inIormações para manter com qualidade a continuidade dos
processos. A qualidade na continuidade dos processos é capaz de
evitar acidentes e diminuir riscos de perdas humanas e Iinanceiras.
Porém, apenas gerar e disponibilizar inIormações não é o
suIiciente, haja vista a necessidade de Ierramentas capazes de
melhorar a tomada de sentindo dessas inIormações (sensemaking)
por esses proIissionais.
A computação é uma disciplina capaz de contribuir nos estudos e
na proposta de métodos e modelos que possam auxiliar na
realização de hanaoffs eIicientes auxiliando no sensemaking
durante a passagem de serviços. Subareas da computação como a
Inteligência ArtiIicial e Interação Humano-Computador podem
contribuir de maneira signiIicativa para os esIorços relacionados
ao hanaoff e ao sensemaking.
Em trabalhos Iuturos pretendemos implantar a Ierramenta de
apoio ao hanaoff proposta nesse artigo. Apos a implementação
teremos a oportunidade de avaliar os reais impactos causados pela
Ierramenta nos processos colaborativos do dominio da aplicação e
entender se ela tornara o sensemaking mais eIiciente.
AGRADECIMENTOS
Gostariamos de deixar registrado os nossos agradecimentos a
equipe do Hospital Federal da Lagoa, em especial a Dra. Alice
Eulalia, a Dra. Roberli Bicharra e a Dra. Maria Cristina Senna
Duarte.
6. REFERÊNCIAS
|1| Flanagan ME, Patterson ES, Frankel RM, Doebbeling BN.
(2009) Evaluation oI a physician inIormatics tool to improve
patient handoIIs.J Am Med InIorm Assoc. Jul-Aug.
16(4):509-15. Indianapolis, IN, USA.
|2| Nikhil Sharma. 2008. Sensemaking handoII: When and
how?. In Proceedings oI the American Society Ior
InIormation Science and Technology.45(1): 1-12.
DOI÷10.1002/meet.2008.1450450234.
http://dx.doi.org/10.1002/meet.2008.1450450234.
|3| Arora V, Johnson J, Lovinger D, Humphrey HJ, Meltzer DO.
2005. Communication Iailures in patient sign-out and
suggestions Ior improvement: A critical incident analysis.
Qual SaI Health Care. 2005;14:4017.
|4| Dowding, D. 2008. Examining the eIIects that manipulating
inIormation given in the change oI shiIt report has on nurses`
care planning ability. Journal oI advanced Nursing. 33(6):
836-46. DOI: 10.1046/j.1365-2648.2001.01723.x.
|5| Klein, G. Moon, B.and HoIIman, R.R. 'Making Sense oI
Sensemaking 1: Alternative Perspectives,¨ Intelligent
Systems, vol. 21, no. 4, 2006, pp. 7073.
|6| Dervin, B. Sense-Making Theory and Practice: An
overview oI user interests inknowledge seeking and use.
(1998) Journal oI Knowledge Management, 2(2), 36-46.
|7| Russell, Daniel M., SteIik, Mark J., Pirolli, Peter, Card,
Stuart K. (1993) "Cost structure oI sensemaking"
Proceedings oI the CHI ' 93. 269-276.
|8| Weick, K. E. (1996). Sensemaking in organizations.
Newbury Park, CA: Sage.
|9| Aleksandra Sarcevic and Randall S. Burd. 2009. InIormation
handover in time-critical work. In Proceedings oI the ACM
2009 international conIerence on Supporting group work
(GROUP '09). ACM, New York, NY, USA, 301-310.
DOI÷10.1145/1531674.1531720
http://doi.acm.org/10.1145/1531674.1531720
|10| Dorrit Billman and Eric A. Bier. 2007. Medical sensemaking
with entity workspace. In Proceedings oI the SIGCHI
conIerence on Human Iactors in computing systems (CHI
'07). ACM, New York, NY, USA, 229-232.
DOI÷10.1145/1240624.1240662
http://doi.acm.org/10.1145/1240624.1240662
|11| Goldsmith D, Boomhower M, Lancaster D R, Antonelli M,
Kenyon M, Benoit A, Chang F, Dykes P. 2010. Development
oI a Nursing HandoII Tool: A Web-Based Application to
Enhance Patient SaIety. In Proceedings oI AMIA Annu
Symp Proc. 2010; 2010: 256260.
|12| Chau D. H. P., Kittur A., Hong J. I., Faloutso C. (2011)
Apolo: Making Sense oI Large Network Data by Combining
Rich User Interaction and Machine Learning. CHI 2011,
Vancouver, Canada.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 137 -
|13| Norman, Donald A. (1991): Cognitive ArtiIacts. In:
Carroll,John M. (Eds.) 'Designing Interaction: Psychology at
the Human-Computer InterIace¨. Cambridge University
Press
|14| Bossen C (2002) The parameters oI common inIormation
spaces: the heterogeneity oI cooperative work at a hospital
ward. In: Proceedings oI the 2002 ACM conIerence on
Computer supported cooperatXiao Y, Hu P, Moss J, de
Winter J, Venekamp D, Mackenzie C, Seagull F, Perkins S
(2008) Opportunities and challenges in improving surgical
work Ilow. Cogn Tech Work 10(4):313321
|15| T. R. Gruber. Toward principles Ior the design oI ontologies
used Ior knowledge sharing. Presented at the Padua
workshop on Formal Ontology, March 1993, later published
in International Journal oI Human-Computer Studies, Vol.
43, Issues 4-5, November 1995, pp. 907-928. ive work.
ACM, New Orleans
|16| Wears R, Perry S, Wilson S, Galliers J, Fone J (2007)
Emergency department status boards: user-evolved arteIacts
Ior inter- and intra-group coordination. Cogn Technol Work
9(3):163170
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 138 -
Gestão de contexto no levantamento colaborativo de
processos de negócio
Douglas Machado Silva
Programa de Pós-Graduação em Informática
Núcleo de Pesquisa e Prática em Tecnologia
Universidade Federal do Estado do
Rio de Janeiro – UNIRIO
Av. Pasteur, 458, Rio de Janeiro – RJ
CEP: 22290-240 – Brazil
+55-21-3873-6400 / 2530-8088
douglas.machado@uniriotec.br
Renata Mendes de Araujo
Programa de Pós-Graduação em Informática
Núcleo de Pesquisa e Prática em Tecnologia
Universidade Federal do Estado do
Rio de Janeiro – UNIRIO
Av. Pasteur, 458, Rio de Janeiro – RJ
CEP: 22290-240 – Brazil
+55-21-3873-6400 / 2530-8088
renata.araujo@uniriotec.br
Flávia Maria Santoro
Programa de Pós-Graduação em Informática
Núcleo de Pesquisa e Prática em Tecnologia
Universidade Federal do Estado do
Rio de Janeiro – UNIRIO
Av. Pasteur, 458, Rio de Janeiro – RJ
CEP: 22290-240 – Brazil
+55-21-3873-6400 / 2530-8088
flavia.santoro@uniriotec.br
ABSTRACT
O levantamento de processos de negocio é uma atividade
eminentemente colaborativa, de construção de conhecimento
através do compartilhamento de visões e inIormação sobre um
objeto comum, que é o processo. O levantamento é geralmente
realizado através de entrevistas com os envolvidos na execução
do processo, onde o analista de processos tem como principal
Ionte de inIormação o entrevistado. InIormações relevantes que
interessam ao levantamento podem estar dispersas em diversas
Iontes, incluindo levantamentos realizados por outros analistas, e
podem serignoradas no momento da entrevista. A diIiculdade em
se perceber oportunidades de uso e compartilhamento de
inIormações no momento da entrevista pode tornar o
levantamento Iragmentado e levar a construção de um modelo de
processo inconsistente ou incompleto. Este artigo apresenta uma
proposta para o levantamento de processos de negocio baseada
em colaboração e orientada a contexto, visando minimizar a
Iragmentação deinIormação.
Categories and Subject Descriptors
H.4.1|Office Automation|: Groupware.
General Terms
Experimentation.
Keywords
Levantamento colaborativo de processos de negocio; gestão de
contexto.
1. INTRODUÇÃO
Modelos de processos de negocios vêm ganhando cada vez mais
importância para as organizações, pois são considerados como
Ionte para projetos de melhoria de processos, redeIinição de
estratégias de negocios e especiIicação de requisitos de sistemas
de inIormação |1, 2, 3|. A elicitação de processos é uma
atividade eminentemente colaborativa, de construção de
conhecimento comum e resolução de conIlitos e ambigüidades.
Diversas técnicas são utilizadas para descobrir e elicitar
processos de negocios. Dentre as diversas abordagens
|1,2,4,5,6,7|, a que mais se pratica nas organizações são as
entrevistas |1|. Durante as entrevistas, a principal Ionte de
inIormação sobre o processo é o proprio entrevistado. As
entrevistas tendem a gerar resultados Iragmentados, onde os
executores do processo são entrevistados em momentos distintos,
possivelmente por diIerentes analistas.
Independentemente da técnica utilizada, o levantamento de
processos não pode prescindir de atividades de consolidação das
inIormações obtidas. Nesta consolidação, as inIormações obtidas
por diIerentes analistas, utilizando-se de diIerentes técnicas,
devem ser reunidas e organizadas, bem como possiveis conIlitos
devem ser solucionados. O resultado desta consolidação se
reIlete no modelo de processo construido, que corresponde ao
conhecimento comum obtido nolevantamento.
O Iluxo de atividades de levantamento e consolidação,
dependendo da complexidade, relevância e abrangência do
processo em questão, pode trazer diIiculdades tanto na
produtividade do levantamento como na qualidade Iinal do
modelo. Em relação a produtividade, a Iase de consolidação pode
apresentar conIlitos que justiIiquem o retorno as Iontes de
inIormação, consumindo tempo e podendo gerar atrasos. Em
relação a qualidade, as abordagens de maneira geral tratam parte
das inIormações – visões pessoais, registros em documentos,logs
de aplicações etc. Mesmo que o analista reuna todas as
inIormações disponiveis para realizar o levantamento, ele se
depara com o problema de identiIicar a relevância das
inIormações vindas destas diversas Iontes, podendo limitar sua
visão das inIormações e a geração de modelos de processo
incompletos e/ouinconsistentes.
Este artigo apresenta uma abordagem de levantamento
colaborativo de processos de negocio, orientada a contexto, que
tem como objetivo permitir ao analista acessar inIormações
relevantes durante a realização do levantamento de processos de
negocio, em particular durante as entrevistas. A proposta é que o
levantamento seja realizado de Iorma a se construir
coletivamente um rascunho do modelo do processo. Associado a
isto, a proposta sugere que mecanismos de gestão de contexto
possam auxiliar o analista, no momento de uma entrevista, com a
apresentação de inIormações relevantes ja obtidas no contexto do
levantamento deste mesmo processo. A proposta visa aumentar a
produtividade e a qualidade do levantamento por permitir que o
analista, no momento de uma entrevista, seja capaz de Iazer uso
e/ou complementar as inIormações ja obtidas através de outras
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 139 -
Iontes no mesmo levantamento, antecipando ou Iacilitando a Iase
de consolidação.
O artigo esta organizado em cinco seções. Na Seção II são
apresentados os principais cenarios e abordagens de
levantamento de processos de negocio. A Seção III apresenta a
proposta. A seção IV apresenta os resultados de um estudo
exploratorio. A Seção V conclui o trabalho e aponta trabalhos
Iuturos.
2. LEVANTAMENTO DE PROCESSOS
BASEADO EMENTREVISTAS
As abordagens para levantamento apresentadas na literatura
podem ser classiIicadas basicamente em dois grupos: baseadas no
uso de entrevistas e baseadas em técnicas de mineração. As
baseadas em entrevista são a maioria |1, 8, 9| e pressupõe que o
levantamento se dê a partir das inIormações disponiveis na
experiência pessoal dos participantes do processo. Ja as técnicas
baseadas em mineração usam outras Iontes de inIormação. E o
caso das abordagens propostas por |6| e |10|, que partem da
analise de interIaces, codigos-Ionte e bases de dados de
aplicações. Outras Iazem uso apenas do codigo-Ionte, como os
trabalhos de |4, 5, 6, 11|. Propostas mais recentes combinam
estas duas visões, permitindo, por exemplo, a mineração de
processos a partir de historias narradas pelos executores dos
processos |1, 11|. Nestetrabalho, nosinteressa astécnicas que se
baseiam em entrevistas onde a necessidade de colaboração entre
analistas e entrevistados é Iundamental.
As entrevistas normalmente são realizadas on site, ou seja, no
local de trabalho dos participantes, também sendo possivel a
realização off site, geralmente em algumlocal proximo de onde o
participante é estabelecido. Dependendo da quantidade de
participantes do processo e do distanciamento geograIico entre
eles, o levantamento pode ser realizado por uma equipe de
analistas. E necessario, então, que os analistas se reunam para
compartilhar as inIormações levantadas. Cada um dos analistas
pode ter Ieito registros em algum soItware, em papel, em audio
ou até mesmo em video, tendo internalizado também algum
conhecimento tacito. A partir dessa reunião entre os analistas é
que as duvidas e as incompletudes são endereçadas e um modelo
é construido.
As técnicas baseadas em entrevista têm uma série de limitações
inerentes a propria entrevista, como o viés na escolha dos
entrevistados, viés por parte do entrevistador e pouco
entendimento do dominio por parte do analista |1|. Outra
limitação se reIere ao problema de se levantar processos em um
ambiente distribuido, principalmente quando diIerentes
entrevistado apresentam deIinições ou visões diIerentes para um
mesmo item abordado no levantamento. Caso haja uma duvida
do analista em relação a uma inIormação coletada durante o
levantamento, qual caminho este analista deve percorrer para
sanar esta duvida? Como o analista deve proceder, caso ele não
compreenda determinados conceitos abordados durante o
levantamento?
E sabido que a existência de varios participantes pode auxiliar
em um entendimento mais completo sobre o dominio,
principalmente se eles tiverem papéis distintos na execução do
processo. Entretanto, é comum que cada participante tenha
visões limitadas ou até mesmo conIlitantes sobre as atividades.
Além disso, os participantes, com seus varios pontos de vista,
podem induzir o analista a ter uma interpretação parcial ou até
mesmo equivocada de conceitos ou Iormas de execução do
processo. Esses conIlitos e essas incompletudes de inIormação
so são solucionados na medida em que os analistas se reunem ou
agendam novas entrevistas.
Como a consolidação das inIormações so acontece depois das
entrevistas, a realização de reuniões pode ter como consequência
um atraso ou até mesmo redução de qualidade no levantamento.
Além do tempo gasto com as reuniões em si, os analistas podem
ter que realizar novas entrevistas para poder solucionar conIlitos
eincompletudesidentiIicados na reunião.
Uma possibilidade seria o analista levar para cada entrevista,
todas as inIormações ja levantadas por ele e pelos demais.
Entretanto, ter todas as inIormações no momento da entrevista
pode até mesmo prejudicar a condução da entrevista, ja que nem
todas essas inIormações serão uteis ao levantamento. Em ambos
os casos, tem-se o problema da Iragmentação das inIormações,
conIorme ilustrado na Figura 1. As inIormações sobre o
levantamento Iicam dispersas, diIicultando com que o analista
acesse ainIormação que é relevante para o momento.
Mesmo que o analista tivesse posse de toda a inIormação
disponivel para o levantamento, passaria pelo problema de ter
que consolida-las e analisar sua relevância. O argumento desta
pesquisa é que, se a colaboração Ior associada uma abordagem de
contexto, é possivel que os analistas tenham acesso a
inIormações compartilhadas que sejam relevantes para o
levantamento. A seção a seguir apresenta a abordagem proposta.
3. LEVANTAMENTO COLABORATIVO
DE PROCESSOS ORIENTADO A
CONTEXTO
A abordagem proposta neste trabalho tem por base o
levantamento baseado na construção de rascunhos de diagramas
de processos, na colaboração e na gestão de contexto.
Os rascunhos de diagramas de processos são compostos
basicamente por três elementos: eventos de inicio e Iim,
atividades e desvios. Esses rascunhos não chegam a ser o modelo
do processo em si por terem um conjunto de elementos reduzido
em relação aos modelos gerados por uma Ierramenta
convencional de modelagem de processos Ieita para ambientes
desktop.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 140 -
Figura 1. Analista de negócio emmeio à fragmentação das
informações sobre olevantamento
Entretanto, permitem o registro visual do processo e também de
anotações Ieitas a mão livre. A simplicidade do rascunho permite
que o analista Iaça suas anotações com rapidez, sem prejudicar o
levantamento, além de Iacilitar o compartilhamento.
3.1 Colaboração
No novo cenario de levantamento proposto, a equipe de analistas
compartilha rascunhos de diagramas de processos construidos
durante entrevistas, conIorme proposto em |12|. Desta Iorma, os
analistas começam a rascunhar o processo no momento da
realização das entrevistas delevantamento.
Através da colaboração os analistas compartilham os rascunhos
ja elaborados e todas as inIormações que neles possam estar
contidas, como regras, atividades, conceitos, atores e etc., assim
como podem se comunicar diretamente com o analista
responsavel pelo rascunho que esta sendo visualizado. Desta
Iorma, um analista que estiver realizando uma entrevista e tiver
duvidas, pode consultar os rascunhos ou os proprios analistas no
mesmo instante e assim completar seu entendimento, sanar
duvidas ou descobririnconsistências.
3.2 Gestão de contexto
Ter acesso a todas as inIormações ja levantadas sobre o processo
pode representar um problema se não houver uma Iorma de se
identiIicar o que é relevante. A abordagem de gestão de contexto
|13| pode auxiliar na identiIicação das inIormações relevantes,
eliminando ou ao menos diminuindo a necessidade dos analistas
re-entrevistarem os participantes ou se reunirem até chegar a um
consenso.
Contexto é descrito por |14| como “tudo sobre toda a situação
relevante para uma aplicação e seu conjunto de usuarios” ou
“qualquer inIormação que pode ser usada para caracterizar a
situação de uma entidade”. Uma entidade pode ser uma pessoa,
um lugar ou um objeto que é considerado relevante para a
interação entre o usuario e a aplicação, incluindo o proprio
usuario e a aplicação |14|
Em |15| é destacado que inIormações sobre o contexto que
permeiam as atividades passadas de uma equipe podem ajudar a
compreender situações atuais. Desta Iorma, a transIerência de
conhecimento entre atores so acontece plenamente se houver um
Ioco comum deinterpretação e um contexto |15|.
A proposta apresentada neste artigo requer que a colaboração
seja apoiada pela gestão de contexto. Com inIormações de
contexto associadas aos rascunhos, o analista pode registrar
adequadamente o contexto do levantamento. A partir desses
registros os analistas podem ampliar seu entendimento e obter
consenso durante a realização da entrevista, solucionando
eventuais conIlitos de entendimento. Se os rascunhostiverem um
contexto associado, então é possivel sugerir recomendações para
o analista sobre inIormações que estejam relacionadas ao
contexto no qual o mesmo Iaz o levantamento. No caso de uma
duvida não solucionada ou um conIlito não resolvido, também é
possivel, a partir dos registros, recorrer a Ionte da deIinição para
busca deinIormações complementares.
Ha uma série de elementos que caracterizam o contexto do
levantamento. Se durante o processo de levantamento surge um
termo ou um conceito cuja deIinição não seja Iamiliar para o
analista, torna-se então necessario registrar o contexto no qual
este termo Ioi deIinido para que Iuturamente esta inIormação
possa ser recuperada de Iorma contextualizada. Se o termo é
deIinido por um participante, deve ser considerado que este
participante tem papéis no processo, cargos na organização e
tempo de experiência em determinados dominios. Além disso,
essas deIinições podem ter sido obtidas em diIerentes ocasiões,
como reuniões, workshops, entrevistas, emails, teleIonemas,
conversas inIormais e etc. Em qualquer um desses eventos, é
possivel se determinar o assunto/pauta, os participantes, a data e
o local em que Ioram realizados, além da situação que motivou a
duvida sobre o esclarecimento da deIinição dotermo.
Todos os elementos descritos até então são Iortes indicadores de
se o termo Ioi deIinido de Iorma ampla, abrangente, ou se
apresenta viés de acordo com as caracteristicas do momento de
sua deIinição ou de sua autoria. Desta Iorma entende-se quetodo
termo ou atividade identiIicado durante o levantamento tem um
contexto associado, possibilitando o uso de uma abordagem
orientada a contexto para seu armazenamento e Iutura
recuperação. No caso de uma entrevista de levantamento, o
contexto pode ser representado através dos elementos descritos
na Tabela 1. Os autores, por sua vez, também têm suas
caracteristicas, como papéis na atividade, cargos na organização
e tempo de experiência no dominio. Ja as ocasiões podem ser
caracterizadas de acordo com o evento que motivou a obtenção
da inIormação (ex.: o autor respondeu a uma pergunta do analista
ou o autor descreveu um dia atipico detrabalho).
A partir do entendimento de contexto é necessario ter
mecanismos para representação, captura, armazenamento e
recuperação do contexto |16|. Normalmente a abordagem de
gestão de contexto esta associada a alguma aplicação ou a algum
Permission to make digital or hard copies oI all or part oI this work Ior
personal or classroom use is granted without Iee provided that copies are
not made or distributed Ior proIit or commercial advantage and that copies
bear this notice and the Iull citation onthe Iirst page. To copy otherwise, or
republish, to post on servers orto redistributetolists, requires prior speciIic
permission and/or a Iee.
JII Simposio Brasileiro ae Sistemas Colaborativos, Outubro 5-7, 2011,
Rio de Janeiro – RJ, Brazil.
Copyright 2011 $10.00.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 141 -
sistema, que são chamados de context-aware systems ou
aplicações sensiveis ao contexto. Aplicações sensiveis ao
contexto são aquelas que são capazes de adaptar suas operações
ao contexto corrente sem a necessidade da intervenção explicita
do usuario |17|.
Tabela 1. Elementos de contexto ementrevistas de
levantamento
Elemento Descrição do elemento
DeIinição Descrição dotermo ou da atividade
Contra-
deIinição
Conceitos que podem ser conIundidos
com a deIinição do termo ou atividade e
devem expressar explicitamente que não
têm relação com otermo ou atividade
Exemplos Exemplos que ilustrem a deIinição do
termo ou da atividade
Autoria Autor da deIinição
Ocasião da
deIinição
Ocasião na qual a deIinição do termo ou
atividade Ioi conseguida
Desta Iorma, uma aplicação sensivel ao contexto para o
levantamento colaborativo de processos se Iaz necessaria.
Através de uma Ierramenta que incorpore a gestão de contexto,
evita-se o problema do analista se deparar com uma grande
quantidade deinIormações sem saber qual delas é relevante.
4. UMESTUDO EXPLORATÓRIO COM
USO DE APLICAÇÃO COLABORATIVA
O problema da Iragmentação das inIormações no levantamento,
discutido na seção II, Ioi investigado através de um estudo
exploratorio realizado com quatro alunos de cursos de graduação
na universidade. Neste estudo os alunos representaram analistas
de processos e entrevistaram participantes de processos no
âmbito acadêmico.
Para Iazer este levantamento os alunos atuaram em pares. Cada
par de alunos entrevistou uma pessoa diIerente em locais
distintos Iazendo uso de um prototipo chamado Netsketcher |12|
em umtablet.
ConIorme descrito em |12|, a abordagem proposta prevê que os
analistas devem construir rascunhos de diagramas durante o
levantamento do processo. Netsketcher é basicamente um
diagramador colaborativo. Acredita-se que esse tipo de
Ierramenta permite um balanceamento entre a anotação textual e
a modelagem em si. O conjunto de Iuncionalidades da Ierramenta
é muito menor do que o de uma aplicação de modelagem de
processos, da mesma Iorma que um tablet normalmente tem
menos recursos computacionais do que um notebook ou um
desktop. Entretanto, esta simplicidade permite que o analista seja
eIiciente no uso da aplicação durante as entrevistas.
Através da realização de gestos com um dispositivo apontador
(styllus) a Ierramenta reconhece os elementos basicos dos
diagramas de processos, permitindo que o analista elabore o
rascunho do processo com praticidade durante a entrevista. Além
do rascunho, o analistatambém pode Iazer anotações a mãolivre.
Um exemplo de rascunho de processo Ieito pelo Netsketcher
pode ser visto na Figura 2. Na seção anterior Ioi apresentada uma
deIinição sobre o que se entende por contexto no levantamento
de processos de negocio. A aplicação proposta em |12| não trata
a gestão de contexto.
Terminadas as entrevistas, os alunos Ioram reunidos em uma sala
para que pudessem consolidar as inIormações levantadas. De
acordo com o relato dos alunos, Ioi possivel concluir que os
entrevistados não compreendiam o processo como umtodo, o que
evidencia a questão dos multiplos pontos de vista que os
participantestêm do processo.
Devido a isso, os alunos disseram ter obtido visões limitadas do
processo e que precisavam levantar mais inIormações. Nenhum
dos alunos Iicou satisIeito com a qualidade das inIormações
levantadas. Foi possivel identiIicar que dois analistas obtiveram
uma visão conIlitante sobre o processo. Apos o compartilhamento
de todas as inIormações levantadas, Ioi possivel esclarecer as
duvidas dos alunos e chegar a um entendimento comum do
processo. Essas conclusões reIorçam a necessidade do uso de
uma abordagem colaborativa.
Segundo os proprios estudantes, a mobilidade proporcionada pela
Ierramenta Iacilitou olevantamento. Entretanto, segundo eles
Figura 2. Exemplo de esboço de umprocesso
o levantamentoteria sido mais eIiciente se eles pudessemtertido
acesso asinIormaçõesjalevantadas pelos outros analistas antes e
durante o levantamento. Outro ponto apontado por eles Ioi o de
que a consulta ao rascunho ja elaborado não seria suIiciente para
a compreensão do processo pela Ialta de inIormações adicionais,
como o nome e o cargo do entrevistado. Além disso, os alunos
relataram que precisariam se comunicar para tirar duvidas sobre
o rascunho gerado, sendoideal a comunicaçãoinstantânea.
Desta Iorma, entende-se que a aplicação |12| Iacilitaria o
levantamento, entretanto algumas questões ainda precisam ser
endereçadas. A primeira delas é ainexistência deinIormações de
contexto do levantamento. Quando um analista acessa os
rascunhos gerados por outro analista, ele basicamente tem acesso
a todas as inIormações ja levantadas, conduzindo ao cenario ja
exibido na Figura 1. Essas inIormações não necessariamente são
relevantes para o levantamento que esta sendo realizado naquele
momento. Além disso, as inIormações se resumem ao rascunho
do processo. Não ha inIormações contextuais como deIinições de
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 142 -
termos, contra-deIinições, autoria e exemplos. Se o analista
necessitar sanar duvidas sobre um termo ou uma atividade, ele
precisa recorrer ao analista que Iez o levantamento para obter
mais inIormações. A outra questão se reIere a passividade,ja que
o eIetivo compartilhamento de inIormações so acontece se um
analista adotar uma postura pro-ativa de consultar os dados
obtidos pelos demais.
Na nova abordagem proposta, entende-se que as inIormações
levantadas devem estar associadas a um contexto, para que os
analistas tenham acesso apenas as inIormações que Iorem
relevantes para olevantamento que esta sendo realizado. Assim o
analista tera uma compreensão mais soIisticada sobre os
rascunhosja gerados.
Desta Iorma, são propostas melhorias na aplicação proposta em
|12| de Iorma que a gestão de contexto possa ser incorporada.
Um dos requisitos da nova aplicação é o registro deste contexto.
Desta Iorma, durante a elaboração do rascunho o analista poderia
selecionar determinada palavra ou conjunto de palavras e
associar a este termo todos os elementos de contexto descritos na
Tabela 1.
O registro do contexto associado ao rascunho conduzira ao
requisito recomendação. No momento em que o analista Iaz
anotações, a Ierramenta analisa cada palavra registrada e procura
correspondentes nas inIormações de contexto dos rascunhos
armazenados. Caso haja correspondência, a Ierramenta apresenta
para o analista uma lista com links para que esses rascunhos
possam ser consultados. Além disso, caso o autor do rascunho
esteja on-line, é possivel que os analistas se comuniquem via
chat.
Independente da recomendação da aplicação, também é possivel
que o analista Iaça a consulta dos rascunhos relacionados ao
contexto do levantamento. Através desta Iuncionalidade o
analista pode Iazer pesquisas nos rascunhos usando elementos de
contexto especiIicos e assim acessar inIormações relevantes
antes, durante ou depois da entrevista. A Figura 3 ilustra o uso
do prototipo com as melhorias a seremincluidas.
5. CONCLUSÃO
Este artigo apresenta uma proposta de abordagem de
levantamento colaborativo de processos de negocio orientada a
contexto, que visa tratar o problema da Iragmentação das
inIormações no levantamento de processos de negocio através de
entrevistas.
A principal contribuição deste trabalho é a elaboração de uma
abordagem delevantamento colaborativo de processos de negocio
orientada a contexto. Esta abordagem auxilia o analista a realizar
o levantamento municiado com asinIormações relevantes sobre o
levantamento que ja Ioram obtidas em outras sessões de
levantamento. O acesso a essas inIormações permite que o
analista tenha uma compreensão mais ampla do processo que
esta sendo levantado, Iacilitando a identiIicação e a resolução de
conIlitos de levantamento. O esclarecimento de duvidas e
obtenção de consenso passa a acontecer no momento da
entrevista. Além disso, o acesso as inIormações relevantes no
levantamento tera impacto direto na completude e na
consistência do modelo gerado.
Como trabalho Iuturo sera Ieita a especiIicação e a validação da
gestão de contexto e das Iuncionalidades da aplicação de suporte,
assim como serão realizados estudos de caso em cenario real de
uma organização para demonstrar a validade da abordagem.
Figura 3. Abordagemdelevantamento colaborativo de
processo de negócio orientada a contexto
6. REFERÊNCIAS BIBLIOGRÁFICAS
|1| J.C. Gonçalves, F.M. Santoro, F.A Baião,“Business process
mining from group stories”, Proc.13th International
ConIerence on Computer Supported Cooperative Work in
Design, 2009. p. 161-166.
|2| WMP Aalst, HT de Beer, BF van Dongen,“Process mining
ana verification of properties. An approach basea on
temporal logic”, Proc. International ConIerence on
Cooperative InIormation Systems. Springer: Berlin, 2005;
130–140.
|3| F.M. Santoro, M.R.S. Borges, J.A. Pino, “Tell us your
process. A group storytelling approach to cooperative
process moaeling”, In Computer Supported Cooperative
Workin Design, p.29-34, 2008.
|4| AB Earls, SM Embury, Turner NH, “A methoa for the
manual extraction of business logics from legacy source
coae”, BT Technology Journal, 2002, 20(4):127–145
|5| H. Huang, “Business rule extraction from legacy coae”,
Proc. 20th ConIerence on Computer SoItware and
Applications, IEEE Computer Society: Silver Spring MD,
1996, 162
|6| H.M. Sneed, K. Erdos, “Extracting Business Rules from
Source Coae”, Proc. 4th International Workshop on Program
Comprehension (WPC '96), 1996.
|7| H.M. Sneed, “Extracting business logic from existing
COBOL programs as a basis for reaevelopment”, proc.
Ninth International Workshop on Program Comprehension,
IEEE Computer Society: Silver Spring MD, 2001, 167
|8| U.S. Bititci, D. Muir, “Business process aefinition. A
bottom-up approach”, proc. International Journal oI
Operations and Production Management, vol. 17, 1997, pp.
365-374.
|9| N.a Damij, T.b Damij, J.c Grad, F.d Jelenc,“A methoaology
for business process improvement ana IS aevelopment”, In
InIormation and SoItware Technology, vol. 50, 2008, p.
1127-1141.
|10| Y.a Zou, J.b Guo, K.C.a Foo, M.c Hung, “Recovering
business processes from business applications”, In Journal
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 143 -
oI SoItware Maintenance and Evolution, Vol. 21, p. 315-
348, 2009.
|11| R. S. Aguilar-Savén, “Business process moaelling. Review
ana framework, In International Journal oI Production
Economics, vol 90, p. 129-149.
|12| N. Baloian, J. Pino, F. Santoro; G. Zurita, R. M. Araujo, S.
W. M. Siqueira, D. M. Silva, “A Collaborative Mobile
Approach for Business Process Elicitation”, In:
International ConIerence on Computer Supported
Cooperative Workin Design, Lausanne, 2011.
|13| V. T. Nunes, F. M. Santoro, M. R. S. Borges.“Um moaelo
para gestão ae conhecimento baseaao em contexto”, In
Simposio Brasileiro de Sistemas Colaborativos, 2007.
|14| A. K. Dey, “Unaerstanaing ana Using Context”, In
Personal Ubiquitous Computing, vol. 5, 2001.
|15| F.M. Santoro, P. Brézillon, “Developing sharea context
within group stories”, In Lecture Notes in Computer
Science, Vol. 3706 LNCS, p. 232-247, 2005.
|16| V. Vieira, P. Tedesco, A. M. Salgado, “Towaras an
Ontology for Context Representation in Groupware”, In
Lecture Notes in Computer Science, 2005, Volume
3706/2005, 367-37.
|17| M. BaldauI, S. Dustdar, F. Rosenberg, “A survey on
context-aware systems”, In Int. J. Ad Hoc and Ubiquitous
Computing, Vol. 2, No. 4, pp.263–277, 2007.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 144 -
MEK: Uma abordagem oportunística para disseminação
colaborativa do conhecimento
Diego S. Souza
Programa de Pós-Graduação em
Informática - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
diessouza@ufrj.br

Jonice Oliveira
DCC/ Programa de Pós-Graduação
em Informática - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
jonice@dcc.ufrj.br


Guilherme Fogaça
Programa de Pós-Graduação em
Informática - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
guilherme.fogaca@ufrj.br
Pedro C. Silveira
DCC - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
pedrosilveira@ufrj.br


Jano M. de Souza
COPPE-Programa de Eng. de
Sistemas e Computação - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
jano@cos.ufrj.br
ABSTRACT
ThispaperpresentsanapproachIordata disseminationin mobile
P2P network, in order to Ioster collaboration among users.
Objects are transmitted in a proactive manner with others via
short-range radio Irequency. The spread data is based on context
inIormation and user proIile Ieatures. A user, who has certain
inIormation interesting to someone else, can send it, helping to
increase knowledge oI the interested. The data can exchanged
short texts, videos, sounds, images, links and documents in their
diIIerentIormats.Thisapproach,calledMEK
1
,isbeingdeveloped
inpartnershipwithMicrosoItResearch.

RESUMO
Estetrabalhoapresentaumaabordagemdedisseminaçãodedados
emumaredep2pmovel,aIimdeestimularacolaboraçãoentreos
usuarios. Os objetos são transmitidos de uma maneira pro-ativa
com os demais via Ireqüência de radio de curto alcance. A
disseminação dos dados é baseada em inIormações de contexto e
caracteristicas do perIil do usuario. Um usuario que possui uma
determinada inIormação interessante para outra pessoa pode
envia-la, contribuindo para o aumento de conhecimentos do
interessado. Os dados trocados podem ser textos curtos, videos,
sons, imagens, links` e documentos em seus diIerentes Iormatos.
Esta abordagem, chamada MEK
1
, esta sendo desenvolvida em
parceriacomaMicrosoItResearch.

CategoriesandSubjectDescriptors
Implicit Subject Descriptors: J.3 -Cellular computing ; C.2.1-
Peer-to-peercomputing
GeneralTerms
Algorithms;HumanFactors
Keywords
CSCW,KnowledgeDissemination,P2P,CSCL.
1. INTRODUÇÂO
Desdeaantiguidadeohomemtemcomomeiodesobrevivênciaa
organização em sociedade, para juntos desempenharem as mais
variadas tareIas. Porém como no passado havia apenas meios de
comunicação simples, a interação das pessoas se dava através da
presençaIisica,havendonecessidadedelocomoção.Comopassar
dotempoastareIasrealizadaspelosindividuosIoramsetornando
mais complexas, havendo assim uma grande interatividade das
pessoas de varias areas proIissionais e das mais diversas areas
geograIicas. IssocontribuiuparaoaperIeiçoamentodos meiosde
comunicação permitindo a realização de tais tareIas e para o
'surgimento¨ dos métodos colaborativos.
Com o avanço de tecnologias 'wireless¨, nossa Iorma de se
comunicarcomomundomudaacadadia.Osdispositivosmoveis
tais como celulares, note/netbooks`, e mais recentemente os
tablets`, permitem que estejamos conectados permanentemente
comaspessoas.EstanecessidadedeinteraçãocomaspessoasIaz
com que troquemos inIormação de maneira constante. Pessoas
conversam ao celular onde quer que estejam, Iotos de lugares
interessantessãocompartilhadas,mensagensdetextosãotrocadas
para continuar uma discussão. Contudo, uma vez que essas
interações terminam, muita inIormação se perde por não ser
armazenada.
Esta atual revolução nas tecnologias sem Iio nos traz novas
perspectivasdecomunicaçãoeinteraçãosocial.Podemossalientar
duas diIerentes caracteristicas de como as pessoas interagem, no
trabalho ou em seu tempo livre. Primeiramente, tempo e espaço
nãosãomaisumproblema.Pessoaspodemtrabalharousedivertir
em qualquer lugar, em qualquer instante, necessitando apenas de
uma conexão a Internet para isso. A segunda diIerença é que as
interaçõeshumanas estãomaisIaceis(dese conseguir)doqueno
passado, embora possam ser muito mais curtas. Você pode
procurar, encontrar e interagir com alguém para lhe ajudar a
resolverumproblema especiIico,ouapenasparajogar,masestas
interaçõessãoIracasepodemserperdidasaoIinaldatareIa,jogo
ou conexão da Internet. Ou seja, o mais importante é o que Ioi
aprendido,coletadoouusuIruidopelainteração,doqueosagentes
dacomunicaçãoemsi.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 145 -
Estes pontos são relacionados a uma nova Iase de vida, chamada
cybercultura`|7|. Cybercultura` começa a envolver pessoas e
objetos em um imenso ambiente conectado: não mais pontos de
acessos, mas lugares`. Com o desenvolvimento da computação
movel,estetipodeculturaeseusespaçosnospermitiramaentrar
em uma era caracterizadapelocoletivo e distribuido`, sendoque
o coletivo é a agregação parcial e temporal de muitos itens. Este
cenario altamente conectado esta mudando a maneira como as
pessoas interagem com os espaços e o mundo toma novas
dimensões|8|.
Seguindo as observações acima, surge o conceito do MEK
1
. As
pessoassãoconsideradas comopotenciaiscentrosde inIormação,
pelos quais quaisquer recursos de inIormação podem ser
disseminados, para quem o considere importante, de maneira
colaborativa e oportunistica. Nesta abordagem, a troca de
conhecimentos
3
não se limita a um grupo de pessoas, onde a
inIormação estaria 'restrita¨, mas expande as possibilidades de
troca e compartilhamentoatodosaoseuredor. Adisseminaçãoé
realizada de maneira oportunistica, de maneira que seja
selecionado e propagado apenas o que possa ser util ou de
interessedoIuturoreceptor.
Segundo Zhang (2006), o modelo de colaboração oportunistica
nosguiaa umnivelde colaboração maisresponsavel, pervasiva,
Ilexiveledistribuida,possuindomaioresvantagensparaadiIusão
dainIormaçãoeconhecimento.
Sera apresentado, a seguir, de Iorma mais detalhada, o aplicativo
desenvolvido, além das instâncias de seu Iuncionamento, o
IormatodesuaarquiteturaeasIuncionalidadesjaimplementadas.
Dessa Iorma teremos uma visão geral sobre a aplicabilidade do
MEK
1
esuaspossiveisutilizaçõesemambientesreais.
2. OB1ETIVODOTRABALHO
Uma rede p2p
2
movel é Iormada por um conjunto de objetos em
movimento que se comunicam através de tecnologias sem Iio de
curto alcance. Neste tipo de rede, os objetos recebem dados de
seus vizinhos ou de objetos remotos que utilizam elementos
intermediarios para auxiliar na comunicação. Como descrito
acimaedetalhadonaproximaseção,oprincipalobjetivodoMEK
écapturar etransmitir dadosdo interessedo usuario,levando em
consideração o local, o perIil do usuario (principalmente seus
interesses), os conhecimentos
3
que possui os vizinhos existentes
naquela localidade e naquele instante de tempo, o perIil destes
vizinhos, os conhecimentos que os vizinhos possuem, os
assuntos/temas do conhecimento (do usuario e de seus vizinhos).
A partir de tais inIormações é que a disseminação de
conhecimentos para possiveis interessados é Ieita. Essa
transmissãoseletivapodeserutilemalgunscenarios,como:
x IdentiIicação de demandas e oIertas Por exemplo,
lojas podem colocar suas promoções e os interessados
podem receber tal inIormação ao passar proximo da
lojaouproximo deoutrapessoaquejarecebeuaquela
inIormação.Pessoasinteressadasemconheceracidade
podem receber inIormações sobre o local que esta
visitandoaopassarporoutrostranseuntesouturistas.
x Emergências ou desastres Para a localização de

1
MEK Este é o acrônimo do nome desta abordagem, que se
chama 'Mobile Exchange oI Knowledge¨.
2
P2Ppeer-to-peer` ou ponto-a-ponto.
3
Nesta abordagem, todos os recursos trocados dados em seus
diIerentesIormatossão chamados de conhecimento`
vitimas ou para a identiIicação de especialistas, que
estejamnasproximidades,equepossamauxiliar.
x Troca de opiniões entre usuarios - Por exemplo,
pessoas que Ireqüentam determinados lugares podem
expressarsuasopiniões(dizersegostou,doquegostou
ou se não gostou) e essa inIormação podera ser
compartilhada entre outros individuos que estiverem
nessemesmolugar

Existem outros cenarios colaborativos para a utilização de uma
redep2pmovel.OMEKseraaplicadono cenario de healthcare`
para tratamento intensivo e de longa duração (como o câncer).
Este é um projeto realizado através de uma parceria com a
MicrosoIt Research, INCA, Universidade do Chile e CICESE. A
idéia é que, através do uso dos celulares e de uma maneira
proativa, os atores do cenario de healthcare` possam colaborar,
trocando conhecimentos sobre a doença, inIormações gerais,
noticiaseelementosdeentretenimentoquesejamdeinteresseem
comum,comomostradonaFigura1.
Comousuarios,vislumbramos:
x Hospitalizados Aqueles que estão em tratamento,
muitas vezes imobilizados em leitos ou participando de
tratamento em unidades intensivas. Durante o
tratamento existe a ida constante as unidades, espera e
tratamentosprolongados.Elespodemserdivididosem:
o Adultos como qualquer usuario, o unico
requisitoéquesaibamler e escrever,além de
possuiremumaparelhocomBluetooth.
o Crianças Apesar do MEK trabalhar com
qualquer tipo de midia, como som, video e
Iigura, é necessario que a criança ja seja
alIabetizada para que possa categorizar os
conhecimentos. Por trocar qualquer elemento
de inIormação, as crianças podem trocar
conteudo de entretenimento e, desta maneira,
tornar o tratamento menos doloroso`.
o Idosos A Iacil interIace` do MEK permite
que idosos, desde que saibam ler e não
tenham problemas de visão, consigam operar
oambiente.
x PessoasEnvolvidas
o Médicos, EnIermeiros e ProIissionais de
Saude tais usuarios podem esclarecer
duvidassobreadoença.Suasopiniõessobrea
doença possuem maior conIiabilidade do que
adosdemais.
o Recuperados, mas em monitoramento
pessoas que ja passaram pela doença podem
incentivar, esclarecer e apoiar os que estão
passandopelotratamento.
o Amigos e Parentes podem tanto possuir
duvidasquantoexperiênciasaseremtrocadas.

Para a realização das trocas de conhecimento
3
de maneira
oportunistica, utilizamos o cruzamento de inIormações
contextualizadas sobre o perIil do usuario e dos conhecimentos
cadastrados de demais usuarios ao redor. Tais inIormações
contextuaissão:
x Localidade Raio de alcance ou proximidade. Local
ondeocorreuacolaboração.
x Tempo Instante da colaboração ou idade` do
conhecimento
x Areas de interesse do usuario e Areas/assuntos do
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 146 -
conhecimento
x Tipoougrupoqueousuariopertence

Figura1-CenáriodeUtilizaçãodoMEK

Neste cenario, a idéia é que as pessoas de cada grupo possam
trocar duvidas, inIormações sobre a doença ou qualquer tipo de
inIormação entre as demais pessoas que participam do seu grupo
ou entrepessoasdeoutrosgrupos,Iormando uma granderedede
conhecimento. A descrição detalhada desta abordagem encontra-
senaproximaseção(3).
3. MEK
1
±DESCRIÇÃODA
ARQUITETURA
A plataIorma escolhida para desenvolver o MEK Ioi o JME|2|,
devido sua grande portabilidade e por estar presente na maioria
dosdispositivosmoveis.ApesardeoIocoatualserautilizaçãode
celulares, ja que é este o dispositivo movel mais utilizado
atualmente,oaplicativoIoiprojetadoparasersuportadoportodos
os dispositivos que utilizem JME. A seguir sera explicado o
IuncionamentodoMEK.
O MEK possui quatro modulos principais, como mostrado na
Figura2:
x Visão - Modulo responsavel pela interIace, inserção e
visualizaçãodosdados.
x Controlador Geral - Modulo responsavel por todas as
operaçõeslogicasecomandosdadospelousuario.
x Controlador de Requisições - Modulo responsavel
pelospedidosenviadosporoutrossistemasMEK.
x Centro de Conhecimento - Modulo responsavel pelo
armazenamento de todos os conhecimentos e as
associações destes conhecimentos as suas respectiva
categorias.

4. FUNCIONALIDADES
As Iuncionalidades podem ser acionadas pelo usuario a partir da
tela inicial (Figura 3) ou por rotinas internas. As principais
Iuncionalidadessãodescritasaseguir.

4.1 CriaçãodoPerfil
Apos o aplicativo ser instalado no dispositivo, o usuario devera
cadastrarumperIil.EsteperIil iraconteralgunsdadosdousuario
como nome, ocupação e ainda as areas de seu interesse, como
mostrado na Figura 4 e na Figura 5. Os interesses são
representados por conceitos em uma taxonomia. Uma area de
interesse podera abranger diversas subareas. Exemplo: ao utilizar
a taxonomia de areas de conhecimento do CNPq|4|, se o usuario
escolher a opção Ciências da Matematica e da Natureza como
uma area de seu interesse, ele podera receber conhecimentos
classiIicados nesta area especiIica ou de qualquer subarea, como
Matematica,GeograIiaeOceanograIia.

Conhecimento sobrea doença
Informação sobre interesses em comum,
Notícias, Entretenimento
Crianças Hospitalizadas
MEK
Idosos Hospitalizados
MEK
Adultos Hospitalizados
MEK
Pessoas Envolvidas
Figura2.ArquiteturadoMEK.
Figura3.TelaInicial.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 147 -

4.2 CadastramentodeConhecimentos
Aetapaseguinteéocadastramentodeconhecimentos(Figura 6e
Figura 7), ou seja, dados que o usuario detém e considera
relevante para distribuir a outros usuarios. O conhecimento é
qualquer recurso que possa ser disseminado, podendo ser um
documento (texto ou em qualquer Iormato), imagem, video, som
oulink.OsassuntosquedescrevemoconhecimentosãodeIinidos
pela taxonomia de interesses. Desta maneira, o usuario devera
classiIicar cada documento utilizando uma ou mais areas de
interesse.
4.3 ConexãoeTransmissão
Enquantoativa,aaplicaçãoprocurarapor outros dispositivosque
possuam outras instâncias ativas do MEK. Essa procura é
realizada mediante a tecnologia do Bluetooth, por sua utilização
ser mais comum nos aparelhos celulares. Como não ha um
servidor central,armazenando diversosconhecimentos, atrocade
inIormações é realizada mediante uma rede peer-to-peer. Deste
modo, cada dispositivo podera ter Iunções de servidor
(Iornecendo conhecimentos, se este existir) e de cliente
(adquirindo conhecimento). A troca das inIormações entre os
celularestambémérealizadautilizandooBluetooth,comomostra
aFigura8.

Como cliente, o MEK procura outros dispositivos executando o
aplicativo. Caso encontre, conecta-se e encaminha o conjunto de
interesses do usuario. O servidor veriIica se possui
conhecimentos que sejam classiIicados nas mesmas areas de
interesse do clienteouareasdo mesmogrupo(ouseja, subareas).
Caso haja, o servidor sinaliza o que possui e o MEK cliente ira
solicitar o Iornecimento deste conhecimento para o MEK
Figura4.Cadastrodeperfil.
Figura5.Perfilcadastrado.
Figura6.Cadastrodeconhecimento.
Figura7.Conhecimentocadastrado.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 148 -
servidor, como ilustrado na Figura 9. Existe uma veriIicação por
parte do cliente para não pedir conhecimentos que ja possui. Por
sua vez, o conhecimento adquirido pelo cliente agora Iica
disponivelparatroca.
Outro Iator que contribui para que essa troca de conhecimento
ocorra é a utilização do padrão XML (eXtensible Markup
Language)|3|. O MEK Iaz uso do XML para troca de perIis e
troca de conhecimentos. Exemplo: para a troca de arquivos, o
MEK envia um arquivo XML com os detalhes do arquivo e ao
receber uma conIirmação XML, o arquivo é enviado pela
conexão.

4.4 Ediçãodeconhecimento
Os conhecimentos podem ser inseridos, alterados e removidos. E
importante ressaltar que o conhecimento é removido de toda a
base de dados do MEK, dessa Iorma o conhecimento não sera
mais compartilhado com outros usuarios. Esta Iuncionalidade
pode ser util para conhecimentos que tenham prazos de validade,
como inIormações de Iestas, ou conhecimentos que o usuario
julgueerrado.
4.5 Busca
O usuario pode buscar pelos conhecimentos arquivados em seu
dispositivo. A busca é Ieita por palavras-chave que coincidem
comotitulooutextodescritivodeumconhecimento(Figura10e
Figura11).

Figura8.Comoocorreaconexão.
Figura9.TransmissãodeConhecimento.
Figura10.Teladebusca.
Figura11.ResultadodaBusca.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 149 -

5. EXEMPLODEUTILIZAÇÃO
Como demonstrado no video enviado em anexo e também
disponibilizado em
http://www.cos.uIrj.br/~jonice/sbsc2011/MEK.html (observação:
clique em CC para aparecer a legenda no video), ao iniciar o
MEK pela primeira vez, sera necessario a criação de um perIil.
Este perIil ira conter dados do usuario e suas areas de interesse,
que serão utilizadas para a troca de conhecimentos. Logo apos a
criaçãodoperIil,deveraserescolhidoumdiretorioqueiraconter
osarquivosutilizadospeloMEK.
Depois de concluida esta etapa, o usuario podera cadastrar
conhecimentos que ele possui. Para isso ele devera escolher a
opção Cadastro Know na tela inicial do MEK. Nesta etapa
deverãoser inseridosalgunsdadosbasicosdoconhecimento e,se
necessario,umarquivocorrespondente.
A partir deste ponto o MEK esta pronto para ser um receptor de
conhecimento e um possivel emissor. A aplicação procurara de
Iorma pro-ativa por outros aparelhos que possuam o MEK, caso
seja encontrado, uma busca nos conhecimentos deste outro
aparelho sera realizada procurando por interesses relevantes ao
usuario.
Casosejaencontradoalgumconhecimentointeressanteaousuario
ira ocorrer a transIerência do conhecimento, colaborando para o
aumento de inIormações por parte do usuario. O conhecimento
transIeridoIicara contido nabasede dadosdaaplicação epodera
servisualizado.
6. AVALIAÇÃO
No processo de avaliação Ioram usados 3 celulares da marca
Nokia|1|dosmodelos:2celularesC6-00,1celularC3-00.Além
dos celulares, Ioram utilizados 4 computadores (Intel® Core 2
Duo E-8400, 4GB DDR2, 32 bit). Vale ressaltar que todos os
modelos dos aparelhos permitiam executar aplicação da
plataIormaJAVA.
Nossas avaliações tiveram como objetivo examinar: i)InterIace e
Navegaçãoeii)ConIiabilidadenatransmissão.
Para a avaliação de interIace e navegação, Ioi pedido que uma
pequena amostra - composta por 4 pessoas - realizasse todas as
Iuncionalidades (descritas na seção 4). Para esta avaliação Ioram
utilizados os 4 computadores (Intel® Core 2 Duo E-8400, 4GB
DDR2, 32 bit). Apos a utilização do ambiente, os membros da
amostra eram questionados sobre a interIace e mecanismos de
navegação. Durante esta Iase, Ioram coletadas novas idéias e
sugestões de Iuncionalidades. Todos os integrantes da amostra se
mostraram satisIeitos (75°) ou muitos satisIeitos (25°). A
amostra era composta por (2) alunos de mestrado, um de
graduação e um doutor em computação. Todos os alunos (3) ja
cursaramdisciplinasdeIHCeCSCW.Odoutoremquestãoéum
especialistadaareadeCSCW.
A avaliação da conIiabilidade na transmissão Ioi dividida em 3
etapas,ondeIoipossivelveriIicar:
1. A troca entre dois celulares do mesmo modelo. Um
aparelhocontendoconhecimentoseooutrosem.
2. A troca entre dois celulares de modelo diIerentes. Um
aparelhocontendoconhecimentoseooutrosem.
3. Atroca entretrêscelulares. Apenasum deles contendo
conhecimento.
Para medirmos a conIiabilidade na transmissão, utilizaremos
comométricas:
x Arquivos relevantes (AR) Arquivos que devem ser
transmitidosaousuario,istoé,arquivosqueousuario
nãopossui-relacionadosaosseusinteresses.
x Quantidade de arquivos a serem transmitidos (QtAR)
Quantidadedearquivosrelevantes.
x Quantidadedearquivosrealmentetransmitidos(QtRT)
Quantidade de arquivos que 'chegaram¨ ao seu destino
comsucesso.
x Tempo de Latência (TL) Tempo de navegação e
operação do usuario adicionado ao tempo de
transmissãodoarquivo.
x Média do Tempo de Latência (MTL) TL/Numero de
pares de celulares (lembrando que é necessario um par
paraocorreratrocaentreconhecimentos).
x Quantidadedeconexões(QtCx).
Com tais métricas, desejava-se calcular a precisão, erro médio e
desviopadrão,alémdotempomédiodetransmissão.
AtaxonomiautilizadaIoiadoCNPq|4|.
AconIiguraçãodecadacelularIoi:
x Dois celulares (um C6 e um C3) tinham interesse em
Ciência da Computação, e o outro C6 em Ciências
Exatas e da Terra (superarea de Ciência da
Computação).
x Um celular C3 continha como interesses cadastrados
todasasareasdeCiênciadaComputação.
OstitulosdosconhecimentoscadastradosIoram:
x RecuperaçãodeInIormação.
x AlgoritmosGenéticos
x ProgramaçãoAvançada
NoprimeirotesteIoiutilizadoosdoismodelosC6-00:Umdeles
(A) possuindo 3 conhecimentos e o outro (B) sem nenhum
conhecimento.
Os conhecimentos instalados no celular (A) possuiam um anexo
que era uma Ioto no Iormato jpg. Foram realizadas 2 conexões
sendo elas: Uma conexão que Ioi iniciada pelo celular (A)
tentando se conectar no celular (B). Como não Ioi encontrado
nenhumconhecimentonãoIoirealizadanenhumatransIerência.A
segundaconexãorealizadainicioudocelular(B)pedindoconexão
ao celular (A). A partir do momento de conexão passaram
aproximadamente 50 segundos (TL) até que todos os
conhecimentosdoservidorIossemtransIeridosparaocliente.
Um segundo teste Ioi realizado entre um aparelho do modelo
Nokia C3-00 e Nokia C6-00. Estes dois aparelhos Ioram
submetidos as mesmas condições do primeiro teste. Três
conhecimentos Ioram inseridos em um celular para que Iossem
transIeridos para o outro. Assim como o primeiro teste Ioram
abertas2conexões.Foramdecorridosaproximadamente1minuto
(TL) até que todos os conhecimentos Iossem passados para o
segundocelular.
Um terceiro teste Ioi realizado utilizando 3 celulares, dois deles
do modelo C6-00 e o outro era o modelo C3-00. Apenas o
aparelho de modelo Nokia C3-00 possuia os conhecimentos que
interessavam aos outros aparelhos. Foram decorridos
aproximadamente2 minutose15segundos (TL)atéquetodosos
celularespossuissem os mesmosconhecimentos.Foramabertas6
conexõespararealizartodooprocesso.
Durante os testes obtivemos 100° de transIerência dos
conhecimentos (QtRT/QtAR), porém Ioram abertas mais
conexões(QtCx)queonecessarioparaexecutaratransIerênciano
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 150 -
cenarioideal.AMTLIoiproximaentreoscasos:50s(IaseI),60s
(Iase II) e 45s (Iase III). Como tivemos 100° de transmissão,
nestaavaliaçãonãoconseguimoscalcularaprecisão,erromédioe
desviopadrão.
7. TRABALHOSFUTUROS
Como trabalhos Iuturos almejamos intensiIicar as avaliações.
Inicialmente realizando testes de stress`, com transmissões de
maiornumero dearquivosentre celulares,bemcomoarquivosde
tamanhosdiIerenciados.Posteriormente,oMEKseraavaliadono
cenario real (descrito na seção 2). Uma outra avaliação sera
levando em consideração a mobilidade, ou seja, como sera a
transmissãoquandoosaparelhosestãoemmovimento.
Visando aumentar a colaboração entre os usuarios da aplicação e
permitir que outros meios de comunicação sejam compartilhados
entre as pessoas, visamos o desenvolvimento de um chat. Este
mecanismo ira realizar uma pesquisa nos dispositivos proximos
que contenha o MEK disponibilizando uma area para que os
usuarios interajam entresisobaIorma detrocade mensagensde
texto via Bluetooth. Com eIeito de preservar a privacidade de
algumas pessoas, iremos permitir que o usuario escolha uma
opçãodedisponivelounãoparaserencontradoparaochat.
Uma segunda melhoria que visa aumentar a ergonomia entre o
usuario e a aplicação sera a de tornar o aplicativo conIiavel
através do uso de um certiIicado. Isso permitira que durante o
processodeinstalaçãodaaplicaçãoousuariopossapermitirquea
aplicaçãoexecuteacessosaosarquivosepastasdodispositivo.
Uma terceira melhoria é a implementação de uma aplicação
desktop para dar maior mobilidade ao usuario. Com uma
aplicação desktop o usuario podera organizar e gerenciar os seus
conhecimentos a partir de seu computador pessoal e depois
transIeri-los para o seu dispositivo movel. Como método de
transmissão, para seguir o padrão da aplicação, sera usado o
Bluetooth.
Outra melhoria, visando aumentar o alcance da conectividade
entre os dispositivos, é a realização de um estudo para buscar
melhorias na tecnologia utilizada ou novas tecnologias que
permitemrealizartalaumento.
Pontos Iuturos a serem tratados são a conIibialidade da Ionte e
mecanismosdedenuncia.
8. CONCLUSÃO
Neste trabalho apresentamos o MEK, uma proposta de
disseminação oportunistica de dados. O usuario, durante o seu
percurso, pode capturar dados que possivelmente são do seu
interesse,bemcomotransmiti-losutilizandoumdispositivomovel
(por exemplo, celular). Para isto, o MEK utiliza inIormações de
contexto.
AtravésdestetrabalhopodemosconcluirqueoMEKsetornauma
boa Ierramenta no ambiente de disseminação pro-ativa do
conhecimento. Esta abordagem esta em evolução. Podemos
mencionar como trabalhos Iuturos o desenvolvimento de novas
Iuncionalidades e avaliação em um cenario real. O cenario
escolhido é o healthcare`. Pacientes além de seus Iamiliares e
amigos que lidam com uma doença grave que envolve
tratamentos longos (por exemplo câncer, Alzheimer ou autismo),
Ireqüentemente se deparam com Ialta ou insuIiciência de
inIormação especializada para responder suas duvidas. O MEK
seraanalisadosobestascircunstâncias.
9. AGRADECIMENTOS
A MicrosoIt pelo Iinanciamento ao projeto 'Temporal Social
Networks and Knowledge Dissemination Ior Healthcares¨
(LACCIR, R1210LAC002), a FAPERJ pelo projeto "SOMA:
Analise de Redes Sociais Complexas" (E-26/110.460/2010), ao
CNPqeCAPESporbolsasdeestudos.
10. REFERENCIAS
|1| Nokia, 'Nokia¨, http://www.nokia.com/, Junho 2011
|2| Sun, 'The Java ME PlatIorm - the Most Ubiquitous
Application PlatIorm Ior Mobile Devices¨,
http://java.sun.com/javame/,Junho2011
|3| W3C, 'XML¨, http://www.w3.org/XML/,Junho2011
|4| Tabelas de Areas de Conhecimento -
http://www.capes.gov.br/avaliacao/tabela-de-areas-de-
conhecimento,Junho2011
|5| GroupWareSome Issuesand experience. C.A.Ellis,S.J.
GibbsandG.L.Rein.
|6| 'Collective Knowledge Recall: BeneIits and Drawbacks¨ -
Carminatti,N.,Borges,M.R.S.,Gomes,J.O.:
|7| L. Pierre, Cyberculture - University oI Minnesota Press,
October2001.
|8| S.Levy,MakingtheultimateMap,inNewsweek,pp.56-58,
June,2004.
|9| Zhang,J.,Scardamalia,M.,Reeve,R.,&Messina,R.(2006).
Collective cognitive responsibility in knowledge building
communities. American Educational Research Association
AnnualMeeting,2006,SanFrancisco,CA.
|10| JialuFan,YuanDu,WeiGao,JimingChen,YouxianSun-
Geography-AwareActiveDataDisseminationinMobile
SocialNetworks
http://www.cse.psu.edu/~wxg139/publications/mass10.pdI
|11| JonathanKnudsen-'What's New in the J2ME Wireless
Toolkit 2.0¨, Janeiro 2003 -
http://www.oracle.com/technetwork/systems/wtk20-
156271.html
|12| MoushumiSharmin,ShameemAhmedandSheikhI.
Ahamed-'MARKS (Middleware Adaptability Ior Resource
Discovery,KnowledgeUsabilityandSelI-healing)Ior
MobileDevices oI Pervasive Computing Environments¨
|13| GouthamKarumanchi,SrinivasanMuralidharan,Ravi
Prakash-'InIormation Dissemination in Partitionable Mobile
Ad Hoc Networks¨
|14| S.KrishnaMohanRao,DrA.VenugopalReddy-'Data
DisseminationinMobileComputing Environment¨
|15| Thomas Schwotzer, Kurt Geihs - 'Shark a System Ior
Management, Synchronization and Exchange oI Knowledge
in Mobile User Groups¨, 2002.

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 151 -
Co-designing Collaborative Museums using Ethnography
and Co-creation Workshops
Heloisa Moura
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de São Vicente, 225,
Gávea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
moura@id.iit.edu

Wallace Ugulino
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de São Vicente, 225,
Gávea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
wugulino@inf.puc-rio.br
Débora Cardador
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de São Vicente, 225,
Gávea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
dcosta@inf.puc-rio.br

Marcos Barbato
Be! Interactive
Av Ataulfo de Paiva, nº 341, room 407
Leblon, Rio de Janeiro, RJ, Brazil
+55 21 2529-2101
barbato@be-interactive.com.br
Katia Vega
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de São Vicente, 225,
Gávea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
kvega@inf.puc-rio.br

Hugo Fuks
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de São Vicente, 225,
Gávea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
hugo@inf.puc-rio.br

ABSTRACT
The paper presents a human centered approach to co-design of
groupware and socialware for collaborative museums, using
ethnography, co-creation workshops and Blank Model
Prototyping. It discusses the concepts and processes of human
centered design, participatory design, ethnography, concept
generation and iterative prototyping - pointing their value to the
support of group systems design, in comparison to other
approaches. It also gives an overview of the state of the art of
museums around the world. Next, it describes a case study
conducted in a Brazilian Planetarium and Science Museum,
highlighting details of the context, process and results. The intent
was to implement a system for collaborative museums that
supports an integrated user experience before, during and after the
visit – through groupware, socialware and cross reality
technologies – for continuous engagement, co-construction of
knowledge, intergenerational interaction, multimodality, sharing
of ideas, and emergence of mentorship networks.
Categories and Subject Descriptors
J.5 [Computer Applications]: Architecture
General Terms
Documentation, Design, Experimentation, Human Factors
Keywords
Ethnography, co-creation, blank model prototyping
1. INTRODUCTION
A few centuries after the emergence of the first modern
museums, they are still considered essential to the public sphere.
Museums, by definition, are institutions dedicated to the
acquisition, preservation, study and interpretation of the tangible
and intangible inheritance of humanity and its environment,
focused on the dissemination of information, exhibition,
entertainment, and, more recently, informal education. In the past,
museums used to display cold and static collections inside glass
boxes, representing different historical moments.
Today, in contrast, the public has a growing thirst for
immersive experiences, drama, adventure, fun and engagement.
And in response, current museums need to be transformed into
something capable of capturing attention and imagination, and
stimulating collaboration amongst visitors inside and outside their
spaces. In this context, groupware, or group support systems, and
socialware, or systems that support social interaction, together
with cross reality tools and technologies, amongst others, can play
a growing role in transforming the static, ‘don’t touch the exhibit’
museums into lively and sensorial collaborative spaces.
Designing truly engaging museum exhibits – those that are
culturally relevant and where visitors get a real feeling of
immersion and excitement, and even interact socially with
strangers – however, is a challenge. Human-centered design offers
a path towards this goal, starting with the contextual
understanding of the people that actually visit, work and interact
with the particular museum at hand. Through a process of co-
creation, it moves from ethnographic research to design criteria,
and to relevant concepts that can respond to the identified
problems and opportunities. Next, it prototypes these ideas
iteratively, while interacting with the very people that will use the
solutions, in order to continuously learn from them throughout the
development phase. As a consequence, meaningful solutions can
emerge.
This paper starts with the discussion of the concepts and processes
of human centered and participatory design, and explores some of
the methods that can support co-creation of cross reality
groupware and socialware, pointing their value, strengths and
limitations. Next, it examines the state of the art of museums that
are focused on collaboration. Finally, to bring the discussion into
context, it presents the case study of a Brazilian Planetarium and
Science Museum, exemplifying the use of selected methods to co-
create ideas that can transform the current space, exhibits,
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 152 -
artifacts, interfaces and services into something collaborative,
exciting and stimulating, and integrate the user experience before,
during and after the visit. Such as described in the words of a ten
years old boy who joined one of the workshops, “I want to come
here [at the Planetarium] and feel that I am the astronaut,
travelling through space, exploring the planets, stars and black
holes”.
2. HUMAN CENTERED AND
PARTICIPATORY DESIGN
METHODOLOGIES AND METHODS
Design methodologies refer to systems of methods, tools,
principles and processes of the design discipline, as well as their
application. Dorst [1] proposes that design methodology “includes
the development of formal models of design activities, from
which methods, techniques and computer tools can be derived”
(p.8), and described in theoretical, empirical and practical terms.
The human-centered design methodology, or HCD, places
human needs, skills, creativity and potentialities at the center of
the activities of technological systems [2, 3]. According to Gasson
[4], such tradition arose as a reaction to the perceptions of
traditional approaches towards technology design – which see
people simply as users of technology, focusing only on the
specific interaction, rather than questioning what, how, when,
where and why technology may be of service in supporting human
activities. And which, by focusing only on use and usability of
technology, excludes both the context of use and the richness of
human beings and their lives. As Bjorn-Andersen [5] affirms,
human beings are “much more than eye and finger movements”
(p. 387).
The user-centered design term, or UCD, in contrast, as
defined by the software development and design communities,
refers to an approach whose principles include early and
continuous focus on users throughout an iterative design process
[6]. John Karat [7] suggests that it is a process that sets users or
user information as a generative source of design ideas or as the
criteria by which a design is evaluated. And according to
Vredenburg et al. [8] user-centered design can be described as an
overall development process where users are taken into account,
including their active involvement for a clear understanding of
task requirements, which combines a multidisciplinary approach,
and iterative design and evaluation.
Melican [9] affirms that although the term ‘user centered’ is
widely used, it is far from an ideal descriptor. And Bruce
Hanington [10] highlights the importance of using the term
‘human’, instead of ‘user’, since it better ties design to human
needs and concerns. Another criticism to UCD is that it fails to
promote human interests because of a goal-directed focus on the
closure of predetermined technical problems [4, 11]. Bødker and
Nielsen [12] agree that relational aspects in UCD are largely
overlooked in the literature, and use this criticism to facilitate a
discussion on how discourse, activities and materials can give
shape to user involvement in design activities. The referred
authors, at Vision Lab, continuously draw experiments for
devising innovations and creative solutions with users, using the
workshop format. And by doing that, they combine user-centered
design with the participatory approach.
The Participatory Design research methodology, also known
as PD, corresponds to a set of theories, practices, and studies
related to end users as full participants in activities, leading to
software and hardware computer products and computer-based
activities [13, 14]. The field is wide and diverse, drawing
knowledge from numerous traditions, without leading to a single
theory or paradigm of study or approach to practice [15].
According to Nardi and Engestrom [16], PD is a way to
understand knowledge by doing; focused on the tacit and often
invisible ways that people perform everyday activities and how
these activities might be shaped productively. Crabtree [17]
highlights that in treating users as the experts within their own
context of activity, PD is characteristically concerned with
creating situations and environments in which users and designers
can formulate appropriate designs together. However, missing in
this approach is an in-depth analysis of current work practices – a
problem that has led to the adoption of the ethnographic method
and its techniques.
Regarding the processes, methods and techniques used by
each of these different design approaches [18], there is no
agreement on how to conduct studies for gaining understanding of
human activities and needs, or on how to analyze and synthesize
data for guiding the creative process of design, or how to generate
human-centered solutions based on such research material.
Ethnography, for instance, is becoming an increasingly
widespread tool for conducting user research from the point of
view of either HCD, UCD or PD traditions. Originally developed
in the field of Anthropology, it can be seen as a set of methods for
data collection focused on understanding human beings in their
natural settings or in the context of everyday activities [19, 20].
Melican [9], however, highlights that ethnographic methods
may also be of limited value in confronting the transformational
implications of introducing new technologies – due to their
concern with the analysis and description of the current situation
and practice – and in supporting the process of envisioning
entirely new systems.
Suchman [21], nevertheless, points out that imagining future
solutions requires that current solutions can be articulated. On that
regard, Zeisel [22] proposes a way to resolve this seeming
paradox by locating and studying those settings, users and
problems that are representative of future ones, and generalizing
from them to the probable contexts and users. As Dourish [23]
notes on the value of ethnography: it provides reflection on,
insight into, and a broad understanding of the organization of
social settings, bringing analytic and inspirational aspects to the
design process.
For the purposes of the present research, a human-centered
approach to design is taken, understood as a process of design
informed by human needs and business objectives, using
participatory design methods: to draw the continuous involvement
of relevant participants from research to development and
implementation; and to co-create solutions that are human-driven
and contextually meaningful, and that, at the same time, can add
value to real people and be sustainable – socially, economically,
environmentally and institutionally [24].

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 153 -
3. COLLABORATIVE MUSEUMS AND
TECHNOLOGIES
Museums, as educational and recreational organizations,
have adopted a visitor centered approach, no longer focusing on
collections and information, but on enhancing people’s museum
experience and understanding of exhibitions. Supported by
increasingly sophisticated technologies, they offer visitors a range
of experiences, including: visual and sensory interactions,
learning, recreation, sociability, celebratory and enchanting
encounters, or a distinctive combination of exposures [25].
It is noticeable, on the one hand, that substantial effort has
been applied to designing and developing new museum exhibits
and systems in order to facilitate engagement and collaboration,
and to enhance learning opportunities of groups of visitors, since
they normally attend in social clusters – such as family, friend, or
school tour groups [26]. On the other hand, research on the
dynamics of collaboration [27, 28] and on technologies that
support groups and social interaction have helped to lighten this
challenge.
On regards to collaborative museum experiences, they enable
visitors to feel like a curious group of explorers, who, by
interacting socially and collaborating with others, discovers
wonders through the exhibits. That has been the case with several
science museums, where interacting with other visitors is often
included.
Dirk vom Lehn, Christian Heath and Jon Hindmarsh [29]
highlight what they consider to be the three most relevant issues
that should be acknowledged throughout the design process when
developing collaborative museums exhibits: 1) social interaction
is fundamental to visitors’ experience of exhibits and exhibitions;
2) visitors need opportunities for sustained interaction both in
direct relation to exhibits and around them; and 3) visitors also
need spaces for single participation within exhibits, as well as
resources to help them individually examine and make sense of
exhibits that are designed for groups of people or multi-parties.
On that regard, the authors suggest to offer resources for
participants so that they are able to creatively shape and configure
the experiences of others. They also emphasize the need to create
exhibits that accommodate both group and individual needs and
modes of interaction.
New tools and technologies have played an important role in
creating the conditions for collaboration to occur in museums, and
enabling the development of exhibits and systems that facilitate
interactivity. Examples are groupware and socialware – or
systems that support groups [30, 31] and social interaction [32,
33]. Because people normally examine and make sense of exhibits
through social interaction, socialware [34] have been used to
support during-the-visit intragroup communication and allow
clusters of visitors to share experiences and information.
Together with systems that promote an interplay of physical,
Augmented [35, 36] and virtual reality [37] technologies, known
as cross reality or mixed presence tools and technologies [38, 39],
these have shown interesting results in museums.
Mixed Presence Groupware, MPG, or software that connects
collocated and distributed collaborators, and their disparate
displays, through a common shared virtual space [40, 41], is
another similar example that has been explored in order to allow
multiple people to work together over a shared exhibit space. And
games, simulations, and mobile devices are a few of the other
technologies that have been used to engage visitors in museum
exhibitions and encourage interaction and collaboration.
Examples of collaborative exhibits using these technologies
include: the Boston Museum of Sciences game, called Mystery at
the Museum [42], where students and parents are brought in as a
team of experts to try to solve a fictitious crime at the museum
space. This groupware [40] allows players to gather clues as they
visit the museum and collaborate by both communicating and
exchanging clues with teammates using location aware pocket
computers. Another system focused on collaboration amongst
children and parents is the Lunar Surface Navigation System [43].
This MPG [40, 41] connects co-located collaborators with a
combination of tabletop Augmented Reality and virtual
environment. Children play the role of the astronauts and parents
act as the mission commanders who give instructions on
exploration activities based on real lunar exploration episodes
reported by NASA.
4. BRAZILIAN PLANETARIUM AND
SCIENCE MUSEUM CASE STUDY
In order to bring the discussion into context and exemplify the use
of a human-centered participatory approach for the design of
collaborative museums, supported by cross reality group
technologies, the case of a Brazilian Planetarium and Science
Museum is presented. Amongst the Brazilian museums, the
Planetarium and Science Museum at hand is a public institution
situated at a cosmopolitan city. Its vision is to act as a culture and
entertainment institution, with the mission to divulge astronomy –
which is absent in the Brazilian K12 curricula – as well as to
promote other related science fields, through the use of avant-
garde technologies and an innovative environment. And amongst
its challenges are included: to become financially independent
from the government – who currently covers 60% of its
expenditures; to renew the space and exhibits in order to support
discovery and interactivity for a diverse public in terms of age,
education, socioeconomic status and interests; and to maximize its
physical capacity.
In order to collaborate with the Brazilian Planetarium and Science
Museum in this effort, the Groupware@Les research group of
Computer Science Department of the Pontifical Catholic
University of Rio de Janeiro, proposed a project to co-design –
together with children, teenagers, teachers, designers, computer
scientists, and astronomers, amongst others – and transform the
museum spaces, exhibits, artifacts, interfaces and services, so that
visitors are able to use cross reality systems and enabling group
and socialware to: explore collaborative exhibits; interact
multimodally [44]; immerse in collective play; co-construct
knowledge and share ideas about astronomy and other related
sciences; and participate in mentorship networks together with
other visitors and museum staff. The present article focuses on
reporting this participatory process.
4.1 Research Framing
In the present research, ethnographic, co-creation and prototyping
methods were used to identify guiding criteria for the

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference’10, Month 1–2, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010…$10.00.

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 154 -
development of groupware for collaborative museums. The
macro-process is shown on Figure 1, using Business Process
Modeling Notation (BPMN) [45].

Figure 1. Research macro-process in BPM notation.
4.2 Ethnographic Study
The ethnographic research [20] started with the study of the
Brazilian Planetarium and Science Museum staff, including
astronomers, market and administration personnel, architects,
visitor guides and support workers, amongst others. And it was
followed by the study of different types of visitor profiles, helping
to identify: patterns of behaviors, relevant narratives, and
differences in point of view, interests, motivations and needs.
Included in its research protocol were in-depth contextual
interviews and shadowing observations, documented through
video, photographs and field notes. Figure 3 (next page)
illustrates this process.
From the interviews and observations, relevant narratives and
patterns of behaviors were highlighted, leading to recurrent
themes, findings or insights, and design criteria through a
structured bottom-up process of analysis and synthesis [9], based
on Grounded Theory [46], as shown on Figure 2. Some of the
emergent design criteria, for instance, were to: activate
imagination before visit; provide tour options according to profile;
and make the museum experience tangible.
Narrative 15: “Once you come to the dome session, you never forget it [...]
You feel immersed in the sky projection. It is impressive [...]”
Narrative 19: “What I like most is the environment. One dives into the
experience [...] It’s an immersive space.”
Narrative 20: “If someone’s bedroom was shaped like a dome and had a
super lamp that could project the stars, then he wouldn’t need to come to the
museum. Otherwise, this place is uncomparable.”
Narrative 22: “The dome projection can’t be compared with traditional movie
projection”
Finding 3: Immersive experiences stir emotions (which must be addressed).
Figure 2. Selected narratives from the ethnographic study.
4.3 Co-creation workshop
The co-creation workshop [13, 14] gathered a group of
participants, whose profiles were selected based on significant
behavioral and demographic polarities, pointed by the findings of
the ethnographic study – such as kid vs. adult, museum personnel
vs. visitor, first time vs. recurrent visitor, individual vs. group, in-
depth vs. little knowledge about astronomy, early vs. late
technology adopter, and so forth. A few details of the participants
profile are shown on Table 1.
Table 1. Table captions should be placed above the table
Pseudonym Age Occupation Scholarity
Mario 47 Retired K12 (9
th
year)
Ana Carla 34
Architect and
urbanist MSc Student
Brian 34 Astronomer
Undergraduation
(complete)
Fabio 40
Internet
Media
Director
Undergraduation
(incomplete)
Johnny 19 Student
High School
(complete)
A
v
e
r
a
g
e

=

1
6

y
.
o
.


v
a
r
i
a
t
i
o
n

a
m
p
l
i
t
u
d
e

=

2
2

Thierry 9 Student K12 (4
th
year)
Breno 31 Student PhD Student
Thaiala 14 Student
High School (10
th

year)
Leonard 10 Student K12 (5
th
year)
Lucia 14 Student K12 (9
th
year)
Alicia 49 Pedagogue
Post-graduation
(MBA)
Hector 52 Professor PhD degree
Vinny 28
High School
Teacher
Undergraduation
(complete)
Boratto 41
Marketing
Director
Undergraduation
(complete)
Minimum age: 9 years old. Maximum age: 52 years old. Variation amplitude: 43

Such variety of profiles was a purposeful choice, since it is
considered a condition for the co-creation of groupware solutions
that can appeal to various visitor and worker profiles, and that can
fit the contextual dynamics of the museum.
The activity started with the presentation of the workshop
schedule (process represented on Figure 1), and distribution of a
journal, where each participant was requested to write about daily
routine, entertainment history, extreme cultural experiences,
sources of information, past visits to the museum, and view of its
future.
After filling in the journals, the participants were organized in
pairs, where each one read and analyzed what the other one wrote,
and, then, presented the findings to the entire group. During the
presentation: the participants profiles were represented on poster
size graphs; their relevant narratives were documented on a white
board; and the emerging guiding criteria were synthesized to the
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 155 -
whole group. Next, these criteria were discussed with the
participants, leading to refinement and addition of new ones.
Based on the reviewed criteria, a brainstorming session was
initiated, where each sentence guided the ideation of innumerous
solutions by the participants. The ideas were written down on note
size papers by each one and handed to the moderator, who read
them aloud. In response, the other participants wrote down
complementary ideas or new concepts inspired by them. During
the co-design workshop, 14 participants generated 81 relevant
ideas in 20 minutes.
Some examples were: a museum-school portal, 2nd Life
Planetarium, online check-in, tour guide totem, iPad navigator,
Augmented Reality space mission, planet hunt collaborative
game, space wiki, visitor foot prints, and outside exhibits.
After the ideation session, the generated concepts were grouped
according to the guiding criteria. Figure 4 illustrates some of them
in cloud format, where the font size of each word or expression
represents the number of ideas that were created in relation to it.
As a result of the analysis of the ideas produced during the
workshop, a ranking of the most significant criteria, according to
the participants’ point of view, was produced. The top ones were:
‘Create an immersive experience’, with 26 ideas generated in
relation to it, and ‘Provide interactivity’, with 18 related ideas.
In addition, the concepts were classified according to subjacent
theme, illustrated as a cloud of themes on Figure 5. Included
amongst the ones considered most relevant to the participants
were: ‘Museum Itineraries’ – with 13 related ideas; ‘Dome
Session Activities’– with 10; and ‘Astronomy Games’ – with 9.
The theme ‘Collaborative Exhibits’ was spontaneously mentioned
by the participants in 6 ideas, and ‘Interactive Technologies’ was
mentioned in 7 ideas. Following the brainstorming, prototyping
sessions took place to develop the concepts further.

Figure 5. Recurrent themes based on idea classification
4.4 Prototyping session
Following the co-design workshop, selected participants were
invited for prototyping sessions, including architects, computer
scientists and designers, since the method used [45], known as
Blank Model Prototyping, requires the participation of potential
users, or design and technology professionals. Blank Model
Prototyping is a rapid role-playing technique that uses readily
available art and craft materials to construct rough physical
representations of a technological concept, according to a
predetermined scenario. The goal of the prototyping session was
to collect potential user impressions and detailed ideas about a
new technological solution, either hardware or software, for
creating a collaborative museum.

Figure 4. Guiding criteria on cloud based format, according to the number of related ideas gathered in the brainstorming

Figure 3. Process details of the ethnographic study
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 156 -
Previous to the session, the settings, team, recording equipment
and supplies were prepared according to a plan. Also the 81 ideas
and the criteria list of the co-design workshop were arranged in
the form of cards and poster, respectively. Figure 6 shows the
activities that were planned and then executed.

Figure 6. Activities of the prototyping session.
The prototyping session started with an explanation of the
schedule and presentation of the materials (Figure 7a).
Participants were asked to read the idea cards and the guiding
criteria poster in order to select one concept or get inspiration for
creating a new one (Figure 7b). After that, they were instructed to
design the prototype, in order to evolve the original concept and
rationale, converge on a solution, develop guidelines and propose
design specifications [47]. During one of the sessions, as shown
on Figure 7c, participants prototyped a trip to different planet
environments, which could be shared by different social networks
through pictures and short movies. They designed maps of the
exhibit rooms, and interfaces for interacting in the rooms, like
identification cards with QR codes for social network sharing, 3D
glasses for the simulation trip and touch screens for selecting the
planets (Figure 8). The participants then tested their prototype,
reflected upon the test result and re-designed the solution
accordingly. Finally, the session was concluded with a discussion
and presentation of the prototype, using the designed objects as a
support for dramatizing a scenario that presented the simulation
rooms, as shown on Figure 7d.
Some of the lessons learned were: a) it is not enough to include
computer scientists, designers and random users in the Blank
Prototyping sessions – a thoughtful selection must be made to
guarantee the constant presence of the point of view of extreme
users and museum personnel, for instance, so that the solution
will keep on track and meet the needs of the institution regarding,
for example infrastructure and maintenance, and interest to
visitors of different profiles; b) group composition within co-
creation workshops should be carefully selected based on
complementary profiles, so that each can have an equal voice; c)
workshop participants need prior time to be immersed in the
ethnography findings to make optimal use of the material; and d)
developing twin prototypes in the physical and virtual worlds lead
to different but complimentary findings about collaboration, such
as behavioral and motivational.

Figure 8. A multitouch device representation

5. CONCLUSION
The use of ethnography, co-creation workshops and prototyping –
taking a human centered and participatory approach to design –
has allowed the fast generation of numerous meaningful ideas and
prototypes to support mixed presence collaboration and social
interaction in the context of a Brazilian Planetarium and Science
Museum. Involving researchers, children, teenagers, teachers,
designers, architects, marketing specialists, computer scientists,
and astronomers, amongst others, and through an iterative process
of research, prototyping, testing and refinement, several
collaborative solutions for museum – such as the exhibit
simulating a trip to different planet environments that are shared
by different social networks – are currently being developed.
The ethnographic research with museum personnel and visitors
shed light regarding some of their behaviors, expectations,
motivations, aspirations and needs. This study led to the
identification of patterns and profile polarities that informed the
organization of the co-creation workshop, from which emerged
guiding design criteria and numerous concepts to the identified
opportunity space for collaboration and social interaction within
and outside the museum space. Through an iterative prototyping
and testing process, ideas have evolved into increasingly tangible
and detailed solutions.
The selected methods aided the challenge of involving people of
different profiles around the task of creating and making
something tangible together, focused on the collaborative human
experience, but without forgetting the business objectives of the
museum.


Figure 7. Activities made by participants during the prototyping session.
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 157 -
6. ACKNOWLEDGMENTS
Wallace Ugulino (grant 142916/2010-2), Katia Cánepa (grant
140859/2010-1), and Débora Cardador (grant 141520/2010-8), are
recipients of individual grants awarded by the National Research
Council (CNPq). Hugo Fuks is the recipient of individual grants
awarded by the CNPq and the Rio de Janeiro State Research
Council (FAPERJ) Project entitled ‘‘Cientista do Nosso Estado.”
And Heloisa Moura is the recipient of individual grant awarded by
FAPERJ.
7. REFERENCES
[1] Dorst, K. (1997) Describing Design: A Comparison of
Paradigms, Self-published Doctoral Dissertation, Delft
University of Technology, Delft, Holland.
[2] Gill, K. (1991) Summary of Human-Centered Systems
Research in Europe, Part 1, Systemist, the Journal of the UK
Systems Society, 13(1), pp.7-27.
[3] Scarbrough, H. & Corbett, J. (1991) Technology and
Organization: Power Meaning and Design, Routledge,
United Kingdom.
[4] Gasson, S. (2003) Human-Centered vs. User-Centered
Approaches to Information System Design, Journal of
Information Technology Theory and Application, JITTA,
5(2), pp. 29-46.
[5] Bjorn-Andersen, N. (1988) Are Human Factors Human? The
Computer Journal, 31(5), pp. 386-390.
[6] Preece, J. (1993) A Guide to Usability: Human factors in
computing. Addison Wesley, The Open University.
[7] Karat, J. (1996) User Centered Design: Quality or Quackery’
Interactions, 3(4), p.20, July-August.
[8] Vredenburg, K., Mao, J., Smith, P., Carey, T. (2002) A
Survey of User-Centered Design Practice, Proceedings of the
SIGCHI conference on Human factors in computing systems:
Changing our world, changing ourselves. Minneapolis,
Minnesota, USA. ACM Press, New York, NY, USA. pp.
471-478.
[9] Melican, J. (2000) Describing User-Centered Designing:
How Design Teams Apply User Research Data in Creative
Problem Solving, Doctoral Dissertation, Institute of Design-
Illinois Institute of Technology, Chicago.
[10] Hanington, B. (2003) Methods in the Making: A Perspective
on the State of Human Research in Design. Design Issues,
19(4), pp. 9-18.
[11] Dourish, P. and Button, G. (1998) On "Technomethodology":
Foundational Relationships between Ethnomethodology and
System Design. Human-Computer Interaction, 13(4), 395-
432.
[12] Bødker, M. and Nielsen, J. (2008) Vision labs: Seeing UCD
as a Relational Practice. In Proceedings of OZCHI,
December 5-8, Cairns, Australia.
[13] Muller, M. and Kuhn, S. (Eds.) (1993). Special issue on
participatory design. Communications of the ACM, 36(6),
June.
[14] Schuler, D. & Namioka, A. (Eds.) (1993). Participatory
design: Principles and practices. Hillsdale, NJ: Lawrence
Erlbaum Associates.
[15] Slater, J. (1998). Professional misinterpretation: What is
participatory design? In Proceedings of PDC 98. Seattle:
CPSR.
[16] Nardi, B. & Engestrom, Y. (1999) A Web on the Wind: The
Structure of Invisible Work, In: B. Nardi and Y. Engeström
(Guest Editors). Computer Supported Cooperative Work,
8(1-2), Special Issue.
[17] Crabtree, A. (1998) Ethnography in participatory design,
Proceedings of the 1998 Participatory Design Conference,
pp. 93-105, Seattle: Computer Professionals Social
Responsibility.
[18] Newman, W. & Lamming, M. (1995). Interactive Systems
Design. Harlow: Addison-Wesley.
[19] Blomberg, J.; Giacomi, J.; Mosher, A. & Swenton-Wall, P.
(1993). Ethnographic Field Methods and Their Relation to
Design. Participatory Design : Principles and Practices.
Edited by Douglas Schuler, Aki Namioka. Hillsdale, N.J.: L.
Erlbaum Associates. pp 123-155.
[20] Hammersley, M. & Atkinson, P. (1995) Ethnography:
Principles in Practice. London, Routledge.
[21] Suchman, L. (1987) Plans and Situated Actions: The
Problem of Human-Machine Communication, Cambridge:
Cambridge University Press.
[22] Zeisel, J. (1984) Inquiry by Design: Tools for Environment-
Behavior Research, p. 37, Cambridge University Press,
Cambridge, UK.
[23] Dourish, P. (2006): Implications for Design. In: Proceedings
of the ACM Conference on Human Factors in Computing
Systems, CHI 2006, April 22 – 28, Montreal, Quebec,
Canada, ACM Press, pp. 541-550.
[24] UNDESA UN Department of Economic and Social Affairs
(2001) Indicators of Sustainable Development: Guidelines
and Methodologies. United Nations, New York.
[25] Anderson, G. (Ed.) (2004). Reinventing the Museum:
Historical and Contemporary Perspectives on the Paradigm
Shift. Walnut Creek, CA, Altamira Press.
[26] Lyons, L. (2009). Designing Opportunistic User Interfaces to
Support a Collaborative Museum Exhibit. In Proceedings of
the 8th International Conference on Computer Supported
Collaborative Learning, Rhodes, Greece, June 8- 13, 2009,
(pp. 375-384).
[27] Dillenbourg, P. (1999) What do you mean by ‘Collaborative
Learning’? Collaborative Learning: Cognitive and
Computational Approaches. Oxford: Elsevier Science.
[28] Fuks, H., Raposo, A., Gerosa, M., Pimentel, M. & Lucena, C.
(2007) The 3C Collaboration Model. In: The Encyclopedia of
E-Collaboration, Ned Kock (Org.), pp. 637-644.
[29] Vom Lehn, D., Heath, C. and J. Hindmarsh, (2005). Re-
thinking Interactivity. Rethinking Technologies in Museums.
Limerick, Ireland.
[30] Coleman, D. & Shapiro, R. (1992). Defining Groupware.
Special Advertising Section to Network World, June 22,
1992.
[31] Stahl, G. (2005) Groups, group cognition & groupware.
Paper presented at the International Workshop on Groupware
CRIWG 2005, Recife, Brazil.
[32] Tomek, I.; Giles, R.; Zhang, H. & Di, L. (2007) Groupware
and Socialware: Overview and perspectives. In Proceedings
of the 13th ANZSYS Conference - Auckland, New Zealand,
2nd-5th December, 2007, pp.1-12.
[33] Tomek, I. & Giles, R. ( 2008) Collaboration in the age of
Augmented Reality. In 14th International Conference on
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 158 -
Concurrent Enterprising, K.-D. Thoben, K. S. Pawar, & R.
Gonçalves, eds., 23-25 June 2008, Lisbon, Portugal.
[34] Hattori, F.; Ohguro, T.; Yokoo, M.; Matsubara, S. & Yoshida
S. (1999) Socialware: Multiagent Systems for Supporting
Network Communities. Communications of the ACM, 42(3),
pp. 55-61.
[35] Cawood, S. & Fiala, M. (2008) Augmented Reality: A
Practical Guide. Raleigh: Pragmatic Bookshelf.
[36] Freedman, R. & Steed, A. (2006) Interactive Modeling and
Tracking for Mixed and Augmented Reality. VRST’06,
November 1–3, 2006, Limassol, Cyprus.
[37] Wexelblat, A. (1993) The Reality of Cooperation: Virtual
Reality and CSCW. In Virtual Reality: Applications and
Explorations. Edited by A. Wexelblat. Boston: Academic
Publishers.
[38] Lifton, J. (2007) Dual Reality: An Emerging Medium. Ph.D.
Dissertation, M.I.T., Department of Media Arts and Sciences.
[39] Coutrix, C. & Nigay, L. (2006) Mixed Reality: A model of
Mixed Interaction. AVI’06, May 23–26, 2006, Venezia,
Italy.
[40] Tang, A.; Neustaedter, C. & Greenberg, S. (2006)
VideoArms: Embodiments for Mixed Presence Groupware.
In N. Bryan-Kinns, A. Blanford, P. Curzon and L. Nigay
(Eds.) People and Computers XX – Engage. Proceedings of
HCI 2006. Springer, September.
[41] Tang, A.; Neustaedter, C. & Greenberg, S. (2004)
Embodiments for Mixed Presence Groupware. Research
Report 2004-769-34, Department of Computer Science,
University of Calgary, Calgary, Alberta, Canada.
[42] Cabrera, J., Frutos, H., Stoica, A., Avouris, N., Dimitriadis,
Y., Fiotakis, G. & Liveri, K. (2005). Mystery in the museum:
collaborative learning activities using handheld devices.
Proceedings of the 7th International Conference on Human
Computer Interaction with Mobile Devices & Services,
Salzburg, Austria, September 19 - 22, vol. 111. ACM Press,
New York, pp. 315-318.
[43] Asai, K., Sugimoto, Y., Billinghurst, M. (2010) Exhibition of
lunar surface navigation system facilitating collaboration
between children and parents in science museum. In
Proceedings of of the 9th ACM SIGGRAPH Conference on
Virtual-Reality Continuum and its Applications in Industry,
Seoul, South Korea, December 12-13, 2010, pp. 119-124.
[44] Moura, H. (2008) Bringing Multimodality and Affordances
to Design of Technology Enhanced Learning Environments,
Doctoral Dissertation, Institute of Design-Illinois Institute of
Technology, Chicago.
[45] OMG Object Management Group (2008) Business Process
Model and Notation (BPMN), Version 1.2.
[46] Glaser, B. & Strauss, A. (1967). The Discovery of Grounded
Theory: Strategies for Qualitative Research. New York:
Aldine Publishing Company.
[47] Mander, R. & Michael A. (1994) Blank Models: A Method
for Early User Participation. Interact: American Center for
Design Journal 8(1), 38-45




VIII Simpósio Brasileiro de Sistemas Colaborativos
- 159 -

S E S S Ã O 7
Sistemas Colaborativos
Aplicados a Domínio
Remember Storytelling API: Um Framework Para o Apoio
à Recuperação de Histórias em Group Storytelling
Bruno C. C. Costa
Programa de Pós Graduação em
Informática (PPGI) ± UFRJ
Térreo, Bloco E, CCMN,/NCE, Cidade
Universitária, Rio de Janeiro ± RJ, Brasil
brunocosta.dsn@gmail.com
Rafael M. Alves
Programa de Pós Graduação em
Informática (PPGI) ± UFRJ
Térreo, Bloco E, CCMN,/NCE, Cidade
Universitária, Rio de Janeiro ± RJ, Brasil
rafaelmachadoalves@hotmail.com
ABSTRACT
Recovery of unspoken stories presented as necessary in various
contexts. Tools like Sofia and Tellstory promote great support,
since they have features for inclusion and association fragments
in a collaborative way, analysis of contributions, among others.
This paper presents a proposal implemented in a Framework for
recovery of facts and events in the process of inclusion and
editing fragments in Group Storytelling. The Framework has
been applied in the context of disasters in the mountain region of
the state of Rio de Janeiro aimed recovering a more detailed
account of events.
Categories and Subject Descriptors
D.3.3 [Language Constructs and Features]: Frameworks,
Modules, packages
General Terms
Design, Human Factors
Keywords
Group Storytelling, Collective Knowledge, Framework, Reuse
1. INTRODUÇÃO
A recuperação coletiva de fatos ocorridos com base em relatos de
indivíduos envolvidos apresenta-se como uma tarefa subjetiva e
complexa. Subjetiva, pois os indivíduos que participam de um
evento têm diferentes percepções e processos cognitivos, além da
externalização do acontecimento vivenciado ser conforme seus
pontos de vista[1]. Complexa, pois o registro do acontecimento
torna-se custoso quando baseado apenas nas transcrições de
depoimentos, que em alguns casos não são recuperados, visto a
inexistência de relatos, que ocorre principalmente pela falta de
lembrança do fato por parte dos relatores.
A importância da recuperação de acontecimentos tange a diversas
situações. No contexto de catástrofes naturais, profissionais,
como geólogos, meteorologistas e engenheiros, investigam os
princípios que resultaram nos eventos em análises específicas e
composição dos acontecimentos, com base em relatos de
testemunhas.
Os acontecimentos ocorridos no mês de Janeiro na região serrana
do estado do Rio de Janeiro deixaram um rastro de destruição e
caos nas comunidades atingidas. Buscando a prevenção,
especialistas de diversas áreas têm buscado respostas,
cientificamente baseadas, dos princípios que resultaram nos
eventos naturais. Além da análise, entrevistas com testemunhas
que presenciaram os fatos vem sido realizadas a fim de recuperá-
los e organizá-los linearmente. Porém, muitos acontecimentos
não são recuperados, visto a falta de lembrança das testemunhas.
Aplicado no contexto das catástrofes naturais ocorridas, este
trabalho apresenta uma proposta implementada em um
Framework denominado Remember Storytelling API. O objetivo
é auxiliar o rememorar dos relatores dos fatos, procedendo em
um relato mais detalhado e linearmente coerente.
Este artigo está organizado em oito seções, além desta
introdução. A Seção 2 apresenta o auxílio de Group Storytelling
ao contexto deste trabalho. A Seção 3 apresenta as fases para a
recuperação de histórias, atrelando a fase proposta deste
trabalho. A Seção 4 apresenta o Framework proposto. A Seção 5
apresenta os detalhes de implementação e configuração. A Seção
6 apresenta os testes preliminares. A Seção 7 conclui o artigo
com perspectivas futuras. A Seção 8 exprime nossos
agradecimentos. Finalmente, a Seção 9 apresenta as referências
deste trabalho.
2. GROUPSTORYTELLING NO AUXÍLIO
À RECUPERAÇÃO DE HISTÓRIAS
Diversos habitantes da cidade de Teresópolis, além do primeiro
autor deste artigo, presenciaram e foram afetados pelas
catástrofes naturais (deslizamentos, enxurradas, dentre outros).
Motivados em pesquisas e investigação em ações de prevenção,
pesquisadores de diversas universidades, dentre elas,
Universidade Federal do Rio de Janeiro, Centro Universitário
Serra dos Órgãos, Universidade Federal Fluminense, vêm
pesquisando os acontecimentos através de análises específicas
das áreas de conhecimento.
Além desta investigação, os pesquisadores e analistas buscam a
recuperação dos acontecimentos, com base em relatos dos fatos, a
fim de organizar de forma coerente e linear os eventos. Porém,
devido principalmente ao fator do esquecimento dos fatos por
parte de testemunhas, diversos eventos não são recuperados,
prejudicando a análise dos pesquisadores.

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, or
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
VIII Simpósio Brasileiro de Sistemas Colaborativos, Outubro 57, 2011,
Paraty, Rio de Janeiro, Brasil.
Copyright 2010 ACM 1-58113-000-0/00/0010.$10.00.

VIII Simpósio Brasileiro de Sistemas Colaborativos
- 161 -
Groupware tem por definição: sistemas computacionais que
apoiam grupos de pessoas comprometidas em uma tarefa ou meta
comum, e fornece uma interface para um ambiente compartilhado
[2]. Group Storytelling se inclui neste contexto, pois promove
captura e tratamento de conhecimento coletivo.
Para auxiliar os pesquisadores na recuperação dos
acontecimentos de forma colaborativa, Groupwares como o Sofia
[3], auxiliam na inclusão, persistência e associação de
fragmentos. Sendo utilizados com o objetivo de recuperar as
histórias e acontecimentos de forma cooperativa e colaborativa
3. FASES EM GROUPSTORYTELLING
Implementados no Sofia, algumas fases são básicas e importantes
para à recuperação de acontecimentos e histórias. Estas fases são:
criação da história; cadastro de participantes; designação de
papéis (coordenador, contador, facilitador e examinador);
inclusão, edição, associação e exclusão de fragmentos (partes
transcritas da história). A fase principal é a inclusão e edição de
fragmentos, visto onde os contadores da história relatam os fatos
ocorridos. A figura 1 apresenta a fase de inclusão de fragmentos
no Sofia.









No contexto apresentado, coordenadores compreendem-se como
os pesquisadores; contadores são as testemunhas dos
acontecimentos; facilitadores são os autores deste trabalho; e
examinadores outras testemunhas que participaram dos eventos.

4. AUXÍLIO AO REMEMORAR NA FASE
DE INCLUSÃO DE FRAGMENTOS
A utilização do Groupware Sofia, através da associação de
fragmentos, mostrou-se eficiente quanto à organização,
persistência e maior linearidade dos acontecimentos. Porém, o
problema da linearidade dos fatos assim como a falta de detalhes,
devido à falta de fragmentos, permanece.
Com o objetivo de auxiliar o rememorar dos acontecimentos por
parte dos contadores, foi desenvolvido o Remember Storytelling
API. Utilizando recursos multimídia disponíveis na internet, o
Framework é aplicado nas fases de Inclusão e Edição de
fragmentos.
A Internet dispõe de grande quantidade de conteúdo.
Informações são distribuídas, não somente por parte de empresas
ou fornecedores de informações, mas também por usuários que
compartilham conteúdo por forma de vídeo, imagens ou relatos.
Em um acontecimento marcante (como as catástrofes ocorridas
na região serrana), o conteúdo compartilhado é significativo,
sendo possível, em uma pesquisa rápida em um buscador online,
avaliar a grande quantidade de material compartilhado.
Tais conteúdos e materiais podem auxiliar ao contador, pois uma
vez visualizando uma imagem ou vídeo, a lembrança do
acontecimento torna-se mais evidente.
Neste contexto, o objetivo do Framework é recuperar e trazer à
mesma interface de inclusão e edição de fragmentos, a saber,
imagens, vídeos, notícias e geolocalização. Estes conteúdos são
denominados Remember Items. Os Remember Items são
recuperados com base na análise do título e descrição do relato.
























Após a recuperação dos Remember Items, o contador seleciona
aqueles que mais o auxiliaram no rememorar, clicando em
'copiar¨. Em um segundo painel, localizado a direita da
transcrição da história são incluídos estes Remember Items.
Além da exibição no painel à direita, ao clicar em copiar, são
incluídos no relato os endereços virtuais de referência aos
Remember Items. Assim, em uma construção de história
colaborativa, na recuperação ou edição do relato, outros
contadores, assim como coordenadores, facilitadores e
examinadores, podem localizar as fontes que melhor detalharam
o relato.














Figura 1 Inclusão de fragmentos do Groupware Sofia
Figura 2 Remember Items
Figura 3 Remember Items (a) selecionados por um contador,
exibidos no painel à direita do relato (b)
a b
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 162 -

5. REMEMBER STORYTELLING API
FRAMEWORK
O Framework Remember Storytelling API foi desenvolvido em
Java Server Pages (JSP)[4]. Os relatos podem ser persistidos em
XML, utilizando a API Java-based Document Object (JDOM)[5]
ou integrados à ferramenta de Group Storytelling. Na
recuperação dos Remember Itens na Internet, foi utilizada a
Google Web Search API [6].
Podendo ser utilizado e facilmente adaptado a qualquer
Groupware que utilize a arquitetura web JSP ou JSF (Java Server
Faces), o Framework apresenta algumas configurações,
localizadas em um arquivo de configuração XML no servidor.
5.1 Remember Items Context
Para tornar mais eficiente a recuperação dos Remember Items, é
necessária a inclusão de palavras chave que correspondem ao
contexto da história. Por exemplo, no contexto deste trabalho, as
chuvas e catástrofes, em um relato descrevendo barreiras no
bairro de Campo Grande em Teresópolis, as palavras chave
seriam: 'Campo Grande¨ e 'Barreiras¨. Estas palavras chave são
incluídas ao título e descrição do relato no momento da
recuperação.
5.2 Remember Items Scope
Por padrão o Framework apresenta quarto escopos para
recuperação: Imagens, Vídeos, Notícias e Geolocalização. Porém,
é possível a customização, onde são determinados quais escopos
serão exibidos, além do número de exibições iniciais. Na figura 2
estão configurados todos os escopos, sendo no escopo Imagem,
quatro Remember Items exibidos inicialmente.
5.3 Persistência
A persistência do relato pode ser efetuada de três formas, a
saber, XML, banco de dados ou híbrida. Em XML, utilizando
JDOM, os relatos são persistidos em arquivos neste formato;
para a persistência em banco de dados, é necessária a integração
com a forma de acesso a dados do Groupware, sendo, por
exemplo, Hibernate ou Java Persistence. É possível a utilização
híbrida de persistência, sendo gerado um arquivo XML, além da
gravação em uma base de dados.
6. TESTES PRELIMINARES
O escopo deste trabalho está na fase de inclusão e edição de
fragmentos. Foram realizados testes preliminares a fim de validar
o auxílio do Remember Items aos contadores de histórias que
resultaria em relatos lineares mais detalhados. Foram convidados
seis testemunhas de acontecimentos de bairros afetados distintos,
organizados em duplas. A primeira dupla residia no bairro de
Campo Grande, a segunda no bairro de Vieira, a terceira no
bairro de Três Córregos.
Os papéis de coordenador e facilitador foram atribuídos aos
autores deste trabalho. O papel de contador foi atribuído a um
participante de cada dupla, e o papel de examinador atribuído a
outro participante de cada dupla.











Na primeira fase do experimento foi solicitado aos contadores
entrarem com os relatos, sem o auxílio dos Remember Items.
Após a transcrição dos fragmentos, os examinadores a
analisavam e incluíam novos fragmentos.
Na segunda fase, os contadores entrariam novamente com os
fragmentos, porém desta vez com o auxílio dos Remember Items.
Assim como na primeira fase, os examinadores analisavam os
fragmentos, desta vez com as referências dos Remember Items,
incluídas pelos contadores, além da sua própria utilização.
A análise dos relatos por parte dos examinadores e profissionais
envolvidos nos estudos foi conclusiva, atestando uma maior
linearidade e detalhamento nos relatos onde houve o auxílio dos
Remember Items.
Por parte dos participantes, foi perceptível a reação de
rememorar o fato. Um dos participantes, inclusive, pode
relembrar a posição exata de objetos presentes no momento da
catástrofe, que foram arrastados com a enxurrada, transcrevendo
no relato. O que foi muito importante para uma análise específica

7. CONCLUSÕES PRELIMINARES
Group Storytelling apresenta-se como técnica eficiente na
recuperação de histórias e fatos ocorridos. Neste contexto,
softwares como o Sofia, promovem suporte à recuperação de
histórias de forma colaborativa, pois contam com funcionalidades
como associação, análise e edição de fragmentos, dentre outros.
Apresentamos neste trabalho uma proposta de auxílio ao
rememorar do contador de história que se aplica na fase de
inclusão e edição de fragmentos. Através da recuperação de
imagens, vídeos, notícias e geolocalização, encadeados ao relato,
o objetivo é fazer com que o contador rememore os fatos com
maior clareza, resultando em um fragmento e relato mais lineares
e detalhados. A proposta foi implementada no Framework
Remember Storytelling API e aplicado ao contexto das
catástrofes da região serrana do Rio de Janeiro, objetivando uma
recuperação de fatos e eventos de forma eficiente para a
população e profissionais envolvidos. Experimentos preliminares
com testemunhas que vivenciaram os eventos ocorridos
demonstraram que o Framework é eficiente, visto o detalhamento
dos relatos, e, consequentemente, uma maior aproximação aos
acontecimentos reais.
A próxima fase deste projeto inicia-se como uma maior
integração com a ferramenta Sofia. Além do auxílio nas fases de
edição e inclusão de fragmentos, serão desenvolvidos
funcionalidades referentes à recuperação de Remember Items
com recomendação, ou seja, ao criar um relato, com base nos
Remember Items selecionados em relatos semelhantes, as
pesquisas seriam mais eficientes, e melhor recomendadas.
Figura 4 Organização dos participantes no
experimento
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 163 -
Além da integração, busca-se a criação de um portal online, onde
todos os envolvidos em eventos ocorridos estariam utilizando o
sistema, objetivando uma quantidade de relatos que, conforme o
experimento trariam mais detalhes, fomentando uma melhor
análise por parte da população e profissionais envolvidos.
O lançamento deste portal está programado para a Semana
Nacional de Ciência e Tecnologia 2011 [6], cujo tema coincide
com o contexto deste trabalho. Serão exibidos os resultados
preliminares além da divulgação do portal.
8. AGRADECIMENTOS
Este trabalho foi desenvolvido na disciplina Suporte por
Computador ao Trabalho Cooperativo (PPGI UFRJ
2011). Agradecimento ao professor da disciplina, Marcos
Borges, por sua atenção e conhecimentos passados.
Agradecimento aos participantes do experimento, mesmo
com todas as necessidades emergentes das tragédias, se
prontificaram em contribuir à pesquisa. A todos os
pesquisadores e profissionais envolvidos na busca de
soluções na prevenção de riscos.
9. REFERÊNCIAS
[1] Carminatti, N. 2006. 'Recuperação Coletiva do
Conhecimento Aplicada a Situações de Emergência¨,
http://teses.ufrj.br/NCE_M/NaianadeAraujoCarminatti.pdf
[2] Clarence, A. E., Simon J. G, Rein G. 1991, Groupware:
some issues and experiences. ACM-34, 1, 39-58.
DOI=10.1145/99977.99987. (Janeiro, 1991)
[3] Luz, C., Borges, M., Campos, M. L 2008., Sofia: A
Framework for the Development of Group Storytelling
Tools. ACM Workshop on Story Representation.
Machanism and Context. Nova Iorque: ACM Press, 2008
[4] JSP, Java Server Pages. [Online] Disponível em:
http://www.oracle.com/technetwork/java/javaee/jsp.
[5] JDOM, Java-based Object Model. [Online] Disponível em:
http://www.jdom.org/
[6] Google Web Search API [Online]. Disponível em:
http://code.google.com/intl/pt-BR/apis/websearch/docs/.
[7] Semana Nacional de Ciência e Tecnologia 2011. [Online]
Disponível em : http://semanact.mct.gov.br.




VIII Simpósio Brasileiro de Sistemas Colaborativos
- 164 -
Aplicação da Abordagem Colaborativa em
Herbários Virtuais
Luís Alexandre Estevão da Silva
Kleto Michel Zan
Eduardo Couto Dalcin
Djalma Alves de Lima
Instituto de Pesquisas Jardim Botânico do Rio de Janeiro
Rio de Janeiro, Brasil
{estevao,kleto,edalcin,dalima}@jbrj.gov.br
Marco Aniceto Vaz
Filipe Braida do Carmo
Geraldo Zimbrão da Silva
Jano Moreira de Souza
Universidade Federal do Rio de Janeiro – COPPE/UFRJ
Rio de Janeiro, Brasil
{mvaz,filipebraida,zimbrao,jano}@cos.ufrj.br
RESUMO
Os herbarios representam importantes fontes de pesquisas na
Botânica. Os dados disponibilizados têm crescido consideravel-
mente com o processo de desenvolvimento de herbarios virtu-
ais. O presente trabalho tem como principal objetivo a divulga-
ção dos herbarios virtuais como uma promissora area de pes-
quisa em sistemas colaborativos, apresentando uma proposta de
arquitetura baseada na abordagem colaborativa com o objetivo
de permitir a melhora na qualidade dos dados.
Palavras-Chave
Herbario virtual, sistemas colaborativos, arquiteturas, biodiver-
sidade.
1. INTRODUÇÃO
A composição total da biodiversidade do Brasil não é conhecida
e talvez nunca venha a ser, tal a sua magnitude e complexidade
e mesmo assim, o pais é apontado como o de maior biodiversi -
dade do mundo, contando com um numero estimado de mais de
20% do numero total de espécies do planeta, com mais de 43
mil espécies descritas, correspondendo a 14% do total mundial
[1|. Ocupaçoes irregulares, crescimento da area cultivada e di -
versos outros fatores colocam essa riqueza em risco, o que pre-
ocupa tanto a comunidade cientifica internacional, quanto go-
vernos e entidades não-governamentais ambientalistas, que
vêm alertando para a perda da diversidade biologica em todo o
mundo, e, particularmente nas regioes tropicais.
Como pais signatario da Convenção sobre Diversidade Biologi-
ca (CDB), principal acordo internacional para temas e questoes
relacionados a biodiversidade [2|, o Brasil deve apoiar açoes
que venham a dotar o governo e a sociedade de informaçoes ne-
cessarias para o estabelecimento de prioridades que conduzam
a conservação, a utilização sustentavel e a repartição de benefi -
cios da diversidade biologica brasileira. Nesse contexto é im-
portante ressaltar o papel fundamental de coleçoes botânicas no
inventario da biodiversidade. As coleçoes botânicas são com-
postas por documentos que certificam a riqueza da flora de uma
determinada região ou pais, constituindo testemunhos das ocor-
rências das espécies depositadas nas coleçoes e sendo, portanto,
material indispensavel para estudos taxonomicos, além de se-
rem usados em outros ramos da ciência e uteis em politicas de
conservação [3|. Ainda, estudos desenvolvidos na Botânica con-
tribuem para descobertas, por exemplo, de novos medicamen-
tos. Além disso, por meio de pesquisas, podem se estabelecer
parcerias com instituiçoes cientificas de outros paises e a con-
seqüente geração de conhecimento [1|.
Os diversos herbarios têm feito um esforço muito grande no
sentido de tornar acessivel aos pesquisadores os dados de suas
coleçoes em bases de dados e disponibiliza-los em rede (Web)
para a pesquisa, conservação, gestão ambiental e usos educaci -
onais.
A ampliação do acesso aos dados e imagens permitira aos espe-
cialistas visualizar, anotar e analisar dados a partir de amostras
muito mais do que é agora possivel, aumentando assim o valor
dos exemplares fisicos [4|.
Poucas iniciativas colaborativas para aplicação nos diversos
herbarios têm sido feitas, embora sejam necessarias para dispo-
nibilizar os dados dos herbarios de forma mais agil e eficiente-
mente, facilitando o trabalho tanto de curadores quanto dos pes-
quisadores da area. Um exemplo recente de iniciativa colabora-
tiva é o Projeto Lorin Americon Plonrs Iniriorive (LAPI) que
permite a disponibilização das imagens de herbarios da Améri -
ca Latina [3|..
Em função disso, o Jardim Botânico do Rio de Janeiro esta de-
senvolvendo uma versão atualizada do Sistema JABOT JA-
BOT 2.0. A nova versão é composta de conjunto de modulos in-
tegrados por um banco de dados contento as regras de nomen-
clatura e de classificação (nucleo taxonomico) de forma a fo-
mentar o trabalho colaborativo entre os diversos atores.
2. HERBÁRIOS NO BRASIL E NO
MUNDO
Um herbario é uma coleção dinâmica de plantas secas prensa-
das (exsicatas), de onde se extrai, utiliza e adiciona informação
sobre cada uma das populaçoes e/ou espécies conhecidas e so-
bre novas espécies de plantas. O Brasil possui hoje 114 herba-
rios distribuidos em suas diversas instituiçoes de pesquisas [1|.
Os seis maiores herbarios brasileiros são, nesta ordem: Museu
Nacional do Rio de Janeiro (1808) [6|, Jardim Botânico do Rio
de Janeiro (1890), Instituto de Botânica de São Paulo (1917),
Embrapa Amazonia Oriental (1943), Museu Botânico de Curi-
tiba (1963) e Instituto Nacional de Pesquisas da Amazonia
(1934). Em comparação aos herbarios do exterior, o Brasil ain-
da necessita de muitos esforços na organização do conhecimen-
to derivado de sua biodiversidade, como mostra a Tabela 1,
com o numero total de espécimes dos três principais herbarios
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 165 -
internacionais (de 1 a 3) e nacionais (de 4 a 6), onde os ultimos
diferem dos primeiros em uma ordem de grandeza.
Tabela 1. Principais herbários do Mundo e do Brasil.
Herbários Total
Museum of Natural History, Paris, França
1
8.800.000
Royal Botanic Gardens, Kew, Inglaterra
2
7.000.000
New York Botanical Garden, New York, EUA
3
7.000.000
Australia's Virtual Herbarium
4
6.000.000
Museu Nacional do Rio de Janeiro
3
330.000
Jardim Botânico do Rio de Janeiro
6
330.000
Instituto de Botânica de São Paulo
7
330.000
O fato de somente poucos herbarios disponibilizarem seus acer-
vos de forma online é uma das barreiras que explicam tamanha
discrepância entre herbarios internacionais e os nacionais, pois
a publicação dos dados de herbario permite, entre outras possi-
bilidades, o compartilhamento conhecimento utilizados para a
identificação das amostras armazenadas. Outro problema ante-
rior a publicação das informaçoes é a propria digitalização das
coleçoes.
A confiabilidade dos dados contidos nessas coleçoes depende
do trabalho de taxonomistas, que são botânicos especializados
no estudo de familias de plantas. A quantidade de taxonomistas
em atividade é reduzida, em um total aproximado de 1000 pes-
quisadores [7| em parte devido ao tempo de formação desse
profissional que é longo [8,9|, o que leva a necessidade de uma
metodologia colaborativa que permita maior produtividade e vi-
sibilidade dos resultados dos estudos desenvolvidos. Assim, a
motivação para este trabalho é a de promover a divulgação do
conhecimento taxonomico para açoes de conservação da flora
por meio de uma proposta de arquitetura colaborativa a partir
do herbario virtual.
3. HERBÁRIOS VIRTUAIS
COLABORATIVOS
Alguns herbarios no mundo ja têm adotado abordagens colabo-
rativas. Um dos primeiros a construir um sistema para esse tipo
de trabalho foi o AVH Ausrrolio's Virruol Herborium. Atual-
mente o AVH conta com mais de 6 milhoes de registros de
plantas, fungos e algas. Esses dados são obtidos de 11 herbari -
os espalhados pela Australia e a arquitetura é montada sobre
um sistema federado de banco de dados. Dessa forma, o AVH
em si não armazena os testemunhos biologicos, mas apenas os
1
http://www.mnhn.fr/
2
http://www.kew.org/
3
http://www.nybg.org/
4
http://chah.gov.au/avh/
3
http://www.museunacional.ufrj.br/
6
http://www.jbrj.gov.br
7
http://www.ibot.sp.gov.br/
dados sobre esses testemunhos, incluindo nome, classificação
taxonomica, georreferenciamento e imagens.
A junção dos dados de varios herbarios reais em um unico por-
tal permite uma melhor analise da qualidade dos dados e, con-
seqüentemente, da identificação de possiveis erros. Além disso,
facilita o trabalho de pesquisadores, que de outra forma, teriam
que acessar cada um dos herbarios separadamente. Com os da-
dos apresentados em um unico relatorio, de forma transparente
as estruturas de dados de cada herbario, o herbario virtual tor-
na-se uma ferramenta util para analises de conservação, distri -
buição e priorização de expediçoes de coleta, indicando, por ex-
emplo, quais as espécies menos representadas nos herbarios
australianos. A criação de um herbario virtual colaborativo com
essas caracteristicas é possivel devido a utilização de padroes e
protocolos de troca de mensagens sobre a biodiversidade.
3.1 Protocolos e Padrões para Herbários
Virtuais
A colaboração entre pesquisadores e usuarios de um herbario
virtual se da, quase sempre, através de uma interface de uso.
Cada herbario pode ter um layout proprio para esta interface.
No entanto, é importante que os dados modificados pelos taxo-
nomistas possam ser acessados por outros sistemas. Essa funci-
onalidade possibilita que a colaboração entre os taxonomistas
seja mais eficiente, pois os dados, dessa forma, independem do
layout do sistema.
A orientação e a padronização dos dados são promovidos pelo
TWDG BioJiversiry SronJorJs Orqonisorion
8
. Os padroes
atuais incluem diretrizes para a comunicação de nomes de plan-
tas e conceitos, para acesso e troca de espécimes e observaçoes.
O principal formato de dados é o DwC DorwinCore
9
, que é
um conjunto de termos e definiçoes padronizadas. Usando esse
conjunto de termos, cada herbario pode mapear os seus dados
em conceitos definidos no padrão garantindo assim que essas
informaçoes sejam efetivamente compartilhadas. A implemen-
tação desse padrão pode ser em arquivos XML e, como tem
sido mais usado recentemente, em arquivos de texto (DwC-
A)
10
.
TAPIR TDWG Access Prorocol jor Injormorion Rerrievol
11
é
um protocolo usado para a execução de consultas em em bancos
de dados com esquemas diferentes. A combinação DwC¹TA-
PIR fornece ferramentas de interoperabilidade estavel de comu-
nicação entre herbarios ou entre pesquisadores e herbarios. Por
isso, a implementação de miJJlewores para herbarios virtuais
são baseados nesse formato e protocolo.
4. O HERBÁRIO DO 3ARDIM
BOTÂNICO DO RIO DE 3ANEIRO
4.1 Informatização do Herbário
O Jardim Botânico do Rio de Janeiro foi criado em 1808 e pos-
sui em seu acervo amostras que vêm sendo coletadas ha mais
de dois séculos, como as coleçoes pertencentes ao imperador D.
Pedro II (estimadas em 23.000 plantas). Em 2001, a informati -
zação das coleçoes do herbario RB era uma meta considerada
8
http://www.tdwg.org
9
http://www.tdwg.org/activities/darwincore/
10
http://rs.tdwg.org/dwc/terms/guides/text/index.htm
11
http://www.tdwg.org/dav/subgroups/tapir/1.0/docs/tdwg_tapir
_specification_2010-03-03.htm
VIII Simpósio Brasileiro de Sistemas Colaborativos
- 166 -
°longe de ser cumprida, em curto ou mesmo em médio prazo¨
[4|, porém em 2003 foi desenvolvida a primeira etapa de infor-
matização, quando as equipes de pesquisadores botânicos e de
informatica do Jardim Botânico desenvolveram o sistema inti -
tulado JABOT (JArdim BOTânico), capaz de receber e redistri -
buir o grande volume de informaçoes constantes nas diversas
coleçoes em um ambiente web e totalmente desenvolvido em
software livre. Sendo hoje o maior banco de dados da flora na-
cional.
4.2 O Desenvolvimento da Nova Versão
do 3abot
Em 2010 o Instituto de Pesquisas Jardim Botânico do Rio de
Janeiro recebeu a atribuição de implementar o Herbario Virtual
de Plantas Repatriadas Projeto REFLORA. Considerando que
a atual versão do sistema JABOT não atende plenamente a de-
manda apresentada pelo projeto REFLORA, uma nova versão
do sistema esta em desenvolvimento, visando atender entre ou-
tras necessidades o trabalho colaborativo entre herbarios e ta-
xonomistas.
O novo sistema JABOT sera composto principalmente por dois
portais (JABOT e Plantas Repatriadas) baseados na web, com
objetivo de oferecer aos pesquisadores e publico em motores de
busca especializados para acessar os dados textuais e digitaliza-
dos (imagens) de amostras (espécimes) georreferenciadas, de-
positados no Herbario do Jardim Botânico do Rio de Janeiro e
dos espécimes da flora brasileira existentes nos Herbarios de
Kew e de Paris.
Os bancos de dados desses portais estarão apoiados por um nu-
cleo (banco de dados) taxonomico composto por conjunto de re-
gras de nomenclatura, bem como os relacionamentos taxonomi-
cos existentes (sinonimos, arvore hierarquica etc.). Além disso,
o nucleo devera ser capaz de representar as espécies em dife-
rentes classificaçoes taxonomicas e seus relacionamentos.
O novo sistema esta projetado para proporcionar aos diferentes
pesquisadores um exercicio verdadeiramente aberto, colaborati -
vo e dinamicamente atualizavel. Apresentando desafios e opor-
tunidades para os individuos e instituiçoes, exigindo a comuni-
cação e coordenação para atingir um objetivo compartilhado.
S. ARQUITETURA PROPOSTA
Neste contexto, a seguir é apresentada uma proposta de arquite-
tura que se encontra em fase de definição (Figura 1). Nessa ar -
quitetura estão presentes dois modulos principais onde os pro-
cessos exigem colaboração e comunicação intensiva entre os
atores envolvidos. Os modulos com maior atividade de colabo-
ração são o de curadoria de coleçoes e o nucleo taxonomico.
O nucleo taxonomico é responsavel por conter as regras nomen-
claturais de formação e validação dos nomes bem como as refe-
rências bibliograficas e os sistemas de classificação taxonomi-
ca. Os sistemas de classificação são responsaveis pela organiza-
ção hierarquica dos organismos vivos.
Tradicionalmente, os taxonomistas organizam-se por especialis-
tas em niveis hierarquicos. O nivel de familia é a divisão mais
comum. O nucleo taxonomico, por isso, atribui a cada taxon um
taxonomista responsavel, chamado de coordenador de taxon. O
coordenador de taxon pode autorizar os taxonomistas a cadas-
trarem informaçoes taxonomicas em um taxon sob sua coorde-
nação. Essas informaçoes podem ser aceitas ou não pelo coor-
denador. Assim, o sistema deve prover uma interface que possi-
bilite a cooperação entre os pesquisadores e os coordenadores
em um taxon, possibilitando a criação de um ambiente
qroupwore [|.
Para o funcionamento do nucleo, uma ampla colaboração entre
taxonomistas e coordenadores é necessaria, pois o fluxo de tra-
balho é projetado para permitir que grupos de especialistas reu-
nidos em grupos taxonomicos especificos ofereçam de forma
online adiçoes e mudanças nos nomes para as taxonomias con-
solidadas (p.ex. novas espécies e sinonimias), constituindo um
meio de controle de qualidade na forma de revisão pelos coor-
denadores de taxons.
A qualidade das informaçoes também pode ser averiguada atra-
vés da consulta de fontes autoritativas em nomes botânicos. O
IPNI Inrernorionol Plonr Nomes InJex, por exemplo, mantém
uma lista de todos os nomes considerados aceitos, seguindo as
regras de aceitação do ICBN Inrernorionol CoJe oj Boronicol
Nomenclorure. A conexão dessas fontes dentro do nucleo ta-
xonomico, permite aos coordenadores de taxons uma verifica-
ção das informaçoes nomenclaturais fornecidas pelos especia-
listas. Dessa forma, a colaboração através da arquitetura pro-
posta torna-se mais produtiva, permitindo que pequenos enga-
nos ou erros de digitação possam ser facilmente corrigidos.
O outro modulo com forte caracteristica colaborativa é o modu-
lo de coleçoes, que esta ligado ao trabalho dos curadores e pes-
quisadores de uma rede de herbarios no processo de intercâm-
bio de material e imagens e no processo de empréstimo para es-
tudo e identificação de plantas.
Cada planta coletada pode gerar varias exsicatas, que são cha-
madas de duplicatas. As duplicatas são geralmente permutadas