Você está na página 1de 243

ANAIS

VIII SIMPSIO BRASILEIRO DE SISTEMAS COLABORATIVOS


5 a 7 de Outubro de 2011
PARATY, RJ






ANAIS




Coordenao Geral
Marcos Roberto da Silva Borges (IM-UFRJ)

Coordenao do Comit de Programa
Ana Cristina Bicharra Garcia (UFF)
Pedro Antunes (Universidade Tcnica de Lisboa)

Realizao
Universidade Federal do Rio de Janeiro (UFRJ)
Universidade Federal Fluminense (UFF)


Promoo
SBC Sociedade Brasileira de Computao

ISBN
978-85-7669-254-6

VIII Simpsio Brasileiro de Sistemas Colaborativos
- I -

S U M R I O
Prefcio ...........................................................................................................VII
Organizao SBSC 2011 ................................................................................... IX
Palestras Convidadas .........................................................................................XI
Sesso 1: Interao Social
1.1. Entendendo a Twitteresfera Brasileira .......................................................01
FABRCIO BENEVENUTO, DIEGO SILVEIRA, THALISSON OLIVEIRA, LEONARDO BOMBONATO, REINALDO
FORTES E LVARO PEREIRA JR.
1.2. Uma investigao sobre os "Assuntos do Momento"
e a Discusso de Notcias no Servio de Microblogging ...................................... 09
KAREN FIGUEIREDO E ANA CRISTINA GARCIA
1.3. Social networks and collective intelligence applied
to public transportation systems: A survey ...................................................... 16
ANA PAULA CHAVES, IGOR STEINMACHER E VANINHA VIEIRA
1.4. Multides: a nova onda do CSCW? ............................................................ 24
DANIEL SCHNEIDER, JANO M. DE SOUZA E KATIA MORAES
Sesso 2: Inteligncia Coletiva
2.1. Um modelo para o suporte computacional da
inteligncia coletiva na Web ............................................................................ 33
STRAUS MICHALSKY E MARCO AURLIO GEROSA
2.2. Predio de falhas em projetos de software baseado
em mtricas de redes sociais de comunicao e cooperao ............................... 37
VIDAL FONTOURA, IGOR STEINMACHER, IGOR WIESE E MARCO AURLIO GEROSA
2.3. Um aplicativo baseado em inteligncia coletiva para
compartilhamento de rotas em redes sociais ..................................................... 41
LUIZ PHILIPE SERRANO ALVES, ANA PAULA CHAVES E IGOR STEINMACHER
- III -
Sesso 3: Colaborao em Micromundos e Atravs de Dispositivos Mveis
3.1. Using Microworlds to Study Teamwork at the
Cognitive Level ..............................................................................................46
CLAUDIO SAPATEIRO, ANTONIO FERREIRA E PEDRO ANTUNES
3.2. SLMeetingRoom: Um Modelo de Ambiente para
Suporte a Reunies Remotas, Orientadas a Tarefas,
com Grupos Pequenos para o Second Life .........................................................54
CINTIA CAETANO E ANA CRISTINA GARCIA
3.3. xAgent: Arquitetura para a Colaborao em
Ambientes Cross-Reality ................................................................................62
DBORA CARDADOR, KATIA VEGA, HUGO FUKS E CARLOS LUCENA
3.4. Ampliando o suporte interoperabilidade em uma
arquitetura orientada a servios de middleware para
sistemas colaborativos ...................................................................................68
RITA SUZANA MACIEL, JOS MARIA DAVID E THIAGO R. DE ALMEIDA
3.5. Uma Ferramenta de Colaborao Mvel para
Auxiliar a Interao em Palestras Presenciais .................................................76
GABRIEL BALESTRIN, CARLA BERKENBROCK E CELSO HIRATA
Sesso 4: Ferramentas e Desenvolvimento de Sistemas Colaborativos
4.1. Adicionando informaes de contexto de tarefa a
uma ferramenta de chat sncrono para apoiar o
desenvolvimento distribudo de software ........................................................ 84
ANA PAULA CHAVES, IGOR SCALIANTE WIESE, IGOR STEINMACHER, FABIO BAIA, EDILSON F. DA COSTA,
KAREN MORESCHI, CICERO JUPI, MARCO AURLIO GEROSA
4.2. Desenvolvimento e Implantao de uma Ferramenta
de Apoio a Reunies Presenciais .................................................................... 88
DANIEL BISCALCHIN E JACQUES WAINER
4.3. Ambientes eParticipativos sob a tica do modelo
3C de colaborao ........................................................................................ 92
CLEYTON SLAVIERO, ANA CRISTINA GARCIA E CRISTIANO MACIEL
Sesso 5: Recomendao
5.1. Creating a Blog Recommendation System Through
a Framework for Building Blog Crawlers. ........................................................ 97
RAFAEL FERREIRA LEITE, JEAN MELO, PATRICK BRITO, EVANDRO COSTA, RINALDO LIMA E FRED FREITAS
VIII Simpsio Brasileiro de Sistemas Colaborativos
- IV -
5.2. How to Know What Do You Want? A Survey of
Recommender Systems and the Next Generation ............................................104
ANGELINA ZIESEMER E JOO OLIVEIRA
5.3. Ativistas, passageiros, ocasionais e especialistas:
perfis de usurio na construo de um site de Q&A ........................................112
ADABRIAND FURTADO E NAZARENO ANDRADE
5.4 Content Recommendation Based on Data Mining
in Adaptive Educational Social Networks .......................................................120
MARCEL CARACIOLO
5.5. Social Tag Collaborative Recommendation:
Mining the Meaning .....................................................................................124
ANGELINA ZIESEMER E JOO OLIVEIRA
5.6. Proposta de Uso de Modelos de Objetivos na
Engenharia de Requisitos de Sistemas Colaborativos ......................................128
MARIANA MAIA, CARLA SILVA E STEPHANY VITORIO
Sesso 6: Disseminao de Conhecimento
6.1. Sensemaking na Passagem de Servio em Centros
de Terapia Intensiva .....................................................................................132
JIVAGO MEDEIROS, RODRIGO DE ANDRADE E ANA CRISTINA GARCIA
6.2. Gesto de contexto no levantamento colaborativo
de processos de negcio ...............................................................................139
DOUGLAS SILVA, RENATA ARAUJO E FLAVIA SANTORO.
6.3. MEK: Uma abordagem oportunstica para disseminao
colaborativa do conhecimento .......................................................................145
DIEGO S. SOUZA, GUILHERME FOGAA, PEDRO C. SILVEIRA, JONICE OLIVEIRA E JANO M. DE SOUZA
6.4. Co-designing Collaborative Museums: Combining
Ethnography and Co-creation Workshops .......................................................152
HELOISA MOURA, DBORA CARDADOR, KATIA CNEPA, WALLACE UGULINO, MARCOS BARBATO E HUGO
FUKS
Sesso 7: Sistemas Colaborativos Aplicados a Domnio
7.1. Remember Storytelling API: Um Framework Para o
Apoio a Recuperao de Histrias em Group Storytelling ................................161
BRUNO COSTA E RAFAEL ALVES
7.2. Aplicao da Abordagem Colaborativa em
Herbrios Virtuais .......................................................................................165
LUS ALEXANDRE ESTEVO DA SILVA, KLETO MICHEL ZAN, EDUARDO COUTO DALCIN, DJALMA ALVES DE
LIMA, MARCO ANICETO VAZ, FILIPE BRAIDA DO CARMO, GERALDO ZIMBRO E JANO M. DE SOUZA
VIII Simpsio Brasileiro de Sistemas Colaborativos
- V -
7.3. Supporting Group Exposure Therapy ......................................................169
LUIS CARRIO, LUS DUARTE, RICARDO PEREIRA, MARCO DE S, JOO FARIA, ISABEL S, GUSTAVO ZURITA
E NELSON BALOAIN
7.4 Evoluo dos Sistemas de Comunicao ...................................................173
LEANDRO CALVO, MARIANO PIMENTEL E HUGO FUKS
Workshop de Teses & Dissertaes
8.1. Modelo de plataforma conectivista para apoio a
aprendizagem socializada e colaborativa ........................................................178
LUCIANE DEUS, CARLA VERNICA MARQUES, CLAUDIA MOTTA, CARLO EMMANOEL OVEIRA
8.2. Evoluo dos Sistemas de Comunicao ..................................................184
LEANDRO CALVO, MARIANO PIMENTEL E HUGO FUKS
8.3. Um processo MDA para Linha de Produtos para
Sistemas Colaborativos ................................................................................190
CRISTIANA BISPO, JOS MARIA DAVID, RITA SUZANA MACIEL
8.4. Apoiando a reputao em programao em
par distribuda .............................................................................................196
DAVI CSAR NASCIMENTO, JOS MARIA DAVID
8.5. Clculo de Reputao em Redes Sociais ..................................................202
EDITH ZAIDA SONCO MAMANI, MARCO AURLIO GEROSA
8.6. Visualizaes para percepo em modelos
polticos de discusso ..................................................................................208
RAFAEL TAVARES, MARIANO PIMENTEL, RENATA ARAUJO
8.7. SmartMovie: Soluo Colaborativa de edio e.........................................214
compartilhamento de vdeo no SBTVD
EDUARDO DA SILVA, ROBERTA GOMES, RENATA S.S. GUIZZARDI
8.8. Colaborao Baseada em Cenrios: Contribuindo
Para Viabilizar a Aquisio de Conhecimento da Populao .............................220
SAMUEL APOLONIO, MARCOS BORGES, ADRIANA VIVACQUA
VIII Simpsio Brasileiro de Sistemas Colaborativos
- VI -
PREFCIO
Bem-vindos ao VIII Simpsio Brasileiro de Sistemas Colaborativos (SBSC)
realizado na charmosa cidade histrica de Paraty, no estado do Rio de Janeiro, de
5 a 7 de outubro de 2011. Este um evento que se firma cada vez mais como um
importante frum que propicia comunidade Acadmica Brasileira debater
questes, tcnicas, solues, inovaes e experincias sobre esta rea
multidisciplinar.
No exagero afirmar que o computador mudou o mundo. Mas pode-se afirmar
que os Sistemas Colaborativos como correios eletrnicos, redes sociais,
ambientes virtuais, videoconferncia, blog e outros causaram uma verdadeira
revoluo social e porque no dizer at uma mudana de hbitos e costumes. As
notcias, os fatos, informaes e acontecimentos correm em velocidade espantosa
na internet. Revolues econmicas so originadas de intensa comunicao
eletrnica. difcil reter segredos. O mundo, de fato, virou uma simples aldeia.
Nesse sentido, o evento entra firme nesse instigante universo e estamos
orgulhosos de apresentar um programa rico e diversificado que reflete o interesse
corrente da comunidade de sistemas colaborativos. A preparao desta
conferncia, que compreendeu as etapas de submisso de trabalho, anlise critica
e seleo, permitiu envolver pesquisadores de diversos estados brasileiros
incluindo AL, BA, MG, MT, PB, PE, PR, RJ, SP e SC. A realizao conjunta
com o CRWIG permitiu enriquecer nosso frum nacional com contribuies
internacionais, tanto em termos de artigos, quanto de palestrantes convidados.
A elevada qualidade dos artigos submetidos dificultou o processo seletivo.
Foram 41 artigos completos submetidos para os 16 artigos aceitos (39% de ndice
de aceitao).
O programa do SBSC2011 est organizado em sesses temticas que refletem as
principais reas de interesse da comunidade: interao social em sistemas
colaborativos, colaborao em micros-mundos, colaborao atravs de
dispositivos mveis, sistemas de recomendao, disseminao de conhecimento,
desenvolvimento de sistemas colaborativos, ferramentas e aplicativos. Os 16
artigos completos e 13 artigos resumidos esto agrupados e divididos nos trs
dias de conferncia.
Os trs dias de sesses tcnicas sero antecedidos por apresentaes de
palestrantes renomados. No primeiro dia, 5 de outubro, Dave Randal apresenta
sua viso sobre o papel da sociologia no projeto de sistemas colaborativos. No
VIII Simpsio Brasileiro de Sistemas Colaborativos
- VII -
segundo dia, Gerhard Fischer (Colorado University) apresenta a experincia de
seu grupo de pesquisa no entendimento e apoio cultura de participao.
Finalmente, fechando a conferncia, Clarisse de Souza (PUC-Rio) compartilha
sua viso sobre o papel do computador como meio de expresso.
O programa da conferncia tambm inclui um workshop de teses e dissertaes
que conta com oito apresentaes e dois cursos tutoriais: Introduo a Sistemas
Colaborativos e NoSQL no desenvolvimento de aplicaes Web
colaborativas. O primeiro deles oferece uma viso geral da rea e o segundo
trata de questes de implementao de sistemas colaborativos.
Durante o simpsio - que tem como Coordenador Geral o Professor Marcos da
Silva Borges, da Universidade Federal do Rio de Janeiro (UFRJ) - haver o
lanamento do livro Sistemas Colaborativos, ed. Campus/Elsevier, que vem
cobrir a lacuna de um livro texto para alunos de graduao. O livro foi formulado
por um conjunto representativo de pesquisadores da comunidade acadmica
brasileira.
Gostaramos de agradecer o apoio dos palestrantes por darem vida ao simpsio,
do comit de programa pelas revises, pelos rgos de fomento (CAPES, CNPq,
CGI, SBC) pelo apoio, pela equipe da UFF e UFRJ que tiveram papel
fundamental nos bastidores da elaborao do evento, e de todos que
voluntariamente ajudaram a fazer o SBSC2011 possvel. Estamos certos que a
conferncia prover excelentes oportunidades para compartilhar solues e
questes, tecnologias e modelos na rea de sistemas colaborativos, assim como
permitir a criao de laos de pesquisa entre os participantes.
Finalizando, para sediar o evento foi escolhida a bela e histrica cidade de
Paraty, cuja arquitetura colonial convida reflexo, ao aprendizado e porque no
dizer aventura intelectual, a novos caminhos. Que Paraty seja o palco onde
novos projetos e ideias surgiro para incrementar ainda mais os sociais e
populares Sistemas Colaborativos. A excelncia, o alto nvel dos palestrantes e
organizadores, workshops e minicursos confirmaro isso. Bem vindos a Paraty.
Aproveitem bem a conferncia, e bom trabalho!
Paraty, outubro de 2011.
Ana Cristina Bicharra Garcia
Pedro Antunes
COORDENAO DO COMIT
DE PROGRAMA SBSC 2011
VIII Simpsio Brasileiro de Sistemas Colaborativos
- VIII -
ORGANIZAO SBSC 2011

Coordenao do Comit de Programa
Ana Cristina Bicharra Garcia (UFF)
Pedro Antunes (Universidade Tcnica de Lisboa)

Organizao do Evento
Marcos Roberto da Silva Borges (NCE-UFRJ)

Coordenao de Minicursos
Alberto Raposo (PUC-Rio)

Coordenao do Workshop de Teses e Dissertaes
Marco Aurlio Gerosa (IME/USP)

Comit de Programa
Adriana Santarosa Vivacqua (DCC-IM-
UFRJ)
Ana Carolina Salgado (UFPE)
Ana Cristina Bicharra Garcia (UFF)
Alberto Castro (UFAM)
Alberto Raposo (PUC-Rio)
Carla Diacui Berkenbrock (UDESC)
Carlos Andr Guimares Ferraz (UFPE)
Celso Massaki Hirata (ITA)
Cesar Augusto Tacla (UTFPR)
Claudia Cappelli (UNIRIO)
Cleidson Ronald Botelho de Souza (UFPA)
Clver Ricardo G. de Farias
(FFCLRP/USP)
Clovis Torres Fernandes (ITA)
Cristiano Maciel (UFMT)
Denise Del Re Filippo (UERJ)
Edeilson Milhomem Silva
(CEULP/ULBRA e UFPE)
Flvia Bernardini (UFF)
Flvia Maria Santoro (UNIRIO)
Geraldo Bonorino Xexo (COPPE-UFRJ)
Hugo Fuks (PUC-Rio)
Ivan Luiz Marques Ricarte (UNICAMP)
Jacques Wainer (UNICAMP)
Jano Souza (UFRJ)
Jauvane Cavalcante de Oliveira (LNCC)
Jonice Oliveira (UERJ)
Jose Maria Nazar David (UFJF)
Kate Revoredo (UNIRIO)
Marco Aurlio Gerosa (IME/USP)
Marco Aurlio Souza Mangan (PUC-RS)
Mariano Pimentel (UNIRIO)
Melise Maria Veiga de Paula (UNIFAL-
MG)
Neide dos Santos (UERJ)
Pedro Porfirio Farias (Unifor)
Rafael Prikladnicki (PUC-RS)
Raquel de Oliveira Prates (UFMG)
Renata Mendes de Araujo (UNIRIO)
Roberta Lima Gomes (UFES)
Roberto Willrich (UFSC)
Seiji Isotani (CMU)
Sergio Crespo C. da Silva Pinto
(UNISINOS)
Daniel Paiva (ADDLabs)
Vaninha Vieira (UFBA)
VIII Simpsio Brasileiro de Sistemas Colaborativos
- IX -
Comit Gestor da Comisso Especial 2011
Mariano Pimentel (UNIRIO) - Coordenador
Claudia Lage Rebello da Motta (NCE-UFRJ) - Vice-coordenadora
Celso Massaki Hirata (ITA)
Denise Del Re Filippo (UERJ)
Marco Aurlio Gerosa (IME/USP)
Renata Mendes de Araujo (UNIRIO)
Vaninha V. Santos (UFBA)


Comit de Programa do Workshop de Teses e Dissertaes
Adriana Santarosa Vivacqua (UFRJ)
Alberto Raposo (PUC-Rio)
Celso Hirata (ITA)
Denise Del Re Filippo (UERJ)
Jose Maria Nazar David (UFJF)
Renata Arajo (UNIRIO)
Roberta Lima Gomes (UFES)
Vaninha Vieira (UFBA)


VIII Simpsio Brasileiro de Sistemas Colaborativos
- X -
PALESTRAS CONVIDADAS
Compreenso, Promoo e Apoio Cultura de Participao.
Gerhard Fischer (University of Colorado USA)

Diretor do Centro para a Aprendizagem ao Longo da Vida e Design. Professor
do Departamento de Cincia da Computao, e membro do Instituto de Cincia
Cognitiva, todos pertencentes a Universidade de Colorado (EUA).
Membro Human Computer Interaction Academy (CHI) e da Association for
Computing Machinery (ACM).
Suas linhas de pesquisa incluem: aprendizagem ao longo da vida, design, meta-
design, design de software, criatividade, criatividade social, inteligncia
distribuda, interao homem-computador, e design para todos (tecnologias de
apoio).

Computador como meio de expresso: novas falas na
contemporaneidade.
Clarisse Sieckenius de Souza (PUC-Rio)

Graduou-se como Tradutora e Intrprete de Conferncia pela PUC-Rio, onde
tambm obteve ttulo mestrado em Portugus e doutorado em Lingstica
Computacional.

Em 1988 ela entrou para o Departamento de Informtica da PUC-Rio, onde
comeou na rea de Interao Humano-Computador. Clarisse tambm
professora visitante em diversas universidades e institutos, como Stanford (com
Terry Winograd), University of Waterloo (com Tom Carey), e UMBC (com
Jenny Preece).

Em 1996, ela fundou SERG (Grupo de Pesquisa em Engenharia Semitica), que
desenvolve pesquisa de ponta em IHC, Engenharia Semitica e Lingstica
Computacional.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- XI -

S E S S O 1
Interao Social
Entendendo a Twitteresfera Brasileira
Fabrcio Benevenuto
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitrio
+55 31 3559-1692
benevenuto@gmail.com
Diego Silveira
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitrio
+55 31 3559-1692
dcotta15@msn.com
Thalisson Oliveira
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitrio
+55 31 3559-1692
thalissonvidal@hotmail.com
Leonardo Bombonato
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitrio
+55 31 3559-1692
leonardobombonato@gmail.com
Reinaldo Fortes
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitrio
+55 31 3559-1692
reifortes@yahoo.com.br
lvaro Pereira Jr.
DECOM - UFOP
Ouro Preto, MG, Brazil
Campus Universitrio
+55 31 3559-1692
alvarorpj@yahoo.com
ABSTRACT
Twitter has been constantly growing as an important sys-
tem where users discuss about everything, expressing opini-
ons, political view, sexual orientation, and even their mood
like happiness or sadness. Social networks are pointed as
places where users inuence and are inuenced by others,
being a perfect environment for word-of-mouth marketing,
advertisement, and political campaigns. In order to oer a
better understand of the use of Twitter in Brazil, this work
provides a wide characterization of Brazilian users in Twitter
as well as a deep understand of the content posted by Bra-
zilians in Twitter. We correlate Brazilian demographic data
with geographic data from the Twitter users to show that
some Brazilian states are underestimated in Twitter. Ad-
ditionally, we characterize the dierent linguistic patterns
adopted, we analyzed the most propagated URLs, and we
identied the most inuential Brazilian users in Twitter on
each Brazilian region.
RESUMO
O Twitter vem constantemente crescendo como um im-
portante sistema onde usuarios discutem sobre tudo, ex-
pressando opinioes, visao poltica, orientac ao sexual e ate
mesmo humor, como felicidade ou tristeza. Redes sociais
sao apontadas como locais onde usuarios inuenciam e sao
inuenciados por outros sendo, portanto, ambientes perfei-
tos para a realizac ao de marketing boca-a-boca, propagan-
das e campanhas polticas. Com o intuito de oferecer en-
tendimento sobre o uso do Twitter no Brasil, este trabalho
prove uma ampla caracterizac ao dos usuarios brasileiros no
Twitter e do conte udo postado por esses usu arios. Nos cor-
relacionamos dados demogracos brasileiros com dados da
localiza c ao dos usuarios do Twitter para mostrar que alguns
estados brasileiros estao subestimados nesse sistema. Alem
disso, nos caracterizamos os diferentes padroes lingusticos
adotados, analisamos as URLs mais propagadas, e identi-
camos os usuarios brasileiros mais inuentes no Twitter em
cada regi ao brasileira.
Categories and Subject Descriptors
H.3.5 [Online Information Services]: Web-based ser-
vices; J.4 [Computer Applications]: Social and behavio-
ral sciences
General Terms
Experimentation, Measurement
Keywords
Twitter, Microblog, Web 2.0
1. INTRODUO
Desde seu incio a Internet tem sido palco de uma serie de
novas aplicacoes incluindo a WWW e email. Atualmente,
a Web tem recebido uma nova onda de aplica c oes associa-
das ao crescimento e proliferac ao das redes sociais online.
V arios desses sistemas surgiram, incluindo redes de prossi-
onais (ex. LinkedIn), redes de amizade (ex. MySpace, Fa-
cebook e Orkut), e redes voltadas para o compartilhamento
de algum tipo especco de conte udo como mensagens cur-
tas (ex. Twitter), diarios e blogs (ex. LiveJournal), fotos
(ex. Flickr) e vdeos (ex. YouTube).
Em particular, o Twitter surgiu como uma plataforma so-
cial na Web onde usuarios discutem sobre tudo, expressando
opinioes, visao poltica, orientac ao sexual e ate mesmo con-
ceitos vagos como humor e felicidade. Alem disso, o Twitter
tem atrado a popularidade de jornais e celebridades, co-
nectados a usuarios comuns atraves de elos de seguidores e
seguidos pelos quais usuarios podem trocar informac oes. Es-
timativas sugerem que, atualmente, os 200 milhoes de usua-
rios ativos do Twitter postam cerca de 150 milhoes de tweets
(mensagens) contendo cerca de 23 milhoes de URLs diari-
amente [4, 25]. Segundo a comScore, o Brasil e o terceiro
pas onde o Twitter mais cresce atualmente [12].
Com tanta popularidade, o Twitter se tornou uma pla-
taforma para a descoberta de informa c ao em tempo real e
vem se mostrando uma importante ferramenta para a disse-
minac ao de notcias de ultima hora, tais como revoluc oes e
desastres. Alem disso, Google e Bing ja indexam tweets p u-
blicos como forma de prover busca por informac ao em tempo
real [23]. Como consequencia, o Twitter vem sendo alvo de
diversos sistemas relacionados `a descoberta de informac oes
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 1 -
em tempo real, como a identicacao autom atica de terremo-
tos a partir da analise de tweets [20], extrac ao de opnioes
de eleitores em relacao a candidatos a cargos polticos [24]
e ate mesmo como fonte de dados para o monitoramento de
casos de dengue no Brasil [14].
Apesar da comprovada aplicabilidade desses estudos e fer-
ramentas, pouco se sabe sobre o uso do Twitter no Brasil.
Como exemplo, nao sabemos se um determinado estado bra-
sileiro esta sub ou super representado no Twitter em rela-
c ao ` a sua demograa real, o que poderia ter profundo im-
pacto nos resultados reportados por ferramentas brasileiras
que monitoram eventos no Twitter. Pouco se sabe sobre o
uso do Twitter no Brasil com relac ao aos temas discutidos,
usuarios mais inuentes, sites mais divulgados no Twitter,
etc. Neste cenario, apesar de haver um grande interesse de
empresas brasileiras em divulgar produtos e realizar propa-
ganda boca-a-boca, pouco se sabe sobre quais estrategias
realmente seriam efetivas. Nesse contexto, acreditamos que
uma ampla an alise da twitteresfera poderia oferecer respos-
tas para v arias dessas questoes.
Este trabalho visa dar um primeiro passo nessa direc ao
de forma a realizar uma ampla analise do conte udo postado
por brasileiros no Twitter. Para isso, utilizamos uma co-
lec ao que possui 55 milhoes de usuarios do Twitter, todos
os elos de seguidores e seguidos (grafo com quase 2 bilhoes
de elos) e todos os tweets postados por esses usuarios (1.8
bilhoes de tweets). Dado que o Brasil e um pas tao ex-
tenso e diversicado, a localizac ao geogr aca das pessoas
pode ter um importante papel nos assuntos discutidos, nos
temas compartilhados e ate mesmo na felicidade e no hu-
mor das pessoas. Sendo assim, identicamos a localizac ao
geograca de usuarios do twitter para realizar uma an alise
sobre seu uso nas diferentes regioes brasileiras.
Nossas analises revelam que alguns estados brasileiros es-
t ao subestimados no Twitter em relacao a dados demogra-
cos, sendo que caractersticas socio-economicas desses esta-
dos parecem inuir no n umero de usu arios do Twitter. Alem
disso, nossas analises ainda revelam padroes lingusticos as-
sociados ao uso de microblogs no Brasil, identicando nao
so os termos mais frequentes nos tweets postados por bra-
sileiros, mas tambem aqueles associados a contextos felizes
e tristes. Nos ainda analisamos as URLs postadas por bra-
sileiros no Twitter e comparamos a popularidade dos stios
web mais populares no Twitter com a popularidade desse s-
tios na Web de maneira geral. Por ultimo, foram estudadas
diferentes abordagens para identicar os usu arios brasileiros
mais inuentes no Twitter e foi construdo um ranking de
usuarios inuentes para cada regiao do Brasil. Acreditamos
que a metodologia empregada nas an alises presentes nesse
trabalho pode guiar futuros trabalhos e ferramentas que pre-
tendem realizar algum tipo de monitoramento de dados ex-
trados de redes sociais online, em especial o Twitter.
O restante do trabalho est a organizado da seguinte forma.
A sec ao 2 descreve trabalhos relacionados. A sec ao 3 des-
creve a estrategia adotada para a coleta de dados da twitte-
resfera brasileira. A sec ao 4 apresenta dados da demograa
dos usuarios brasileiros do Twitter. A sec ao 5 apresenta
os termos mais frequentes utilizados pelos brasileiros, bem
como uma analise da polaridade desses termos. Em seguida,
a secao 6 analisa os domnios das URLs mais populares pro-
pagadas no Twitter. A sec ao 7 indentica os usuarios brasi-
leiros mais inuentes de cada regiao brasileira. Finalmente,
a sec ao 8 oferece conclusoes e direc oes para trabalhos futu-
ros.
2. TRABALHOS RELACIONADOS
O Twitter tem sido alvo de um grande n umero de traba-
lhos relacionados `as suas caractersticas topologicas e aspec-
tos da intera cao de seus usuarios. Kwak e colaboradores [16]
estudaram a topologia do Twitter, encontrando distribui c oes
que seguem leis de potencia para o n umero de seguidores e
seguidos, um diametro curto e baixa reciprocidade. Eles
ainda estudaram abordagens para ranquear usuarios basea-
das no uso do Pagerank calculado sobre a estrutura de se-
guidores e seguidos no Twitter. Mais recentemente, Cha
e colaboradores [10] mostraram que usuarios inuentes nao
sao necessariamente os usuarios mais seguidos do Twitter,
o que signica que a topologia do Twitter pode nao ser su-
ciente para capturar a inuencia dos usuarios. Scellato e
colaboradores [21] estudaram como informacao propagada
no Twitter pode ser explorada para melhorar sistemas de
caches de arquivos multimdia em redes de distribuic ao de
conte udo (CDNs - Content Distribution Networks). Como
resultados eles mostraram que o n umero de acertos em ca-
che pode ser aumentado em rela c ao a polticas de caches que
nao levam em considerac ao informac oes geogracas e soci-
ais. Rodrigues e colaboradores [18] proveem uma serie de
analises sobre os padroes de propagac ao de informacao en-
tre os usuarios do Twitter. Alem de quanticar o aumento
de audiencia de uma informac ao que retweets podem cau-
sar, eles identicaram caractersticas tpicas da estrutura das
arvores de propagac ao de informac ao nesse sistema. Final-
mente, a existencia de phishing [11] e spammers no Twitter
vem sendo constantemente reportada [17] e esforcos recen-
tes propuseram abordagens para a detec c ao de spammers no
Twitter [7].
Alguns trabalhos recentes analisaram a repercussao de
eventos especcos no Twitter. Em particular, Sakaki e co-
laboradores [20] mostraram o poder da informac ao dispo-
nibilizada em tempo real nas redes sociais online propondo
um mecanismo para deteccao de ocorrencias de terremotos
baseado em monitoramento do Twitter. A abordagem, que
consiste identicar tweets relacionados a terremotos por re-
giao, foi capaz de enviar alertas sobre terremotos mais ra-
pidamente do que agencias meteorologicas. Tumasjan e co-
laboradores [24] mostraram que opinioes identicadas em
tweets relacionados `a eleic ao federal alema foi capaz de re-
etir o sentimento poltico registrado fora das redes sociais.
Mais recentemente, uma analise geograca e temporal sobre
dengue no Twitter foi realizada por Gomide e seus colabora-
dores [14]. De forma complementar a esses trabalhos, nosso
trabalho oferece uma visao geral do uso do Twitter no Bra-
sil e nao analisa somente a repercussao de um determinado
evento.
3. METODOLOGIA DE MEDIO
Em um passado recente, redes sociais eram um domnio de
sociologos e antropologos, que utilizavam pesquisas e entre-
vistas com pequenos grupos de usuarios como ferramentas de
coleta de dados. Com o surgimento das redes sociais online,
a obten c ao de dados reais em larga escala se tornou possvel,
e pesquisadores de diversas areas da computa c ao comecaram
a realizar coletas de dados. Entretanto, a coleta de conte udo
criado por usu arios envolve um grande n umero de desaos.
Esta sec ao apresenta a metodologia adotada para a obten-
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 2 -
cao dos dados utilizados em nossas medic oes. Inicialmente,
a sec ao 3.1 descreve a estrategia adotada para coletar da-
dos do Twitter. Em seguida, a sec ao 3.2 discute a coleta
da localizacao geogr aca de usuarios do Twitter, de forma
a permitir a realizac ao de analises restritas `a twitteresfera
brasileira. A sec ao 3.3 descreve o processo utilizado para
identicar tweets felizes, tristes ou neutros. Finalmente, a
sec ao 3.4 discute possveis limitacoes dos dados obtidos.
3.1 Coleo de dados do Twitter
Esta sec ao descreve brevemente a estrategia utilizada para
construir uma cole c ao de dados do Twitter. Podemos aces-
sar cada usuario do sistema, visto que o Twitter atribui um
identicador (ID) numerico e sequencial para cada usuario
cadastrado [6]. Como novos usuarios recebem um identi-
cador sequencial, podemos percorrer todos os IDs, sem ter
que vericar a lista de amigos desses usuarios em busca de
novos IDs para coletar.
Recentemente, nos realizamos uma coleta do Twitter se-
guindo essa estrategia. Foi solicitado aos administradores
do Twitter a permissao para realizar uma coleta em larga
escala. Em resposta, eles adicionaram os enderecos IPs de
58 maquinas sob nosso controle em uma lista branca, com
permissao para coletar dados. Cada uma das 58 m aquinas,
localizadas no Max Planck Institute for Software Systems
(MPI-SWS), na Alemanha
1
, teve permissao para coletar da-
dos a uma taxa maxima de 20 mil requisic oes por hora. Uti-
lizando a API do Twitter, nosso coletor investigou todos os
80 milhoes de IDs de forma seq uencial, coletando todas as
informac oes p ublicas sobre esses usuarios, bem como seus
elos de seguidores e seguidos e todos os seus tweets. Dos 80
milhoes de contas inspecionadas, encontramos cerca 55 mi-
lhoes em uso. Isso acontece porque o Twitter apaga contas
inativas por um perodo maior do que 6 meses. No total,
coletamos 54.981.152 milhoes de usuarios, todos os elos de
seguidores e seguidos, que correspondem a 1.963.263.821
elos unicos e todos os tweets postados por esses usuarios,
em um total de 1.755.925.520 tweets. Ao inspecionar as
listas de seguidores e seguidos coletadas, nao encontramos
nenhum identicador acima dos 80 milhoes inspecionados,
sugerindo que coletamos todos os usuarios do sistema na
epoca. Para uma descric ao mais detalhada desses dados e
das tecnicas empregadas para a realizac ao da coleta desses
dados, recomendamos ao leitor as seguintes referencias [10,
6].
3.2 Coleta de informaes geogrcas
Para identicarmos usuarios e tweets brasileiros precisa-
mos primeiramente identicar a localizac ao e origem dos
tweets nos dados coletados. A localizac ao dos usuarios do
Twitter coletados aparece na forma de texto livre e freque-
mente contem localizac oes invalidas, tais como Marte ou
minha casa. Alem disso, e muito comum usuarios abrevia-
rem localizac oes como BH para Belo Horizonte, Sampa para
Sao Paulo, e Floripa para Florianopolis. A API do Twit-
ter prove a latitude e a longitude apenas dos usuarios que
utilizam aparelhos moveis com servico GPS e permitem o
compartilhamento desse tipo de informac ao. Esses usuarios
correspondem a uma frac ao muito pequena dos usuarios, es-
pecialmente no perodo em que os dados foram coletados.
1
Esta coleta foi realizada pelo primeiro autor desse trabalho
durante uma visita ao MPI-SWS
Como forma de realizar uma estrategia sistematica de se
obter a localiza c ao dos usuarios, foi utilizada a API do Go-
ogle Geocoding para traduzir endere cos em formato texto
em coordenadas geogr acas (latitute e longitute). A API
do Google Geocoding e utilizada por diversos servicos do
Google que utilizam mapas e tem como vantagem identi-
car corretamente localizac oes abreviadas, como BH, Sampa
e Floripa. Essa API prove um mecanismo direto de se ob-
ter as coordenadas geogr acas, o pas, o estado e a cidade
a partir de uma localiza c ao fornecida em texto atraves de
uma requisic ao HTTP [15]. Nos casos em que o usuario for-
neceu diretamente coordenadas geogr acas atraves do uso
de aparelhos moveis com GPS, o Google Geocoding foi uti-
lizado apenas para buscar o nome da cidade e do pas desses
usuarios.

E importante ressaltar que a API do Google Geocoding


limita o n umero maximo de requisic oes por IP a 200 requi-
sic oes por hora. Essa taxa torna difcil a obten cao da loca-
lizac ao de todos os usuarios coletados que correspondem a
quase 55 milhoes de usuarios. Sendo assim, nos restringimos
a coleta aos usuarios cujo fuso hor ario fosse um dos adota-
dos no Brasil. Alem disso, foi implementado um sistema
de cache de localiza coes, de forma a evitar que duas locali-
za c oes identicas fossem requisitas `a API do google Geoco-
ding. Dos 923.232 usuarios investigados, foram identicados
198.714 usu arios com localizacao detalhada no nvel de ci-
dades. No total esses usuarios postaram 29.013.854 tweets.
Esses usuarios e tweets correspondem ao conjunto de dados
que analisaremos nas proximas sec oes.
3.3 Identicao de sentimentos
Emoticons representam uma excelente forma de capturar
emoc oes expressas no texto, pois eles capturam a emoc ao do
escritor que inclui uma expressao f acil utilizando caracteres
ASCII. N os denimos tres categorias para classicar tweets
de acordo com a presen ca de emoticons: positivo, negativo
ou neutro. A tabela 1 apresenta os emoticons utilizados, o
n umero de tweets em cada categoria. Note que nos classi-
camos somente os tweets com localizac ao geogr aca, que
sao os que utilizaremos em nossas analises.
3.4 Limitao dos dados
Apesar do conjunto de dados coletado nos permitir a opor-
tunidade unica de estudar as caractersticas da twitteresfera
brasileira, esses dados possuem algumas limitac oes. Pri-
meiro, nossa analise e restrita ao perodo coletado do Twit-
ter, que contem dados desde a criac ao do Twitter em 2006
ate Julho de 2009, que e um perodo no qual o Twitter era
muito mais popular nos EUA. Segundo, para examinar a lo-
calizac ao geogr aca dos usuarios, nos consideramos que cada
usuario possui uma unica localizac ao xa, desconsiderando
que usuarios podem postar tweets de diferentes localidades.
Finalmente, 21,5% dos usuarios investigados tiveram suas
Categoria Emoticons Tweets
Positivo :-) :D :) =D =) 2.244.628
Negativo :-( :( D: ): T.T =\~ :\~ :( =[
T T :-( :,( ]= )-: :,-( ),: :-(
=-[ :-,(
468.903
Neutro 26.300.323
Tabela 1: Categorias de tweets de acordo com a pre-
sen ca de emoticons
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 3 -
localizac oes identicadas.
4. USURIOS E TWEETS POR REGIO
Nesta sec ao apresentamos uma analise do n umero de usua-
rios do Twitter com relac ao `a populacao de cada estado e
`a proporc ao da populac ao com acesso ` a internet, a partir
de dados do Instituto Brasileiro de Geograa e Estatstica
(IBGE) [2]. A Tabela 2 apresenta o n umero de usuarios
do Twitter, o n umero de tweets, a populac ao em 2007 e o
percentual da popula c ao com acesso ` a internet (2008), para
cada um dos estados brasileiros e agregados por regiao. As
duas ultimas colunas apresentam, respectivamente, a media
de tweets enviados por usuario para cada estado (usu arios
ativos: razao entre o n umero de tweets e o n umero de usua-
rios), e o percentual da populac ao que usa o Twitter (razao
entre o n umero de usuarios e a populacao de cada estado).
Observando o percentual da popula c ao que usa o Twitter,
vemos que as unidades da federac ao que mais usam o Twitter
sao Distrito Federal, Sao Paulo e Rio de Janeiro, com 0,21%
da populacao, seguidos pelos estados do Sul (Santa Catarina,
Parana e Rio Grande do Sul), todos com 0,11%. Em geral,
o Norte e a regiao que menos usa o Twitter, seguido pela
regiao Nordeste e logo pela regiao Centroeste.
Observando a coluna com a media de tweets enviados por
usuario, de forma geral vemos que as unidades da federac ao
com mais usuarios em proporc ao `a populac ao sao tambem
as unidades com os usuarios mais ativos. Este dado pode ser
consequencia do proprio fato do uso ser maior entre as pes-
soas no estado, uma vez que ha inuencia do meio social que
a pessoa esta inserida no comportamento da pessoa (neste
caso o comportamento e usar de forma ativa o Twitter como
ferramenta social). Apesar dessa observac ao geral, ela nao e
uma regra. Ha estados como Pernambuco, Ceara, Alagoas,
Piau e Esprito Santo que possuem alto ndice de usuarios
ativos, mas poucos usuarios em proporc ao.
Observamos que nao ha uma correlac ao entre o n umero de
usuarios e a populacao dos estados. Por exemplo, varios es-
tados da regi ao norte brasileira praticamente nao possuem
usuarios identicados em nossa base de dados. A Bahia
possui a maior populacao da regiao nordeste e a quarta po-
pulac ao do Brasil, mas e um dos estados que menos usam o
Twitter no Brasil. Em contrapartida, o Distrito Federal tem
uma baixa popula c ao e uma grande proporc ao de usuarios
no Twitter, ao passo que Sao Paulo tem a maior popula c ao
do Brasil e grande proporc ao de usuarios no Twitter.
Com relac ao ` a frac ao da populac ao com acesso ` a internet,
h a alguma relac ao com o uso do Twitter, mas nao e uma
regra. Mais de 56% da populacao do Distrito Federal tem
acesso `a Internet (ndice bem maior que dos demais esta-
dos), e e um dos que mais usam o Twitter. Entre os demais
estados que mais usam o Twitter (Sao Paulo, Rio de Ja-
neiro, Santa Catarina, Parana e Rio Grande do Sul), todos
possuem bom ndice de pessoas com acesso `a internet, com-
parando com os demais estados brasileiros e com a media
nacional (32,7%). Por outro lado, ha estados que tem boa
taxa de acesso `a internet, mas baixo uso do Twitter, como
Rio Grande do Norte e Mato Grosso do Sul.
Estudamos ainda se existe relac ao entre o uso do Twitter
e a renda media mensal familiar dos estados e o PIB dos es-
tados, mas nenhuma relac ao foi observada. Por este motivo
nao apresentamos estes dados na Tabela 2.
5. TERMOS FREQUENTES
Nesta sec ao faremos uma analise dos termos mais frequen-
tes encontrados em tweets. A gura 1 apresenta a nuvem
dos 150 termos mais frequentes, sem qualquer ltro (inclu-
sive stop words foram mantidas).
Figura 1: Nuvem dos termos mais frequentes em
tweets
Alguns padroes interessantes foram observados na lista
dos termos mais frequentes (considerando os 300 termos
mais frequentes). Primeiramente, vemos que ha um grande
n umero de substantivos relacionados a tempo de alguma
forma, ou adjuntos adverbiais de tempo, como: dia, agora,
hoje, noite, tempo, semana, amanha, sempre, hora, tarde,
ontem, nunca, anos, dias, sexta, ano, horas (nesta ordem
de frequencia). O Twitter parece ser uma ferramenta usada
para descrever fatos ou eventos que aconteceram recente-
mente, estao acontecendo, ou vao acontecer, o que justica
a forte presenca de termos indicadores de tempo.
Observamos tambem que o texto nos tweets sao em geral
informais, com a presenca de um conjunto de abreviac oes
comuns entre os usuarios, como: d (de), q (que), p (para),
vc (voce), ta (est a), pq (porque), gt (gente), to (estou), hj
(hoje), s (sem), tava (estava), rs (risos), eh (e), tb (tam-
bem), tbm (tambem) (nesta ordem de frequencia). Ainda,
h a um conjunto de termos bem informais que muitas vezes
n ao fazem parte do dicionario da lngua portuguesa, mas
sao usados com frequencia por um grande n umero de usua-
rios, como: so, cara, a, hahaha, ne, haha, legal, ah, hehehe,
hahahaha, hehe, oi, xd. Das formas utilizadas para expres-
sar um sorriso, ou uma risada, vemos que hahahae a mais
usuada, e que nao h a um padr ao unico, sendo usadas ainda
as expressoes: haha, hehehe, hahahaha, hehe, rs, xd.
A seguir analisamos os termos relacionados a tweets com
polaridade positiva e relacionados a tweets com polaridade
negativa. Dois conjuntos com os 1.000 termos mais frequen-
tes foram gerados: um somente dos tweets com polaridade
positiva e outro somente dos tweets com polaridade nega-
tiva. A diferenca destes conjuntos foi usada para gerar duas
listas de termos: uma dos termos de tweets com polaridade
positiva que nao ocorrem com frequencia em tweets com
polaridade negativa, e outra dos termos de tweets com pola-
ridade negativa que nao ocorrem com frequencia em tweets
com polaridade positiva. As nuvens dos 150 termos mais
frequentes destas listas sao apresentadas nas guras 2 e 3,
respectivamente.

E interessante observar os termos que ocorrem em tweets


com polaridade positiva que nao ocorrem com frequencia
em tweets com polaridade negativa, como: obrigado, adorei,
viva, otima, boas, bacana, bastante, beleza, sucesso, indico,
bons, rir, gostar, recomendo, concordo, bonito, divertido,
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 4 -
N umero de N umero de Populacao Percentagem do uso Usuarios Perc. da popula cao
Estado usuarios Tweets 2007 de internet 2008 ativos que usa o Twitter
Rondonia 0 0 1.453.756 31,0 0,0 0,000
Tocantins 596 72.500 1.243.627 31,3 121,6 0,047
Amapa 267 31.066 587.311 31,3 116,4 0,045
Para 1.814 206.048 3.641.395 23,9 113,6 0,049
Amazonas 935 120.375 3.221.939 30,2 128,7 0,029
Roraima 59 1.401 7.065.573 35,3 23,7 0,001
Acre 304 18.139 655.385 29,4 59,7 0,046
Regiao Norte 3.975 449.529 17.868.986 30,3 113,1 0,022
Alagoas 809 113.172 3.037.103 17,8 139,9 0,026
Pernanbuco 4.569 722.882 8.485.386 25,6 158,2 0,053
Rio Grande do Norte 1.956 263.550 3.013.740 43,2 134,7 0,064
Bahia 4.034 488.144 14.080.654 26,9 121,0 0,028
Paraba 1.710 223.584 3.641.395 26,4 130,8 0,047
Maranhao 1.010 86.098 6.118.995 20,2 85,2 0,016
Sergipe 716 68.274 1.939.426 29,3 95,4 0,036
Ceara 3.710 554.833 8.185.286 25,8 149,6 0,045
Piau 838 119.015 3.032.421 20,2 142,0 0,027
Regiao Nordeste 19.352 263.9552 51.534.406 26,2 136,4 0,037
Santa Catarina 6.527 999.253 5.866.252 40,2 153,1 0,111
Rio Grande do Sul 12.114 1.671.759 10.582.840 36,3 138,0 0,114
Parana 11.774 1.685.625 10.284.503 40,2 143,2 0,114
Regiao Sul 30.415 4.356.637 26.733.595 38,9 143,2 0,113
Sao Paulo 84.584 12.895.459 39.827.570 43,9 152,5 0,212
Rio de Janeiro 33.247 4.953.433 15.420.375 40,9 149,0 0,215
Minas Gerais 1.5118 2.100.818 19.273.506 33,1 139,0 0,078
Esprito Santo 1.714 241.625 3.351.669 35,3 141,0 0,051
Regiao Sudeste 134.663 20.191.335 77.873.120 38,3 149,9 0,172
Distrito Federal 5.327 867.362 2.455.903 56,1 162,8 0,216
Mato Grosso 824 78.166 2.854.642 33,8 94,9 0,028
Mato Grosso do Sul 817 85.244 2.265.274 39,2 104,3 0,036
Goi as 3.341 346.029 5.647.035 35,2 103,6 0,059
Regiao Centroeste 10.309 1.376.801 13.222.854 41,1 133,6 0,078
Total 198.714 29.013.854 187.232.961 32,7 146,0 0,106
Tabela 2: Dados de usuarios e tweets do Twitter relacionados com dados do IBGE
Figura 2: Nuvem dos termos que ocorrem em twe-
ets com polaridade positiva que nao ocorrem com
frequencia em tweets com polaridade negativa
engracado, especial, parabens, querida, gracas. Tambem e
interessante observar os termos que ocorrem em tweets com
polaridade negativa que nao ocorrem com frequencia em twe-
ets com polaridade positiva, como: triste, droga, morreu, te-
dio, chorar, morrer, infelizmente, doente, sozinha, cansada,
raiva.
6. URLS MAIS PROPAGADAS
Mensagens no Twitter podem conter no m aximo 140 ca-
racteres. Tal restricao de espaco servicos tem tornado encur-
Figura 3: Nuvem dos termos que ocorrem em twe-
ets com polaridade negativa que nao ocorrem com
frequencia em tweets com polaridade positiva
tadores de URLs cada vez mais populares. Esses sistemas
funcionam da seguinte forma. Eles traduzem uma URL (que
pode consistir de centenas de caracteres) em uma nova URL,
tipicamente com poucos caracteres que retorna os c odigos
HTTP 301 ou 302 de redirecionamento para a URL longa
original [5]. Por exemplo, o link http://topics.nytimes.
com/top/news/business/companies/twitter/ pode ser en-
curtado para http://nyti.ms/1VKbrC pelo bit.ly [3], que ira
redirecionar qualquer requisic ao para o stio Web original.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 5 -
Para estudarmos os principais domnios propagados no
Twitter, precisamos obter a versao longa de todas as URLs
encurtadas encontradas em nossa base. Para isso, desen-
volvemos uma ferramenta capaz de resolver a URL de um
tweet, enviando uma requisic ao ao sistema encurtador e re-
solvendo a URL. Se o domnio obtido fosse diferente, nos
consideramos a URL no tweet ser uma URL encurtada, se-
nao, consideramos a URL como longa. Foram encontrados
30 servicos encurtadores de URL nos dados de usuarios bra-
sileiros, sendo que os servicos tinyurl.com e bit.ly sao os mais
populares com mais de 90% do total de URLs encurtadas.
Twitter Domnio Alexa
1 twitpic.com 47
2 blip.fm 2654
3 lolquiz.com -
4 youtube.com 3
5 plurk.com 5141
6 .im -
7 tumblr.com 34
8 ickr.com 36
9 twitter.com 13
10 meadd.com 695
Tabela 3: Ranking de domnios no Twitter e suas
respectivas popularidades no ranking do alexa.com
Com base nesses dados, podemos vericar se as URLs mais
compartilhadas por brasileiros no Twitter sao URLs de do-
mnios populares na Web brasileira. Como forma de compa-
rac ao, nos listamos os domnios brasileiros mais populares
segundo o stio Web alexa.com [1], que mede o n umero de
acessos recebidos por diversos stios web. A tabela 3 apre-
senta os domnios mais populares das URLs propagadas por
brasileiros no Twitter e suas respectivas posicoes no ran-
king do alexa.com. De forma similar, a tabela 4 mostra o
ranking dos domnios mais populares brasileiros segundo o
alexa.com e suas respectivas posicoes no ranking dos dom-
nios mais propagados no Twitter.
Podemos fazer varias observac oes interessantes a partir
dessas tabelas. O ranking do alexa.com e bastante diferente
do ranking dos domnios propagados no Twitter. Em par-
ticular, o domnio mais popular propagado nos tweets de
brasileiros e o twitpic.com, um sistema para permite o com-
partilhamento de fotos. No alexa.com, o stio web com maior
n umero de acessos e do Google, que aparece muito pouco nos
dados do Twitter. Ao observarmos os 100 domnios mais
populares no Twitter notamos uma predomin ancia de do-
mnios de stios web associados a notcias, entretenimento e
redes sociais. Apenas um stio web de compras aparece no
ranking, na posic ao 97. No ranking do alexa.com, alem de
redes sociais, encontramos uma predominancia de sistemas
de busca, servicos como o stio do banco Ita u na posic ao 23
e ministerio da fazenda na posi c ao 41, alem de dezessete sis-
temas de compra online, incluindo Mercado livre na posic ao
17, buscape na posicao 30 e submarino na posic ao 34.
7. USURIOS INFLUENTES NO BRASIL
Usuarios inuentes possuem uma func ao vital em qual-
quer ecossistema, devido `a associa c ao da noc ao inuencia `a
noc ao de poder de formar a opiniao de outras pessoas, afe-
tando funcionalidades da sociedade, como por exemplo, em
quem eleitores votam [8] ou como uma determinada moda se
espalha [13]. Apesar de amplamente estudada em diferentes
Alexa Domnio Tweets
1 google.com.br -
2 google.com 78
3 youtube.com 4
4 facebook.com 65
5 uol.com.br -
6 orkut.com.br 16
7 live.com -
8 globo.com 11
9 blogspot.com -
10 yahoo.com -
Tabela 4: Ranking dos domnios no alexa.com e suas
respectivas popularidades no ranking do Twitter
areas, tais como sociologia, marketing e ciencia poltica [19],
a no c ao de inuencia nunca foi quanticada nesses contextos
por se tratar de um conceito vago e difcil de ser quanti-
cado. Entretanto, com a enorme popularidade do Twitter,
varias ideias conitantes e algoritmos para a identica c ao de
usuarios inuentes no Twitter vem surgindo.
V arias maquinas de busca, incluindo o Google, estimam
a importancia dos tweets baseados no Pagerank na tenta-
tiva de retornar tweets mais importantes como resultado
de buscas [22]. O PageRank e um algoritmo interativo que
assinala um peso numerico para cada nodo com o proposito
de estimar sua importancia relativa no grafo. O algoritmo
foi inicialmente proposto por Brin e Page [9] para ordenar
resultados de busca do prot otipo de maquina de busca da
Google. A intuic ao por tr as do PageRank e que um usuario
do Twitter e importante se existem muitos usuarios o se-
guindo ou existem outros usuarios importantes o seguindo.
A equacao que calcula o PageRank (PR) de um usuario i,
PR(i), e denida da seguinte forma:
PR(i) = (1 d) +d
X
vS(i)
PR(v)
N
v
(1)
onde S(i) e o conjunto de usu arios que seguem i, N
v
deno-
mina o n umero de arestas que saem do nodo v, e o parametro
d e um fator que pode ter valor entre 0 e 1. Em nossos expe-
rimentos, o Pagerank foi computado para o grafo completo
do Twitter e nao somente para os usu arios brasileiros, visto
que o uso de uma amostra do grafo para o c alculo do Page-
rank pode alterar signicativamente os resultados. O valor
do par ametro d utilizado foi o valor padrao de 0,85, denido
em [9].
Apesar de sua imensa aplicabilidade, o Pagerank ainda
n ao foi rigorosamente vericado como metrica capaz de cap-
turar os usu arios mais relevantes do Twitter. Algumas ce-
lebridades, como Barack Obama, sao seguidos por muitos
usuarios, mas tambem os seguem de volta tornado esses
usuarios importantes e, possivelmente afetando o uso do
Pagerank como medida de inuencia. Trabalhos recentes
mostraram a existencia de um grande n umero de spammers
no Twitter que atuam seguindo automaticamente de usua-
rios no Twitter na tentativa de ser seguido de volta e ter
sua inuencia aumentada [7]. Alem disso, Cha e seus co-
laboradores [10] mostraram que usuarios que possuem mui-
tos seguidores no Twitter nao sao necessariamente usuarios
muito retweetados. O n umero de retweets funciona como
um indicador da habilidade de um usuario gerar conte udo
com valor suciente para ser passado para a frente. Alguns
stios web com proposito comercial tem ganhado populari-
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 6 -
dade ao prover o Retweetrank de usuarios comuns, como
e o caso do www.retweetrank.com. Sendo assim, alem do
Pagerank, vamos considerar como medida de inuencia o
retweetRank, que e o ranking de usuarios mais retweetados.
Para isso, foi preciso compararmos cada tweet postado pelos
usuarios brasileiros com os tweets postados posteriormente
pelos seus seguidores na tentativa de identicar potenciais
retweets. Um retweet ocorre quando um usuario posta uma
mensagem com os seguintes padroes RT @usuario ou via
@usuario ao nal do tweet.
A tabela 5 mostra os 10 usuarios brasileiros mais bem
ranqueados de acordo com Pagerank e suas respectivas po-
sic oes de acordo com o Retweetrank. De maneira seme-
lhante, a tabela 6 mostra o ranking dos usuarios de acordo
com Retweetrank e suas respectivas posic oes de acordo com
o Pagerank. Podemos fazer interessantes observac oes sobre
essas tabelas. Primeiro, podemos notar que o usuario com
maior Pagerank e o usuario @manomenezes, que e o perl
do atual tecnico da selecao brasileira de futebol, Mano Me-
nezes.Entretanto, o usuario mais retweetado e o jornalista
Marcelo Tas (@marcelotas), apresentador do programa de
televisao CQC. Apesar de muito seguido, o tecnico Mano
Menezes aparece apenas na posic ao 64 do ranking dos mais
retweetados. De fato, usuarios do Twitter podem estar mais
interessadas em receber em primeira mao as informac oes de
um tecnico de futebol, mas nao necessariamente repassa-las
aos seus seguidores. Outra importante observac ao e rela-
cionada ao grande n umero de artistas brasileiros entre os
mais inuentes, especialmente aqueles ligados a programas
de humor.
Pagerank Usuario Retweetrank
1 manomenezes 64
2 marcelotas 1
3 DaniloGentili 13
4 marcoluque 26
5 ivetesangalo 91
6 kibeloco 2
7 rodrigovesgo 20
8 christianpior 6
9 OscarFilho 22
10 andreolifelipe 100
Tabela 5: Posi cao dos 10 usuarios com maior Page-
rank no ranking do Retweetrank
Retweetrank Usuario Pagerank
1 marcelotas 2
2 kibeloco 6
3 rosana 12
4 Cardoso 58
5 melhoresfrases 17
6 christianpior 8
7 millorfernandes 15
8 esoterismo 209
9 abduzeedo 33
10 malvados 55
Tabela 6: Posi cao dos 10 usuarios com maior Retwe-
etrank no ranking do Pagerank
Apesar de oferecer uma visao geral sobre os usuarios mais
inuentes no brasil, nossas analises apontam usuarios da
twitteresfera brasileira com maior potencial de inuenciar
um grande n umero de pessoas. Entretanto, inuencia pode
variar de acordo com as diferentes regioes brasileiras, espe-
cialmente em um pas tao vasto como o Brasil. De fato,
empresas ligadas a estrategias de marketing boca-a-boca no
Brasil podem estar mais interessadas em identifcar usuarios
que sejam inuentes locais em determinadas regioes do que
usuarios ja famosos na televisao e que sao consequentemente
populares no Twitter.
Como forma de identicar tais usuarios, a Tabela 7 mos-
tra os 10 usuarios mais inuentes de cada regiao do Brasil de
acordo com o Pagerank e sua posic ao no ranking geral. De
maneira similar, a Tabela 8 mostra os 10 usuarios mais inu-
entes de cada regiao do Brasil de acordo com o Retweetrank
e sua posic ao no ranking geral. Note que alem das cele-
bridades, a maioria concentrada na regiao sudeste, nossas
rankings de usuarios inuentes reveleram a existencia de in-
uentes locais em diversas regioes. Como exemplo, o usuario
@diariodopara, na regiao norte aparece na posi c ao 1505 no
ranking brasileiro do Pagerank, mas e o decimo usuario mais
inuente de toda a regi ao Norte, tendo uma atua c ao ainda
mais importante no estado do Para. Ja no caso de retweets,
o usuario @Cardoso se mostrou mais retweetado ate mesmo
do que o usuario @marcelotas na regiao nordeste, que apa-
rece em primeiro lugar nos demais estados. Tais observac oes
sugerem que algumas regioes podem possuir inuentes locais
que, dependendo da regiao, podem representar uma melhor
op c ao para a realiza c ao de uma ac ao de marketing e propa-
ganda.
8. CONCLUSES
Este trabalho apresenta uma ampla an alise geograca dos
usuarios brasileiros no Twitter e de seus tweets. Nossas
an alises revelam que alguns estados brasileiros estao subes-
timados no Twitter em relacao a dados demogracos, sendo
que caractersticas socio-economicas desses estados parecem
inuenciar no n umero de usuarios do Twitter. Alem disso,
nossas analises ainda revelam padroes lingusticos associa-
dos ao uso de microblogs no Brasil, identicando palavras
geralmente associadas a contextos felizes e tristes. Nossas
analises revelam as URLs mais postadas por brasileiros no
Twitter e mostra que essas nao s ao as mais acessadas na
web de maneira geral. Por ultimo, identicamos os usuarios
brasileiros mais inuentes no Twitter e mostramos que o
ranking de inuencia varia em diferentes regioes brasileiras.
Como ultima contribui c ao, cabe ressaltar que a metodolo-
gia aqui empregada em diversas analises pode guiar futuras
analises relacionadas ao Twitter.
Como trabalhos futuros, pretendemos desenvolver uma
ferramenta de busca, de forma a permitir que usuarios web
possam extrair informac oes de nossa base de dados. Em ou-
tras palavras pretende-se desenvolver as bases de um sistema
que permita que interessados possam entender a repercussao
e a opiniao de usuarios do Twitter sobre eventos ocorridos
no passado em diferentes localizac oes geogracas. Exemplos
de cen arios que esperamos identicar com essa ferramenta
sao: (i) epidemia de dengue afeta negativamente o humor
das pessoas, onde pela nuvem de tags poderemos ver no-
mes e entidades criticadas; (ii) a vitoria do Rio de Janeiro
como sede das Olimpadas de 2016 causou enorme alegria
aos brasileiros; vitoria de um determinado time de futebol
gera alegria em uma regiao e infelicidade em outra; (iii) quais
as regioes receberam positivamente/negativamente o lanca-
mento de um novo produto.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 7 -
Top Norte Top Nordeste Top Centro-oeste Top Sudeste Top Sul
DiscoLee (151) ivetesangalo (5) bfeneto (18) manomenezes (1) abduzeedo (33)
talivale (767) sigacl (30) passagensaereas (37) marcelotas (2) federicodevito (43)
jerilsonduarte (836) comunicadores (66) WelderMM (62) DaniloGentili (3) piangers (46)
DEZMinutos (903) murilogun (96) oab brasil (167) marcoluque (4) garotasemo (75)
educhaves (1051) gilbertogil (124) consumidor gov (227) kibeloco (6) lucasfresno (82)
asttro (1093) scheilacarvalho (138) brazilians (238) rodrigovesgo (7) nanypeople (91)
joaopedrosenado (1122) m camelo (168) agenciabrasil (301) christianpior (8) bobagento (102)
jenizambiazzi (1255) LisiSilveira (187) AlonFeuerwerker (431) OscarFilho (9) azaghal (106)
pedrox (1451) Danosse (230) jorgeemateus (450) andreolifelipe (10) laumundial (102)
diariodopara (1505) veramartins (248) comediamm (464) oceara (11) anderssauro (164)
Tabela 7: Top inuentes de cada regiao de acordo com o Pagerank e sua posicao no ranking geral
Top Norte Top Nordeste Top Centro-oeste Top Sudeste Top Sul
pedrox (306) Cardoso (4) marcelotas (1) marcelotas (1) marcelotas (1)
Cardoso (4) marcelotas (1) kibeloco (2) rosana (3) Cardoso (4)
kibeloco (2) rosana (3) Cardoso (4) kibeloco (2) kibeloco (2)
marcelotas (1) kibeloco (2) rosana (3) Cardoso (4) rosana (3)
rosana (3) melhoresfrases (5) melhoresfrases (5) melhoresfrases (5) millorfernandes (7)
diariodopara (838) christianpior (6) christianpior (6) christianpior (6) melhoresfrases (5)
melhoresfrases (5) millorfernandes (7) millorfernandes (7) millorfernandes (7) tplayer (25)
christianpior (6) comunicadores (11) inagaki (15) malvados (10) tiagomx (103)
millorfernandes (7) malvados (10) malvados (10) esoterismo (8) christianpior (6)
paolelli (1022) inagaki (15) samara7days (16) comunicadores (11) malvados (10)
Tabela 8: Top inuentes de cada regiao de acordo com o Retweetrank e sua posicao no ranking geral
9. AGRADECIMENTOS
O presente trabalho foi realizado com o apoio do UOL
(www.uol.com.br), atraves do Programa UOL Bolsa Pes-
quisa, processo n umero 20110210152501.
10. REFERNCIAS
[1] Alexa, the web information company.
http://www.alexa.com. Accessed in March/2010.
[2] Arquivos do ibge.
http://www.ibge.gov.br/servidor arquivos est.
[3] Bit.ly. http://www.bit.ly.
[4] There Are Now 155m Tweets Posted Per Day, Triple the
Number a Year Ago. http://rww.to/gv4VqA, April 2011.
[5] D. Antoniades, I. Polakis, G. Kontaxis, E. Athanasopoulos,
S. Ionnadis, E. P. Markatos, and T. Karagiannis. we.b: The
web of short URLs. In Intl World Wide Web Conference
(WWW), 2011.
[6] F. Benevenuto, J. Almeida, and A. Silva. Coleta e analise de
grandes bases de dados de redes sociais online. In Jornadas
de Atualiza c ao em Inform atica (JAI), pages 1157. 2011.
[7] F. Benevenuto, G. Magno, T. Rodrigues, and V. Almeida.
Detecting spammers on twitter. In Annual Collaboration,
Electronic messaging, Anti-Abuse and Spam Conference
(CEAS), 2010.
[8] J. Berry and E. Keller. The Inuentials: One American in
Ten Tells the Other Nine How to Vote, Where to Eat, and
What to Buy. Free Press, 2003.
[9] S. Brin and L. Page. The anatomy of a large-scale
hypertextual web search engine. Computer Networks and
ISDN Systems, 30(1-7):107117, 1998.
[10] M. Cha, H. Haddadi, F. Benevenuto, and K. Gummadi.
Measuring User Inuence in Twitter: The Million Follower
Fallacy. In Intl AAAI Conference on Weblogs and Social
Media (ICWSM), 2010.
[11] S. Chhabra, A. Aggarwal, F. Benevenuto, and
P. Kumaraguru. Phi.sh/$ocial: The phishing landscape
through short urls. In Annual Collaboration, Electronic
messaging, Anti-Abuse and Spam Conference (CEAS),
2011.
[12] comScore. The netherlands ranks number 1 worldwide in
penetration for twitter and linkedin.
http://bit.ly/hOpdAb, 2011.
[13] M. Gladwell. The Tipping Point: How Little Things Can
Make a Big Dierence. Back Bay Books, 2002.
[14] J. Gomide, A. Veloso, W. M. Jr., V. Almeida,
F. Benevenuto, F. Ferraz, and M. Teixeira. Dengue
surveillance based on a computational model of
spatio-temporal locality of twitter. In ACM SIGWEB Web
Science Conference (WebSci), 2011.
[15] Google Geocoding API. http://code.google.com/intl/en/
apis/maps/documentation/geocoding/.
[16] H. Kwak, C. Lee, H. Park, and S. Moon. What is twitter, a
social network or a news media? In Intl World Wide Web
Conference (WWW), pages 591600, 2010.
[17] K. Lee, B. Eo, and J. Caverlee. Seven months with the
devils: A long-term study of content polluters on twitter. In
Intl AAAI Conference on Weblogs and Social Media
(ICWSM), 2011.
[18] T. Rodrigues, F. Benevenuto, M. Cha, K. P. Gummadi,
and V. Almeida. On word-of-mouth based discovery of the
web. In ACM SIGCOMM Internet Measurement
Conference (IMC), 2011.
[19] E. M. Rogers. Diusion of Innovations. Free Press, 1962.
[20] T. Sakaki, M. Okazaki, and Y. Matsuo. Earthquake shakes
twitter users: real-time event detection by social sensors. In
WWW 10: Proceedings of the 19th international
conference on World wide web, pages 851860, 2010.
[21] S. Scellato, C. Mascolo, M. Musolesi, and J. Crowcroft.
Track Globally, Deliver Locally: Improving Content
Delivery Networks by Tracking Geographic Social Cascades.
In Intl World Wide Web Conference (WWW), 2011.
[22] D. Talbot. How Google Ranks Tweets.
http://www.technologyreview.in/web/24353/, Jan 2010.
[23] T. N. Y. Times. Google Adds Live Updates to Results,
December 2009. http://nyti.ms/cnszI5.
[24] A. Tumasjan, T. Sprenger, P. Sandner, and I. Welpe.
Predicting elections with twitter: What 140 characters
reveal about political sentiment. 2010.
[25] L. Rao, Twitter Seeing 90 Million Tweets Per Day, 25
Percent Contain Links, TechCrunch, 2010.
http://tinyurl.com/27x5cay.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 8 -
Uma Investigao sobre os Assuntos do Momento e a
Discusso de Notcias no Servio de Microblogging
Twitter
Karen da Silva Figueiredo Ana Cristina Bicharra Garcia
Instituto de Computao (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
kfigueiredo@ic.uff.br
Instituto de Computao (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
bicharra@ic.uff.br

ABSTRACT
Microblogging services like Twitter are a great opportunity oI
research to study patterns oI social interaction, given that, every
day,thosesystemsreachthousandsoIuserswhoshareandspread
inIormation through the network. In this paper we present an
investigation on the most commented topics on Twitter, called
Trend Topics, in order to identiIy: the real-world events which
thesetopicsarediscussing,thecompositionoIthemessagesabout
these topics, and the relationship between these topics and the
news Irom the online news medias. The analysis was perIormed
on a sample oI more than 500 000 tweets, 530 trend topics and
morethan3900newscollectedduringoneweek.
CategoriesandSubjectDescriptors
H.5.3 |Information Interfaces and Presentation|: Group and
Organization InterIaces collaborative computing, web-basea
interaction.
GeneralTerms
Measurement,HumanFactors.
Keywords
Twitter, Microbbloging, Online social network, InIormation
diIIusion,NewsdiIIusion,TrendTopics.
RESUMO
Servios de microblogging como o Twitter so excelentes
oportunidades para pesquisas de padres sociais de interao,
tendoemvistaquetodososdiasestessistemasalcanammilhares
deusuariosquecompartilhamedivulgaminIormaesatravsda
rede. O presente trabalho apresenta uma investigao sobre os
assuntos mais comentados no servio de microblogging Twitter,
denominados 'Assuntos do Momento, a Iim de compreender do
que se tratam tais assuntos, i.e. a quais eventos do mundo real
estes assuntos esto relacionados, quais as caracteristicas das
mensagens sobre estes assuntos e qual a relao entre estes
assuntos e as noticias divulgadas online. A realizao da analise
Ioi executada em uma amostra de mais de 500 mil tweets, 530
'Assuntos do Momento e mais de 3900 noticias coletados
duranteumasemana.

CategoriaseDescritoresdeAssuntos
H.5.3|InterfacesdeInformaoeApresentao|:InterIacesde
Grupo e Organizao computao colaborativa, interao
baseaaaemweb.
TermosGerais
Medio,FatoresHumanos.
Palavras-chave
Twitter, Microbbloging, Redes sociais online, DiIuso de
InIormaes,DiIusodenoticias,AssuntosdoMomento.
1. INTRODUO
Servios de microblogging e redes sociaiselevaramasIormasde
comunicao mediadas por computador a um novo patamar,
tornando-se alvos de pesquisas por oIerecem uma excelente
oportunidade para estudar padres sociais de interao tendo em
vista que estes sistemas alcanam milhares de usuarios todos os
dias.
Osserviosdemicrobloggingpermitemqueusuariosdivulgueme
compartilhem inIormaes sobre as suas atividades, opinies e
status|1|.Entrevariosdestesserviosdemicrobloggingtalvezo
Twitter |2| seja o mais popular atualmente. Alm de ser um
microblogging que oIerece suporte a criao de conteudos pelo
usuario(comumlimitede140caracteres),tambmconstituiuma
redesocialpoispermiteaosseususuariosseguiremaspaginasde
conteudos de outros usuarios (e tenham suas paginas seguidas),
criandovinculosentreestes.
Algumasdaspesquisasquetmsidodesenvolvidasnodominiode
microblogging, analisam o Twitter a Iim de entender como
ocorrem: (i) a criao de conteudos pelos usuarios |1|; (ii) as
relaesdeamizadenarede|3|,|4|;(iii)aIormaodeconversas
e processos colaborativos |3|, |5|, |6|; e (iv) a propagao de
inIormaesdentrodarede|4|,|7|,|8|.
EsobovisdapropagaodeinIormaesnaredequeopresente
trabalhoestalocalizado.Oobjetivodestapesquisainvestigar:(i)
quaissoosassuntosmaiscomentadospelosusuariosnoTwitter;
(ii) a quais eventos do mundo real estes assuntos esto
relacionados; (iii) quais as caracteristicas das mensagens sobre
estes assuntos; e (iv) qual a aIinidade entre estes assuntos e as
noticiasdivulgadasonline.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 9 -
A partir dessa seo, o restante deste artigo esta organizado da
seguinte Iorma: na Seo 2 o Twitter e suas principais
caracteristicas so apresentadas; na Seo 3 alguns trabalhos
relacionados so brevemente tratados; na Seo 4 o processo de
investigao da pesquisa detalho, nela so descritos acoletade
dados e os resultados obtidos; e na Seo 5 as concluses e
trabalhosIuturossodiscutidos.
2. OTWITTERESUAS
CARACTERISTICAS
O Twitter, como dito anteriormente, tanto um servio de
microblogging, quanto uma rede social. E um sistema
colaborativo|6|queoIerecesuporteacriaodeconteudospelos
seususuariosquandoosmesmosrespondemaperguntaexibidana
pagina inicial do sistema: 'O que esta acontecendo?. Esta
respostadeveternomaximo140caracteresedenominadatweet.
Oconjuntodetweetsproduzidosporumusuarioconstituemasua
linha do tempo que disponibilizada para todos em sua pagina,
caso o usuario permita. Usuarios podem seguir as paginas de
outros usuarios e, a partir de ento, os primeiros comeam a
receberostweetsdosusuariosseguidosdiretamentenasuapagina
inicial.
Oquestionamentoconstantedaperguntaexibidanapaginainicial
e o limite de 140 caracteres incentivam uma Irequncia maior de
produo de conteudo pelo usuario e a disponibilidade de uma
verso mobile do sistema Iacilita ainda mais o compartilhamento
deinIormaesemtemporeal.
O servio tambm possui caracteristicas peculiares que o tornam
mais atrativo e Iacilitam a diIuso deconteudonarede.Algumas
destascaracteristicassolistadasedescritasaseguir:
x Menes: um usuario pode citar outro usuarioemseu tweet
atravs de uma meno. Essa meno Ieita utilizando o
simbolodeseguidodonomedousuarioasermencionado.
A meno pode ser utilizada como uma Ierramenta para
chamar a ateno de um usuario para o conteudodo tweete
parainiciarconversasentreosusuariosnarede|6|.
x Retweets: caso um usuario considere interessante o tweetde
outro usuario ele pode utilizar este tipo especial de meno
chamadoretweet.Atravsdoretweetousuariocompartilhao
conteudo do tweet de outro usuario com os seus seguidores
mantendo o crdito do seu produtor. O retweet pode ser
realizado de Iorma automatica atravs da Iuncionalidade
Retweetar do sistema, ou de Iorma manual caracterizado
geralmente com um 'RT no inicio da mensagem seguido
pela meno e pelo tweet original do usuario Ionte. Outras
Iormasderetweetssodiscutidasem|9|.
x Hashtags:umusuariopodedestacarumtermoemseutweet
preIixando-o com o simbolo '#. Termos destacados desta
Iorma so conhecidos como hashtags e so utilizados como
umaIormadeindicaroteordoconteudodotweet.OTwitter
geraumlinkparacadahashtagque,aoserselecionado,leva
a uma busca que tem como resultado os ultimos tweets de
todososusuariosdaredequecontenhamotermodahashtag.
x Assuntos do Momento (1rend 1opics, em ingls): na
paginainicialdecadausuarioexibidaumalistaquecontm
os 10 termos mais comentados em todos os tweets ou nos
tweets de usuarios de determinada regio (escolhida pelo
usuario). Tais termos denominados como 'Assuntos do
Momento podem ser hashtags ou uma sequncia de
palavrasiniciadascomletrasmaiusculas.Cadatermodalista
de 'Assuntos do Momento Iunciona como um atalho para
uma busca que retorna como resultado os ultimos tweets de
todososusuariosdaredequecontenhamaqueletermo.
x Busca e operadores de busca: o Twitter oIerece uma
Ierramenta de busca que pode apresentar como resultados
para o termo de entrada: ultimos tweets, imagens e videos
divulgadosatravsdeURLsnostweetseusuarios.Umasrie
de operadores pode ser usada em conjunto com o termo
desejado na entrada para reIinar os resultados da busca, tais
como: operadores de localidade, operadores de idioma,
operadorestemporais,etc.
x Operadores de atitudes: compem um subconjunto dos
operadores de busca que reIinam os resultados do termo de
entrada. So estes operadores: ':) e ':(. O operador ':)
Iiltra os resultados exibindo apenas tweets com uma atitude
positiva em relao a entrada da busca. De Iorma oposta, o
operador ':( exibe os tweetsresultantesqueexpressemuma
atitudenegativaemrelaoaentradadabusca.
As caracteristicas apresentadas tornam a navegao na rede e a
comunicao entre os usuarios mais dinmica, motivando o
compartilhamento de inIormaes e opinies como ja
demonstrado em |1| e |4|. O presente trabalho tem como Ioco a
analise dos 'Assuntos do Momento e as caracteristicas dos
tweetsrelacionadosaestesassuntos:numerodemenes,numero
deretweets,numerodeURLsequantidadedeatitudespositivase
negativas.
3. TRABALHOSRELACIONADOS
Em |1| o primeiro estudo sobre as propriedades topologicas e
geograIicas do servio de microblogging Twitter Ioi executado.
Os autores analisaram as intenes dos usuarios e a tendncia de
usuarios com intenes similares de se conectarem. E, ainda em
|1|, os autores classiIicaram os usuarios da rede em trs tipos
principais: Iontes de inIormaes, amigos e buscadores de
inIormaes. Esta classiIicao conIirma que os usuarios do
TwitterenxergamaredecomoumconcentradordeinIormaes.
Outra caracteristica de |1| Ioi a utilizao de um mtodo para
calcular quais termos eram os mais comentados durante
determinado dia da semana, algo muito similar aos 'Assuntos do
Momento. Na poca da pesquisa |1| ainda no exista a
Iuncionalidade 'Assuntos do Momento no Twitter
1
. Uma vez
calculadosostermosmaiscomentados,osautoresclassiIicaramos
termos em trs categorias: 'Programas de TV, 'Eventos Atuais
e 'Atividades. Uma abordagem semelhante a esta categorizao
dotrabalho|1|realizadanesteartigonaSeo4.
Em |6| o aspecto colaborativo do Twitter Ioi observado com o
objetivodedeterminaroquantoassuasIuncionalidadesIacilitam
a troca de inIormaes entre usuarios. No Iinal do trabalho so
discutidas modiIicaes de aesign que tornariam o Twitter uma
Ierramenta melhor para colaborao. Metade destas modiIicaes
apontadas pelos autores de |6| ja esto disponiveis na rede
atualmente, dentre elas aIuncionalidadedebuscamencionadana
Seo 2, essencial para a elaborao deste trabalho (veja mais
detalhesnaSeo4).

1
A Iuncionalidade 'Assuntos do Momento surgiu em 2008.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 10 -
Kwak et al. |4| tambm apresentaumaanalisedascaracteristicas
topologicas do Twitter, porm com enIoque no poder da rede de
compartilhar inIormaes. O estudo trata do comportamento
temporal dos 'Assuntos do Momento e da propagao de
inIormaes atravs de sequncias de retweets. Alm disso, os
autores comparam os termos da lista de 'Assuntos do Momento
com os termos do Google Trena e as manchetes da rede CNN.
Entretanto, no so relatados dados reIerentes a comparao dos
'Assuntos do Momento com a CNN, a unica inIormao
discutida no artigo a de que a CNN estaria em mais da metade
dasvezesaIrentenadivulgaodenoticiasdoqueoTwitter.
Trabalhos sobre a propagao de inIormaes semelhantes a |4|
Ioram executados previamente em outras redes sociais |10| e
serviosdeblogging|11|.Entretanto,atondedoconhecimento
dosautoresdopresenteartigo,noexistemtrabalhosrelacionados
adiscussodenoticiasnestessistemasounoTwitter.
4. OPROCESSODEINVESTIGAO
NestaseooprocessodeinvestigaorealizadoaIimdeanalisar
os 'Assuntos do Momento e a discusso de noticias no Twitter
detalhado. Esta investigao tem como objetivos identiIicar: (i)
quaissoosassuntosmaiscomentadospelosusuariosnoTwitter;
(ii) quais eventos do mundo real esto relacionados a estes
assuntos; (iii) quais assuntos esto relacionados as noticias
divulgadas online; (iv) quais as caracteristicas das mensagens
sobre os assuntos mais comentados, especialmente sobre os
assuntosidentiIicadosnoitem(iii).
Na Seo 4.1 o mtodo utilizado para a coleta dos dados
descritoenaSeo4.2osresultadosobtidossodiscutidos.
4.1 AColetadosDados
ParaacoletadosdadosIoidesenvolvidoumwebcrawleremJava
|12|utilizandoasbibliotecasTwitter4J|13|paraaconexocomo
TwittereROME|14|paraaconexocomcentraisdenoticias.
A cada cinco minutos o web crawler copiava a lista dos atuais
'Assuntos do Momento
2
do Twitter e realizava trs buscas para
cada um desses assuntos, copiando tambm os seus resultados.
Foram utilizadas como entradas para os trs tipos de busca: (i) o
termodoassunto;(ii)otermodoassuntoseguidodooperadorde
atitudes positivas;e(iii)otermodoassuntoseguidodooperador
deatitudesnegativas.
Na mesma periodicidade de cinco minutos, Ioram coletadas
manchetes e datas de publicao de noticias de trs centrais de
noticiasonline
3
.
AcoletadedadosIoiexecutadaentreosdias18e24dejunhode
2011, constituindo um intervalo de sete dias (uma semana).

2
A lista de 'Assuntos do Momento determinada regionalmente
pelo Twitter. A lista coletada neste trabalho Ioi a lista de
'Assuntos do Momento da regio: 23424768 'Bra:il
Country.
3
As centrais de noticias escolhidas para este trabalho Ioram G1
|15|, R7 |16| e Google Noticias Brasil |17|. A escolha destas
centraisIoideterminadapelapopularidadedasduasprimeirase
pelo Iato da ultima apresentar uma coletnea das principais
centraisdoBrasil.
Durante este periodo Ioram coletados mais de 500 mil tweets
4
,
530 'Assuntos do Momento e mais de 3900 noticias.
Devidoagrandequantidadededadoscoletados,Ioramanalisados
neste estudo somente os 10 'Assuntos do Momento de cada dia
que permaneceram por mais tempo na lista de assuntos, e seus
respectivos resultados de busca, totalizando 70 'Assuntos do
Momento emaisde306miltweets.
4.2 ApresentaoeDiscussodosResultados
4.2.1 ,GHQWLILFDomRH&DWHJRUL]DomRGRV$VVXQWRV
GR0RPHQWR
ConIorme descrito na Seo 3, em |1| Ioi utilizado um mtodo
para calcular quais termos eram os mais comentados durante
determinado dia da semana e, apos calculados, os termos mais
comentadosIoramclassiIicadosem trs categorias: 'Programas de
TV, 'Eventos Atuais e 'Atividades.
DeIormasemelhanteaotrabalho|1|,nestaseoos 'Assuntos do
Momento coletadosIoramclassiIicadosemcategoriasdescritasa
seguir a Iim de compreender melhor os assuntos que so mais
debatidosnoTwitter.OsresultadossoapresentadosnasTabelas
1e2.
x Eventos Atuais: assuntos relacionados a acontecimentos do
dia.
x Eventos Passados: assuntos relacionados a acontecimentos
dediasanteriores.
x EventosFuturos:assuntosrelacionadosaacontecimentosde
diasIuturos.
x Programas de TV: assuntos relacionados a programas de
TVdomomento.
x Esportes: assuntos relacionados a eventos esportivos do
momento.
x Crassroots o termo no tem uma traduo direta para o
portugusesereIereamovimentospopularesquesurgemde
Iorma natural e espontnea. ClassiIicou-se como grassroots
assuntosrelacionadosaestestiposdemovimentospopulares,
como brincadeiras (e.g. #Iollowgeral), maniIestaes (e.g.
#euescolhiesperar),etc.
Na Tabela 1 so apontados os 10 'Assuntos do Momento de
cada dia da semana analisada que permaneceram por maistempo
na lista de assuntos
5
. Cada assunto da Tabela 1 Ioi identiIicado
com uma cor que representa a sua categoria a Iim de Iacilitar a
leitura da tabela considerando a quantidade de entradas, por
exemplo, a cor laranja indica que um assunto da categoria
'Esportes.

4
ComooIocodesteartigonoadetecodespam,optamospor
adotaratcnicadeeliminaodetweetsquecontinhammaisdo
quetrs'Assuntos do Momento na mesma mensagem, tcnica
tambmutilizadaem|4|.
5
A lista completa de 'Assuntos do Momento coletados durante a
semanacomosseusrespectivostemposdepermanncianalista
de assuntos esta disponivel em: http://www.ic.uII.br/
~kIigueiredo/tresearch/assuntos.pdI
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 11 -
Tabela1.AssuntosdoMomentoesuasCategorias
Legenda:

EventosAtuaisEventosPassadosEventosFuturos
ProgramasdeTVEsportes"Crassroots"
Posio Sbado Domingo
1 SoniaBraga #chicolatrasday
2 UndisclosedDesires #saojoaodonordeste
3 DeborahBlando Joe&Nick
4 #uIc134 FallingSkies
5 #sigavelhostempos StevenSeagal
6 #plantaeraiz DragonballEvolution
7 SNZ #RogerioCeni
8 #ZeGotinha PapaiJoel
9 LeandraLeal BetoBarbosa
10 #maislegalquetvxuxa Werdum
Posio Segunda-feira Tera-feira
1 GAGAWON #euescolhiesperar
2 #bancodeseguidores #twitter3
3 RyanDunn WilzaCarla
4 MarthaRocha KellyKelly
5 #cidadedoshomens SkolSensations
6 EvangelineLilly DakotaFanning
7 FallingSkies MovesLikeJagger
8 #oprecodeumalicao #herois
9 3YearsCampRock RyanDunn
10 Jackass CarlaDiaz
Posio Quarta-feira Quinta-feira
1 Phineas&Ferb OrgulhoPeLanza
2 #Ieriadao #SantosCampeao
3 GarotaInIernal KleberMachado
4 EnriqueIglesias FerrisBueller
5 OrgulhoHetero #zelove
6 #Iollowgeral #curtindoavidaadoidado
7 AlianzaLima Phineas&Ferb
8 IWannaGodney Uruguaios
9 #dianacionaldovexame RodrigoSantana
10 CorpusChristi StellaFlorence
Posio Sexta-feira
1 #palmeirasminhavida
2 CapitoAmrica
3 TeamFortress
4 OrgulhoPeLanza
5 PadreJuarez
6 #billboardawards
7 #uiquilics
Posio Sexta-feira
8 SnoopDog
9 IBGE
10 #boladay

Tabela2.AnliseQuantitativadasCategorias
Categoria
Nmerode
$VVXQWRVGR0RPHQWR Percentual
EventosAtuais 18 25,71
EventosPassados 2 2,86
EventosFuturos 2 2,86
ProgramasdeTV 21 30
Esportes 7 10
'Grassroots 14 20
NoidentiIicada 6 8,57
Total 70 100,00

A Tabela 2 aponta a quantidade de 'Assuntos do Momento de


cada categoria de acordo com a classiIicao Ieita na Tabela 1.
Como se pode observar na Tabela 2, os programas de TV so os
assuntos mais comentados no Twitter, ocupando 30 dos
'Assuntos do Momento da semana analisada. Em seguida, esto
oseventosatuais(25,71)eosgrassroots(20).
Os grassroots no Twitter so to importantes que, se a mesma
categorizao utilizada neste trabalho Ior aplicada para as
hashtags retweetadas mais populares apresentadas em |18|, o
percentualdehashtagsda categoria 'Grassroots chega a 70.
Apos classiIicado, cada termo dos 'Assuntos do Momento da
Tabela 1 Ioi buscado entre as 3900 manchetes de noticias. Os
'Assuntos do Momento sublinhados na Tabela 1 reIerem-se a
assuntosqueobtiveramresultadosduranteestabusca.

Tabela3.PrimeirasOcorrnciasdosAssuntosdoMomentono
TwitterenasCentraisdeNotcias
Assunto
1ocorrncianos
"AssuntosdoMomento"
1ocorrncia
nasNotcias
#Ieriadao 22/06as10:36h 22/06as06:00h
#RogerioCeni 19/06as16:31h 19/06as18:02h
#SantosCampeao 22/06as23:57h 23/06as08:38h
#ZeGotinha 18/06as11:16h 18/06as06:00h
CapitoAmrica 23/06as21:24h 23/06as21:08h
CorpusChristi 22/06as08:48h 22/06as06:00h
IBGE 24/06as08:04h 24/06as04:03h
Jackass 20/06as12:15h 21/06as11:00h
OrgulhoHetero 22/06as12:34h 22/06as13:02h
RyanDunn 20/06as11:39h 21/06as11:00h
WilzaCarla 20/06as21:24h 21/06as00:20h
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 12 -
Comparou-seentoadatadepublicaodanoticiacomadatade
atualizao do Twitter da lista de 'Assuntos do Momento que
continha o assunto reIerido. Os resultados so apresentados na
Tabela3.
Nota-se que apenas 15,71 dos assuntos mais comentados no
Twitteraparecemnasnoticias,sendo63,64sobreeventosatuais
e18,18sobreesportes.AsocorrnciassublinhadasnaTabela3
destacamaprimeiraocorrnciageraldoassunto.
De acordo com as ocorrncias sublinhadas na Tabela 3, 54,55
dos assuntos analisados Ioram comentados no Twitter antes das
noticias serem publicadas, e esse numero sobe para 100 em
assuntos da categoria 'Esportes. Um motivo que pode justiIicar
este resultado o Iato dos eventos esportivos serem
acompanhados em tempo real pelos usuarios, e assim, serem
discutidosnaredeenquantoaindaestoacontecendo.
Os assuntos 'Ryan Dunn, 'Jackass e 'Wilza Carla tambm
apareceram primeiro no Twitter, estando estes relacionados ao
Ialecimento de celebridades. Como a vida de celebridades
costuma ser acompanhada pelos seus Is, talvez isso explique as
primeirasocorrnciasdessesassuntosnoTwitter.
4.2.2 ,GHQWLILFDomRH&DWHJRUL]DomRGRV$VVXQWRV
GR0RPHQWR
Com o objetivo de analisar as caracteristicas da composio dos
tweets coletados nas buscas dos 'Assuntos do Momento Ioram
calculadasasseguintestaxasparacadaassunto
6
:
x Taxa de Retweets: porcentagem de tweets que so retweets
nototaldetweetscoletado.
x Taxa de Menes: porcentagem de tweets que Iazem
menesaoutrosusuariosnototaldetweetscoletado.
x TaxadeURLs:porcentagemdetweetsquecontmURLsno
totaldetweetscoletado.
x Taxa de Atitudes Positivas/Negativas: porcentagem de
tweetsqueapresentamumaatitudepositiva/negativanototal
de tweets coletados atravs das buscas com operadores de
atitudes.
Asmdiasdastaxascalculadasparacadaassuntosoindicadasna
Tabela4.

Tabela4.MdiadasTaxasdosAssuntosdoMomento
Taxa ValorMdio
TaxadeRetweets 23,32
TaxadeMenes 41,65
TaxadeURLs 12,29
TaxadeAtitudesPositivas 65,43
TaxadeAtitudesNegativas 34,57

6
A tabela geral contendo todos os assuntos e suas respectivas
taxas esta disponivel em http://www.ic.uII.br/~kIigueiredo/
tresearch/taxasDosAssuntos.pdI
As taxas de atitudes positivas e atitudes negativas somam 100
dos tweets coletados. Um tweet sempre classiIicado como
possuindo ou uma atitude positiva ou uma atitude negativa pelo
Twitter. Ja as taxas de retweets, menes e URLs no so
mutuamenteexclusivaseportantonototalizam100dostweets
coletados. Um tweet pode ser ao mesmo tempo uma meno,um
retweeteconterumaURL,bemcomopodenopossuirnenhuma
dessascaracteristicas.
Emmdiaataxademenesde41,65,sendoumpoucomais
dametadedestasdotiporetweet(23,32dototal).Estevalorda
taxa de menes um pouco maior do que valor obtido em |6|,
que Ioi de 30. No trabalho |6|, Ioram medidas as menes de
todos os tweets, no somente os relacionados aos 'Assuntos do
Momento o que pode indicar que os usuarios trocam mais
mensagens com os outros sobre os assuntos mais populares na
rede. Ja o valor da mdia da taxa de URLs bem proximo ao
valores de 13 e 19 indicados por Java et al. em |1| e Zarella
em|19|respectivamente.
Com relao as mdias das taxas de atitudes positivas/negativas,
pode-se observar que em sua maioria (65,43) aatitudepositiva
dos usuarios sobre os 'Assuntosdo Momento prevalece.
NaTabela5so ilustrados os valores das taxas para os 'Assuntos
do Momento que apareceram em noticias, listados previamente
naTabela3.

Tabela5.TaxasdosAssuntosdoMomentoNoticiados
A
s
s
u
n
t
o

T
a
x
a

d
e

R
e
t
w
e
e
t
s

T
a
x
a

d
e

M
e
n

e
s

T
a
x
a

d
e

U
R
L
s

T
a
x
a

d
e

A
t
i
t
u
d
e
s

P
o
s
i
t
i
v
a
s

T
a
x
a

d
e

A
t
i
t
u
d
e
s

N
e
g
a
t
i
v
a
s

#Ieriadao 11,75 19,12 3,69 55,38 44,62


#RogerioCeni 25,71 35,73 2,89 91,10 8,90
#SantosCampeao 22,96 40,04 2,30 58,57 41,43
#ZeGotinha 16,39 32,59 3,08 53,39 46,61
CapitoAmrica 10,80 24,90 21,12 82,11 17,89
CorpusChristi 20,42 44,03 20,06 49,42 50,58
IBGE 22,40 45,40 53,77 85,57 14,43
Jackass 40,33 63,11 17,03 50,62 49,38
OrgulhoHetero 42,49 54,24 7,27 53,93 46,07
RyanDunn 53,38 65,16 13,97 45,79 54,21
WilzaCarla 36,48 43,14 35,62 19,56 80,44
ValorMdio 27,56 42,50 16,44 58,68 41,32

Comopode-senotarovalormdiodataxademenesparaestes
assuntos se manteve bem proximo do valor mdio geral.
Entretanto,possivelperceberumpequenoaumentocomrelao
astaxasderetweets(27,56)eURLs(16,44).
Outros pontos interessantes revelados na Tabela 5, so: (i) os
assuntos da categoria 'Esportes tm a menor taxa de URLs, em
mdia 2,59, provavelmente pelo Iato dos eventos esportivos
seremacompanhadosemtemporealpelosusuariosquedevemter
menor interesse na divulgao de URLs nesse momento; (ii) os
assuntos que Ioram comentados primeiramente no Twitter tmas
maiores taxas de retweets o que pode indicar o intuito dos
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 13 -
usuariosdepropagaremessesassuntospelarede;e(iii)asnoticias
relacionadas ao Ialecimento decelebridadestmasmaiorestaxas
de atitudes negativas, por motivos obvios, contrariando a
tendncia geral dos assuntos mais comentados de terem uma
maiortaxadeatitudespositivas.
5. CONCLUSOETRABALHOS
FUTUROS
O presente trabalho apresentou uma analise sobre os assuntos
mais comentados no servio de microblogging Twitter,
denominados 'Assuntos do Momento, a Iim de compreender do
que se tratam tais assuntos, i.e. a quais eventos do mundo real
estes assuntos esto relacionados. Para tanto, realizou-se uma
categorizao dos 'Assuntos do Momento e a partir dela, pode-
seobservarqueostopicosqueosusuariosdaredemaiscomentam
so os programas de TV e eventos que acontecem no dia,
seguidos dos grassroots que so movimentos populares
geralmente iniciados na propria rede, como brincadeiras,
maniIestaes,homenagens,etc.
Alm da categorizao dos 'Assuntos do Momento, os assuntos
coletados tambm Ioram comparados com as manchetes de
centrais de noticias online, destaIormaIoipossivelidentiIicaros
assuntos mais comentados na rede que esto relacionados a
noticias e, at mesmo, apontar quais dessas noticias sepropagam
noTwitterantesmesmoseserempublicadas.
OutracontribuiodestetrabalhoIoiaelaboraodeumaanalise
da composio dos tweets sobre os 'Assuntos do Momento
atravs da medio de taxas de retweets, menes, URLs e
atitudes positivas/negativas das mensagens, discutindo
principalmente os resultados associados aos assuntos que esto
ligadosanoticias.
At onde de conhecimento dos autores deste artigo, este o
primeiro trabalho investigativo sobre o Twitter que explora em
suaanalise:(i)adiscussodenoticiasnarede;(ii)acategorizao
dos assuntos mais comentados incluindo os grassroots; e (iii) a
medio de atitudes positivas/negativas nos tweets sobre os
'Assuntos do Momento.
Estetrabalhopodeseropontodepartidaparapesquisasemoutras
areas.Entenderascaracteristicasdacomposiodos 'Assuntos do
Momento no Twitter importante para a criao de novas
estratgias de marketing e a analise da sua propagao para
investigaesnaareadecomunicao.
Como trabalho Iuturo pretende-se realizar uma investigao mais
proIunda,apartirdeumacoletadedadosglobaisnoTwitter,com
uma durao de 30 dias e incluindo mais Iontes de centrais de
noticias, pois esperado pelosautoresqueonumerode assuntos
discutidossobrenoticiasaumentenessascondies.
6. REFERNCIAS
|1| Java,A.,Song,X.,Finin,T.,andTseng,B.2007.Whywe
twitter:understandingmicrobloggingusageand
communities.InProceedingsoIthe9thWebKDDand1st
SNA-KDD2007workshoponWebminingandsocial
networkanalysis(WebKDD/SNA-KDD'07).ACM,New
York,NY,USA,56-65.
|2| Twitter.Disponivelem:http://twitter.com,Acessoem:30
deJunhode2011.
|3| Huberman,B.,Romero,D.andWu,F.2009.Social
networksthatmatter:Twitterunderthemicroscope.First
Monday,Volume14,Number1-5January,2009.
|4| Kwak,H.,Lee,C.,Park,H.andMoon,S.2010.Whatis
Twitter,asocialnetworkoranewsmedia?InProceedingsoI
the19thinternationalconIerenceonWorldwideweb
(WWW'10).ACM,NewYork,NY,USA,591-600.
|5| Wu,S.,HoIman,J.M.,Mason,W.A.andWatts,D.J.2011.
Whosayswhattowhomontwitter.InProceedingsoIthe
20thinternationalconIerenceonWorldwideweb(WWW
'11).ACM,NewYork,NY,USA,705-714.
|6| Honeycutt,C.andHerring,S.2009.BeyondMicroblogging:
ConversationandCollaborationviaTwitter.Hawaii
InternationalConIerenceonSystemSciences,pp.1-10,42nd
HawaiiInternationalConIerenceonSystemSciences.
|7| Sakaki,T.,Okazaki,M.andMatsuo,Y.2010.Earthquake
shakesTwitterusers:real-timeeventdetectionbysocial
sensors.InProceedingsoIthe19thinternationalconIerence
onWorldwideweb(WWW'10).ACM,NewYork,NY,
USA,851-860.
|8| Bakshy,E.,HoIman,J.M.,Mason,W.A.andWatts.D.J.
2011.Everyone'saninIluencer:quantiIyinginIluenceon
twitter.InProceeaingsofthefourthACMinternational
conferenceonWebsearchanaaatamining(WSDM'11).
ACM,NewYork,NY,USA,65-74.
|9| Boyd,D.,Golder,S.,andLotan,G.2010.Tweet,
Tweet,Retweet:ConversationalAspectsoIRetweetingon
Twitter.InProceegingsoIHICSS`10, 1-10.
|10| Cha,M.,Mislove,A.andGummadi,K.P.2009.A
measurement-drivenanalysisoIinIormationpropagationin
theIlickrsocialnetwork.InProceeaingsofthe18th
internationalconferenceonWorlawiaeweb(WWW'09).
ACM,NewYork,NY,USA,721-730.
|11| Gruhl,D.,Guha,R.,Liben-Nowell,D.andTomkins,A.
2004.InIormationdiIIusionthroughblogspace.In
Proceeaingsofthe13thinternationalconferenceonWorla
WiaeWeb(WWW'04).ACM,NewYork,NY,USA,491-
501.
|12| TheJavaLanguageSpeciIication.Disponivelem:
http://java.sun.com/docs/books/jls/,Acessoem:30deJunho
de2011.
|13| Twitter4J.Disponivelem:http://twitter4j.org/en/index.html,
Acessoem:30deJunhode2011.
|14| Rome.Disponivelem:http://rome.dev.java.net/,Acessoem:
30deJunhode2011.
|15| G1RSS.Disponivelem:
http://g1.globo.com/dynamo/rss2.xml,Acessoem:30de
Junhode2011.
|16| R7RSS.Disponivelem:
http://www.r7.com/data/rss/brasil.xml,Acessoem:30de
Junhode2011.
|17| GoogleNewsBrasilRSS.Disponivelem:
http://news.google.com.br/news?pz1&hdlOnly1&cIall&
nedpt-BRbr&hlpt-BR&topich&num3&outputrss,
Acessoem:30deJunhode2011.
|18| Suh,B.,Hong,L.,Pirolli,P.andChi,E.H.2010.Wanttobe
Retweeted?LargeScaleAnalyticsonFactorsImpacting
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 14 -
RetweetinTwitterNetwork.InProceeaingsofthe2010
IEEESeconaInternationalConferenceonSocialComputing
(SOCIALCOM'10).IEEEComputerSociety,Washington,
DC,USA,177-184.
|19| Zarrella,D.2009.ScienceoIRetweets.Disponivelem:
http://danzarrella.com/the-science-oI-retweets-report.html,
Acessoem:30deJunhode2011

VIII Simpsio Brasileiro de Sistemas Colaborativos
- 15 -
Social networks and collective intelligence applied to
public transportation systems: A survey
Ana Paula Chaves
Coordination of Technology
Systems for Internet
Federal Technological
University of Paran (UTFPR)
Campo Mouro - PR
anachaves@utfpr.edu.br
Igor Steinmacher
Coordination of Technology
Systems for Internet
Federal Technological
University of Paran (UTFPR)
Campo Mouro - PR
igorfs@utfpr.edu.br
Vaninha Vieira
Department of Computer
Science
Federal University of Bahia
(UFBA)
Salvador - BA
vaninha@ufba.br
ABSTRACT
Road trac in big cities is becoming increasingly chaotic.
The use of public transportation is an alternative to im-
prove this scenario, since it diminishes the number of pri-
vate vehicles on the roads. However, to improve its quality
is important to understand the problems people are facing
when using this kind of transportation. This paper presents
the results of a survey conducted with public transportation
users which investigates how collaborative systems based on
social networks and collective intelligence can support shar-
ing information with the passengers. The results show that
there is a scarcity of ways to obtain real-time information
related to public transportation and that the use of social
network applications and collective intelligence is an inter-
esting way to share and obtain this kind of information.
Keywords
Intelligent Transportation System, collective intelligence, so-
cial network
1. INTRODUCTION
Big cities are increasingly suering from the problem of ur-
ban mobility. Several problems, such as constant trac jam,
lack of investments in road infrastructure, and poor quality
of the services provided by public transportation makes the
citizens daily life stressful and complicated. Estimulating
the use of public transportation is essential to support ur-
ban mobility, because it reduces the number of cars on pub-
lic roads [5]. Besides, since Brazil will be hosting important
sport events in the coming years, it is important to inves-
tigate how information technology can be applied to public
transportation to better support users needs and decisions.
According to [3], the use of information technology for plan-
ning, managing, operating and monitoring public transporta-
tion has become a feasible alternative. Intelligent Trans-
portation Systems (ITS) aims to investigate how to apply
well established information and communication technolo-
gies to improve the quality of transportation systems [12].
A classication for ITS solutions, presented in [12], con-
siders the area of Advanced Public Transportation Systems
(APTS), which aims to propose solutions to support infor-
mation provisioning to passengers, such as the current status
and timetables of the public vehicles, the indication of the
route lines and the stops attended by a line, incidents on
public transportation with the indication of possible delays,
and others. When notied of such information, passengers
can make their decisions easily, planning their route and ac-
tivities, which results in less stress and anxiety and more sat-
isfaction with the public transportation services. According
to a recent article in Wired magazine [1], people are willing
to leave their cars or motorcycles, if they can get information
in real time, about the public transportation.
The popularization of social media (such as blogs, social
networks and wikis) changed the way people deal with their
daily problems by increasingly using virtual communities to
share and seek for information. As indicated in [10], it en-
ables communities to solve more problems than it would be
possible individually. Collective intelligence involves com-
bining knowledge (which may include behaviors, preferences,
ideas, and so on) provided by a group of people to produce
novel information or insight [11]. Some applications [14, 6]
that make use of collective intelligence capabilities were pro-
posed to collect knowledge based on what is being discussed
on the Internet.
In this context, we are investigating how collaborative sys-
tems, specially social media and collective intelligence, can
increase the awareness of public transportation users reduc-
ing the lack of information related to the route conditions,
the lines availability and the waiting time at bus stops. This
research is part of a project called UbiBus [13] whose objec-
tive is to propose, specify and implement technological solu-
tions to easy users access to public transportation informa-
tion in real time, based on dynamic context-sensitive infor-
mation, available on multiple devices. A module of UbiBus,
called UbiBus-Net, aims to investigate and implement col-
lective intelligence solutions and tools that analyze textual
information produced by users on social networks about the
public transportation conditions, allowing the access to the
generated collective knowledge.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 16 -
To support the requirements elicitation for UbiBus, we de-
signed and conducted a survey with transportation users, in
dierent Brazilian cities, through the application of a ques-
tionnaire. This survey aims to identify deciencies and needs
related to the information provided to public transportation
passengers. The main advantage of conducting a eld sur-
vey is that we can have the opinion of who actually use the
public transportation and know the real services conditions
in their city or region. Thus, we can develop applications
closer to users expectations.
This paper presents the results obtained in this survey and
analyzes the problem of providing information to public trans-
portation users based on collective intelligence and social
networks. To accomplish it, the paper is organized as fol-
lows. Section 2 presents some related work in the area of ITS
and Collective Intelligence. Section 3 brings the methodol-
ogy used to perform the survey. In Section 4, we discuss the
results obtained with the survey, and in Section 5 we present
our conclusions about the survey ndings.
2. BACKGROUND
2.1 Collective Intelligence
Currently, collaboration among people has been gaining at-
tention due to the popularity of social media such as forums,
weblogs, wikis and social networks. These media are collab-
orative systems that enable users to share their knowledge,
skills and other information. As a result, they are becom-
ing important sources of collective intelligence. The science
of collective intelligence, proposed from the discussions of
Pierre Levy [8], tries to harness the potential of social net-
works as a means to exercise the citizenship. It assumes
that individual intelligences are summed and shared across
society.
Collective intelligence led to the rise of a new business model
known as crowdsourcing. The term, coined by Je Howe [7],
describes a model that takes advantage of several creative
solutions that people can propose. The idea of crowdsourc-
ing is to send a task to the crowd instead of running it using
their own resources.
There are some recent initiatives that make use of collec-
tive intelligence to benet public or private eorts. Wiki-
Crimes [6] enables people to share information about the
occurrence of criminal acts in a particular location. Vivac-
qua and Borges [14] propose the usage of collective intelli-
gence capabilities for emergency response systems. In some
countries, there are initiatives to share information about
corruption, as the sites I paid a bribe
1
(India) and No les
votes
2
(Spain). TheMap of Corruption in Brazil
3
consists
of a site hosted on Google Maps for people to provide and
seek for information about corruption in Brazil. In Panama,
the site Mi Panama Transparente
4
uses collective intelli-
gence to gather information about various aspects relevant
to society such as corruption, crime and violence.
The increasing demand and use of collective intelligence ap-
1
http://www.ipaidabribe.com
2
http://wiki.nolesvotes.org
3
http://doiop.com/mapadacorrupcao
4
http://www.mipanamatransparente.com
plications indicates that people tend to collaborate in or-
der to build a collective knowledge, since such knowledge is
benecial to themselves and the group they belong. Thus,
collective intelligence principles can oer solutions to many
sectors in the society, including the improvement of public
transportation systems.
2.2 Advanced Public Transportation Systems
Advanced Public Transportation Systems (APTS) is a sub-
area of Intelligent Transportation Systems that aims to use
technology to provide real time information to assist users
of public transportation on planning their trips [12]. This
information includes the types of available transportation,
transportations estimated departure and arrival times, their
itinerary, among others. A better accessibility to informa-
tion concerning the public transportation in a city makes
this option a more attractive mean of transportation to its
potential users [4]. This interaction can occur by using dif-
ferent devices, such as information centers, displays inside a
bus or at a bus station, the web, smartphones or interactive
TV.
Several applications have been developed to assist users on
being aware about public transportation means in a city
(e.g. OneBusAway [5], Your City on Time [13], TOTransit
5
,
OnibusRecife
6
). Tools for mobile devices like OneBusAway
7
[5] and Waze
8
provide information according to the users
geographic location, achieved by GPS (Global Positioning
System). Waze generates maps according to the route in-
formed by the user, and presents trac data collected in
real time from other people who are also using the software
[9]. OneBusAway is directed to bus users from the city of
Seattle and vicinity, and presents all bus stops closer to the
users location, the lines associated to each stop and their
current schedules, updated in real time by the bus company.
OneBusAway also provides a web interface that displays a
map with the bus stops locations and the timetables for all
vehicles associated to those stops.
Other available tools are based on the principle of visual-
izing information on maps, including: OnibusRecife which
displays the bus stops closer to a given (typed) location in
the city of Recife, Brazil, and the possible routes to a given
destination; ToTransit displays the map location of street-
cars in Toronto, Canada, with information provided, in real
time, by the transportations companies; and Bus Maps Lon-
don
9
, which shows static information about bus stops, routes
and schedules for the city of London. Google Maps
10
also
presents APTS features for some cities, enabling people to
plan their routes using public transportation system. More-
over, Google Maps APIs are used to compose most part of
the applications mentioned on this section.
Despite those initiatives, it is dicult to obtain dynamic
information about public transportation conditions, since
many unexpected events may occur in the route (e.g. trac
5
http://totransit.ca/
6
http://www.onibusrecife.com.br/
7
http://www.onebusaway.org/
8
http://www.waze.com/
9
http://www.t.gov.uk/t/gettingaround/maps/buses/
10
http://maps.google.com
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 17 -
jam, accidents or incidents). Most solutions also strongly de-
pend on the information provided by the ocial transporta-
tion companies. A feasible alternative to obtain real-time
information is to create an intelligent transportation system
that makes use of the power of collective intelligence.
3. METHODOLOGY
The research presented in this paper was based on a ques-
tionnaire answered by public transportation users in Brazil.
Results were analyzed to check if they could indicate some
requirements to build an APTS to provide information to
passengers and if the usage of social networks and collective
intelligence could create better APTS. The following steps
were performed:
planning;
conduction;
data preparation; and
data analysis and results.
During the planning activity, we dened the research hy-
potheses, which were used to formulate the questionnaire.
The hypotheses are:
Hypothesis 1: public transportation passengers have
very few ways to get information about the lines they
need to use, and when available, the information is
incomplete.
Hypothesis 2: passengers tend to share information
about events that aect public transportation, so col-
laborative systems based on collective intelligence can
be useful to improve the quantity and quality of avail-
able information.
Hypothesis 3: passengers have more condence on
information provided by people in their social network
(friends, acquaintances, or other ties) than on infor-
mation achieved from unknown sources.
Hypothesis 4: applications for mobile devices can
be used to provide information to passengers, to ease
information sharing about occurrences on public trans-
portation at the time they happen and at any place the
user is situated.
The questions in the questionnaire were divided in two main
groups. The rst one included twelve questions (Table 1) re-
lated to the user prole, the public transportation they use,
and their knowledge about available information. The sec-
ond group comprised nine questions (Table 2) related to the
use of social networks by passengers, and the use of online
applications to share information about public transporta-
tion. Most questions are multiple choice type and it was
always possible for the respondents to point out Other as
an alternative, in case none of the available options were
adequate.
Table 1: Group 1: You and the Public Transport
1 City you live:
2 State you live:
3 How often do you use public transportation?
4 When you need to use public transportation, how do you
get information about the time that the vehicle will be
arriving at a given stop?
5 How often does the transportation arrive at the bus stop
at the expected time?
6 When delays occur in the line you use, what kind of prob-
lems can be considered as causes of delay in most cases?
7 Suppose you are at the bus stop, waiting for the vehicle
of a given line. If there is any delay,do you have a way
to become aware of what happened, before the vehicle
reaches the stop?
7.1 (If the answer to question 7 was Yes) How do you
get information about the reasons for the delay?
7.2 (If the answer to question 7 was No) Do you consider
important that this kind of information was available?
8 When you need to take a bus from a particular line for
the rst time, do you try to get information about this
line?
8.1 (If the answer to question 8 was Yes) What information
sources do you usually consult?
8.2 (If the answer is to question 8 was Yes) What kind
of information can you nd?
Table 2: Group 2: You and the Social Networks
1 Do you use Internet on your cellphone?
2 Do you use GPS on your cellphone?
3 Do you participate in social networks?
3.1 (If the answer to question 3 was Yes) In which social
networks do you participate actively
4 Do you post events that occur in trac on social net-
works?
4.1 (If the answer is to question 4 was Yes) Do you wish
there was an application to process and display the infor-
mation posted on social networks?
4.2 (If the answer to question 4 was No) Would you post
this kind of events if there was an application to facilitate
this?
5 If there was an application to display real-time informa-
tion about the bus lines you use, would you consult it?
6 Do you trust information about bus lines posted on the
Internet?
The questionnaire was created using LimeSurvey
11
and
made available electronically
12
. We conducted the survey
from March 24th to April 29th, 2011, using web-based sam-
pling methods. According to Cauleld and OMahony [2],
this method consists on sending the questionnaire to a initial
group of people with common attributes. The rst group of
respondents complete the survey and then pass the survey on
to their network. The process repeats and gathers momen-
tum as the number of responses increases and the snowball
eect occurs [2]. For this survey, we sent the questionnaire
URL via email and published it on social networks (Twit-
ter
13
, Facebook
14
and Orkut
15
), addressed to some public
transportation users and communities. We requested them
to answer the questionnaire and forward the URL to their
contacts.
The data preparation activity was performed to categorize
the responses and standardize the open ended questions
11
http://www.limesurvey.org/
12
http://goo.gl/B3UJM
13
http://www.twitter.com
14
http://www.facebook.com
15
http://www.orkut.com
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 18 -
Table 3: Data preparation: discarded answers
Reason # of answers
Answerer from another country (Bel-
gium). Out of scope.
1
Incomplete questionnaire (respondent
did not nish answering).
11
City provided does not exist. 1
Table 4: Number of response by state
State Number of
replies
Bahia 140
Paran a 128
Sao Paulo 121
Rio de Janeiro 166
Santa Catarina 43
Cear a 36
Rio Grande do Sul 24
Goias 20
Paraba, Sergipe 17
Minas Gerais 15
Mato Grosso do Sul 12
Distrito Federal 10
Amazonas 9
Rio Grande do Norte 6
Acre, Amapa, Espirito Santo,
Para, Pernambuco, Piau 1
(questions 1 and 2 of group 1), which had dierent spellings
for the same answer. We have collected a total of 683 re-
sponses. During the data preparation, 13 responses were
dismissed as they presented some kind of inconsistency, re-
sulting in a total of 670 valid responses. The reasons of the
exclusions are presented in Table 3.
The data analysis activity was performed to verify the hy-
potheses. The results of this activity will be described in
next section.
4. DATA ANALYSIS AND RESULTS
To perform the data analysis activity, we considered the 670
valid responses, involving 94 cities in 21 dierent Brazilian
states. Six states appeared in the results with a single re-
sponse (Acre, Amap a, Esprito Santo, Para, Pernambuco
and Piau). States that had the most signicant number of
responses were Bahia (140 responses, 132 from the city of
Salvador), Parana (128), S ao Paulo (121 responses, 83 from
the state capital) and Rio de Janeiro (66 responses, 57 from
the state capital). The distribution of responses per state
can be found in Table 4.
When asked about how often they used public transporta-
tion, 61% of respondents said they use every day and 20%
reported that they use few days a week. Only 19% said they
occasionally use public transportation (Figure 1).
4.1 Analysis of Hypothesis 1
Regarding Hypothesis 1, we wanted to know if the pub-
lic transportation passengers have means to get information
about the lines they use. In addition, we intended to ver-
ify, when information are available, if they are sucient and
complete.
We asked respondents how they become aware of the time
a vehicle will arrive at a given stop/station. It was possible
to check more than one choice among: (i) via Internet, (ii)
Figure 1: Frequency of public transportation usage
by telephone, (iii) printed timetables or guides, (iv) asking
other people, (v) there is no way to be aware, I go to the
stop and wait for the vehicle, and (vi) other. The number
of responses for each option is shown in Figure 2.
Figure 2: Ways users search for arrival time infor-
mation
Despite the apparent large number of people who reported
There is no way to be aware(47%), only 202 people (30% of
total) marked only this option. The remaining 114 respon-
dents checked this option in conjunction with other(s). This
may occur due to the fact that the information is not always
available in one way or another. Thus, when the information
is not found, the passenger go straight to the stop/station.
The other 468 respondents (70%) reported they have some
way to obtain this information.
Although people can get the timetables for the buses associ-
ated to a given stop, when we asked about the punctuality
of vehicles (Figure 3) only 32 respondents (5%) said that the
transportation always comes on time. Out of these 32, only
seven people live in capitals. We believe that the country-
side suer less with the phenomena that cause delays, such
as accidents and trac jams, due to the smaller number of
vehicles on the streets. Other 240 people said that the bus
rarely or never arrives at the stop on time. In addition, 180
people said they do not know if the bus is delayed because
they are not aware of the time it was expected to arrive.
This shows that information provided on the timetables are
not enough to make the passenger aware of the time the
vehicle should arrive at the stop.
We asked respondents what were the problems that often
cause delays in vehicles (Figure 4). The answers showed that
the major issues are trac jams (506), car accidents (411)
and robbery (200). Flooding were reported 121 times and
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 19 -
Figure 3: Frequency of delayed vehicles
29 other people pointed to other security incidents. 106 peo-
ple reported that other (not listed) problems cause delays.
Among the cited problems, 33 refer to mechanical problems,
24 to uncommitted drivers, 17 to transportation companies
planning failures and 11 to the lack of transportation vehi-
cles.
Figure 4: Reasons of delays
As it can be noted, some of the problems can be solved by
administrative measures, such as planning issues and lack of
vehicles. However, most of them are unexpected events that
occur along the route and, therefore, should be communi-
cated to passengers who are waiting for the transportation.
To nd out if this information is available, we asked the re-
spondents if they know ways to become aware of a delay
or event that cause a delay before the vehicle reaches the
stop (Figure 5). 648 people (97%) saidNo. We then asked
these people if they consider it important to have this in-
formation and 633 said Yes. It shows that the available
information about public transportation are generally based
on estimations and do not represent the current real-time
information. Furthermore, it shows that users require more
accurate information regarding public transportation.
Figure 5: Availability and importance of informa-
tion about delayed vehicles
We also asked if people seek for information about the lines
when they use them for the rst time. And, if they do so,
what kind of information they are able to nd (Figure 6).
Out of 670 responses, 510 said that they seek for informa-
tion on the their rst time usage. Among them, 289 said
they can nd the departure time from the line origin and
279 answered they can check the location of the interme-
diate stops. 139 people said they can nd the arrival time
to the nal destination. The other alternatives were the
timetables for intermediate stops (64 answers), statistics of
delays and other events (22 answers), and other information
(33 answers). Among other information, the most cited was
the line route or itinerary (18 answers). Other 40 respon-
dents said they cannot nd any information, and 26 of them
marked only this option. This number can be explained be-
cause people are not aware of the available resources to ac-
cess these information. Therefore, it is not enough to make
the information available, but it is also necessary to make
them easily accessible to the dierent categories of people
who need it.
Figure 6: Types of information found when passen-
gers use a line for the rst time
Based on the data discussed on this section, we can con-
clude that people generally seek for information about pub-
lic transportation. However, the information found is static,
taking into account estimations provided by the companies.
Most times this information does not match with what ac-
tually occurs, since 95% of respondents said that there are
recurring delays in the lines they use. This may occur due to
the lack of ways to assist users on being aware of the prob-
lems that cause delays in the lines. Therefore, this study
points out that public transportation users have very few
ways to get information about the lines they use and the
information obtained is incomplete and static.
4.2 Analysis of Hypothesis 2
The goal of the second hypothesis was to determine whether
passengers make use of the knowledge shared by other people
to obtain information about public transportation lines. We
aim to verify if there is a tendency of sharing and searching
this information via Internet.
In this regard, we asked about the way they get information
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 20 -
about bus timetables (Figure 2). 267 people (40%) said they
ask other people and 321 people (48%) reported they obtain
information via Internet. This shows that the Internet is the
most used way to obtain information, but collective knowl-
edge is also extensively used. By analyzing the people who
checked both options, we come to a total of 139 passengers
(21% of the total) who use the Internet and information from
others.
Another question that conrms the data presented above
concerns the way users look for information when using a
line for the rst time (Figure 7). From the 510 people that
seek for information, 314 said they obtain it through ac-
quaintances who use the same line, and nine said they go to
the stop and ask other people. To the same question, 376
people answered they use the Internet as a way to obtain
information. Only 41 people seek for the company services
and other 30 reported other options. When analyzing the
group of people that ask acquaintances or other people and
use the Internet, we have a total of 197 people (39% of the
510 people that seek for information).
Figure 7: How users seek for information when using
a line for the rst time
Among all 670 respondents, only 22 (3%) answered that
there are ways to become aware of delays before the vehicle
arrives at a stop. When asked about the way this infor-
mation is obtained, ten people said they check on terminals
available at the stops or ask the transportation company,
three of them answered they can check delays via Internet
and 10 people answered other options (ask relatives by
telephone, talk to other passengers at the stop, ask vehicle
conductors or trac inspectors).
We also observed the tendency of using social networks to
share and seek for information about incidents that occurred
in public transportation (Figure 8). We asked if, currently,
they post events related to the trac on their social net-
works. 225 respondents (34% of the total) saidyes. Among
the 445 users who answered no , 335 said they would re-
port if there was a specic application to do so. Only 110
people (16% of the total) said they do not report incidents
and would not report even though there was an application
to support this.
Regarding the use of information shared via Internet, we
Figure 8: Information sharing on social networks
asked passengers whether they would use an application that
displays information about bus lines in real time (dynami-
cally) (Figure 9). Most respondents - 646 (96%) - saidyes,
they would use such an application.
Figure 9: About the use of an application to obtain
real time information
According to the presented data, it is possible to say that
most passengers get information by asking other people (i.e.
from the collective knowledge). In addition, there is a ten-
dency to share and search for information due to the high
amount of passengers that already use the Internet to do it.
Conrming this tendency, many passengers said that they
already inform events that occur in public transportation or
would inform it if there was an application to support this,
and also that they would use an application that displays
real-time information about bus lines.
4.3 Analysis of Hypothesis 3
The goal of the third hypothesis was to verify whether pas-
sengers trust on information provided by unknown sources
or if they have more trust on information provided by people
in their social network. To do so, respondents were asked
if they participate in any social network (Figure 10). Out
of all 670 responses, only 24 (4%) said no. Among the
646 who answered yes, 539 said they use Orkut social net-
work, 448 use Facebook, 408 use Twitter, 33 use FourSquare
and 55 reported they use other (LinkedIn, MySpace, Flickr,
Youtube, and others).
People were also asked about their trust on information
about bus lines posted on the Internet (Figure 11). From
670 responses, only 27 (4%) said they do not rely on in-
formation posted on the Internet. From the remaining 643
responses, 111 said they trust on the information, regard-
less of who posted it, without considering the information
source. 196 of the respondents only trust on information
posted by the transportation company. 56 only trust on in-
formation posted by people in their social network. And 280
people answered they trust on information posted on social
networks and on information posted by the company.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 21 -
Figure 10: Social Network usage
The analysis of these data shows that, in general, people
prefer to have information supplied by transportation com-
panies. However, if we consider the people who relies only
on social networks and those that indicated they trust both
on social networks and transportation companies, we have
a total of 336 respondents, which shows that the informa-
tion published on social networks has a high acceptability.
Moreover, these numbers indicate that some people do not
care about the information source (17 %), but most prefer
to know the entity that provided it.
Figure 11: Trust on information posted on social
networks
4.4 Analysis of Hypothesis 4
The focus of Hypothesis 4 was to check whether applications
for mobile devices can be used as a way to share information
about public transportation. To retrieve this infomation, we
rstly asked passengers if they make use of Mobile Internet.
246 of the respondents answered yes and 424 said no,
as presented in Figure 12. The amount of people who an-
swered yes is apparently small, but represents 37% of all
respondents.Considering the high cost of devices that sup-
port web applications and data packages oered by mobile
phone companies in Brazil, the proportion is very signi-
cant. We further noted that 178 out of 246 people who said
yes live in the state capitals and other 34 live in cities with
more than 200.000 inhabitants, which totals 212 responses
of people living in big cities. This indicates that people us-
ing mobile technologies for Internet access live in cities that
present major trac problems.
Another important aspect is that only 49 respondents who
answered yes are occasional public transportation users.
Figure 12: Amount of people that use mobile Inter-
net
The other 197 people use public transportation some days
a weekor every day, showing that a substantial amount of
people that use mobile devices to access the Internet are fre-
quent public transportation users. It is estimated that over
the coming years, this scenario will be increasingly common,
as the cost of devices and data packages is reducing.
Thus, the answers indicate that the use of mobile applica-
tions is a trend and that, for this reason, it is important
to focus on the development of such applications. Eventu-
ally, more people that use public transportation will have
access to this technology and will take advantage of these
applications.
5. CONCLUSIONS
This paper presented the results of a survey applied to public
transportation users. The goal of this survey was to iden-
tify deciencies, needs and trends related to providing in-
formation to passengers related to the public transportation
real-time conditions. We could conclude that:
passengers need information about public transporta-
tion and, although there are several information avail-
able, they are, in general, static and based on estima-
tions. In most cases, information do not correspond to
the real conditions at the time users need it;
people often feel the need to seek for information about
public transportation and they use more often the In-
ternet and other people to achieve that information.
Thus, it could be relevant to combine these methods
into a single application in the web, which enable peo-
ple to build a collective knowledge about public trans-
portation conditions, making it available to all inter-
ested parties;
using social networks to share information is an in-
teresting alternative, since many people that use this
kind of social media, share and seek for information
through them;
using mobile devices to access the Internet is a trend,
and it enables information about public transporta-
tion events to be shared in real time, due to passen-
gers ubiquity. This resource is interesting because it
increases the power of collective intelligence.
From the results of this research, we are able to elicit the
requirements that address the needs of the UbiBus project
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 22 -
end users. The users feedback indicate that it is desirable to
build systems that use collective intelligence and that enable
passengers to share and seek for information about public
transportation through social networks applications via In-
ternet. By using these applications, the citizens will be able
to use the Internet, mobile devices and social networks to
indicate, in real time, events that help to map the routes
situation and the public transportation conditions. From
the information provided by several passengers, the system
will present, for example, lines delays, vehicle problems, best
or worst routes at a given moment, the best or worst lines
and bus companies, more or less dangerous regions, and so
on. These requirements are being implemented and will be
integrated in the UbiBus system. The results of these appli-
cations will be presented to the community in future works.
A limitation of this paper is that the survey was answered
by people in a subjective way, and there may be inconsis-
tencies. It is not possible to certify the truthfulness of the
information provided.
Acknowledgments
Authors thanks CNPq (process 560135/2010-6) for the -
nancial support. This work was [parcially] supported by
National Institute of Science and Technology for Software
Engineering
16
(INES).
6. REFERENCES
[1] K. Barry. How smartphones can improve public
transit. Wired Magazine, April 2010.
[2] B. Cauleld and M. OMahony. An examination of the
public transport information requirements of users.
Intelligent Transportation Systems, IEEE
Transactions on, 8(1):21 30, march 2007.
[3] A. A. de Castro Meirelles. Sistemas de transporte
inteligentes: aplica cao da telem atica na gestao do
transito urbano. Revista Inform atica P ublica, 1(1),
June 1999.
16
http://www.ines.org.br
[4] S. Ezell. Explaining international it application
leadership: Intelligent transportation systems.
Technical report, The Information Tech. and
Information Foundation, Washington, USA, 2010.
[5] B. Ferris, K. Watkins, and A. Borning. Location-aware
tools for improving public transit usability. IEEE
Pervasive Computing, 9:1319, 2010.
[6] V. Furtado, L. Ayres, M. D. Oliveira, E. V. Filho,
C. Caminha, J. Dorleans, and M. Belchior. Collective
intelligence in law enforcement - the wikicrimes
system. Information Sciences, 180:417, 2010.
[7] J. Howe. The rise of crowdsourcing. Wired Magazine,
14(6), June 2006.
[8] P. Levy. Collective Intelligence: Mankinds Emerging
World in Cyberspace. Helix Books, 1 edition, 1999.
[9] R. Ogliari. Crowdsourcing, muito melhor com mobile.
Revista Esprito Livre, 26:5155, Maio 2011.
[10] S. Rasmussen, M. J. Raven, G. N. Keating, and M. A.
Bedau. Collective intelligence of the articial life
community on its own successes, failures, and future.
Articial Life, 9(2):207235, April 2003.
[11] T. Segaran. Programming Collective Intelligence:
Building Smart Web 2.0 Applications. OReilly Media,
1 edition, 2007.
[12] J. S. Sussman. Perspectives on Intelligent
Transportation Systems (ITS). Springer, New York,
USA, 2005.
[13] V. Vieira, L. R. Caldas, and A. C. Salgado. Towards
an ubiquitous and context sensitive public
transportation system. In 4th International Conference
on Ubi-media Computing, Sao Paulo, SP, 2011.
[14] A. S. Vivacqua and M. R. Borges. Taking advantage
of collective knowledge in emergency response
systems. Journal of Network and Computer
Applications, In Press, Corrected Proof, 2011.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 23 -
Multides: a nova onda do CSCW?
Daniel Schneider
PESC/COPPE/UFRJ
Ilha do Fundo
Rio de Janeiro, RJ, Brasil
schneider@cos.ufrj.br
Jano de Souza
PESC/COPPE/UFRJ
Ilha do Fundo
Rio de Janeiro, RJ, Brasil
jano@cos.ufrj.br
Katia Moraes
PESC/COPPE/UFRJ
Ilha do Fundo
Rio de Janeiro, RJ, Brasil
katia@cos.ufrj.br
ABSTRACT
Na opinio de alguns pesquisadores, a onda das multides que
estamos presenciando nos ultimos anos mais um exemplo dos
desaIios que se colocam para a comunidade de CSCW, uma linha
de pesquisa que luta contra o dilema da Iragmentao. O Iato de o
CSCW historicamente ter servido como um ambiente de discusso
dos trabalhos de pesquisadores de diversas areas e ter abrangido
diIerentes programas, por outro lado, para muitos implica a
principal virtude deste campo de pesquisa. Este trabalho Iornece
uma caracterizao de sistemas de crowa computing proposta pelo
nosso grupo de estudos em multides, apresenta uma agenda de
pesquisa em CSCW no contexto destes sistemas, e Iinaliza
discutindo possiveis implicaes dos Ienmenos de massa sobre a
linha de atuao da comunidade de trabalho cooperativo
suportado por computador.
Categories and Subject Descriptors
H.5.3 |InIormation Systems| Group and Organization InterIaces
. .!!o/ . . o. . . . o. -
General Terms
Fatores humanos.
Keywords
Multides, multides virtuais, crowd computing, crowdsourcing,
computao humana, interao audincia-computador, Web 2.0,
Iragmentao do CSCW.
1. INTRODUO
Em janeiro de 2010 o jornal ingls The Guaraian pediu aos seus
leitores que votassem nas supostas especiIicaes do at ento
indito tablet da Apple. Desde o tamanho e peso at o nome e
caracteristicas do dispositivo, uma multido envolvendo mais de
10.000 pessoas enviou seus melhores palpites sobre o lanamento
do produto mais esperado do ano. Os resultados Ioram divulgados
posteriormente pelo jornal, e em mais da metade das categorias de
votao, a multido previu com preciso o que Steve Jobs veio a
anunciar no Iinal do mesmo ms, incluindo o nome iPaa do
tablet.
Este exemplo ilustra uma maneira simples de explorar a chamada
sabeaoria aas multiaes, conceito que popularizou-se
principalmente depois da publicao do livro homnimo pelo
jornalista americano James Surowiecki. Exemplos como estes
comeam a se tornar cada vez mais Irequentes na midia e nos
Iazem reIletir e pensar sobre questes como: o Iuturo da
humanidade estara nas multides? Quais as raizes deste Ienmeno
das multides, e que prognosticos podem ser Ieitos para o Iuturo?
Nosso grupo de estudos em Computao envolvendo multides
esta interessado em encontrar respostas para estas interrogaes e
particularmente neste trabalho investigar as seguintes questes:
Que papel tera a comunidade de CSCW - e particularmente
o grupo de pesquisa orientado a pratica de sistemas
colaborativos - no desenvolvimento de tecnologias de apoio
a colaborao de multides?
Seria ento o caso de mudarmos o Ioco de estudar
individuos e pequenas equipes para pensarmos num
groupware para multides? At o momento a comunidade
de pesquisa em CSCW tem Ieito investimentos isolados
nesse sentido, demonstrando indeciso.
A onda das multides sera apenas um reIlexo dos novos
tempos ou mais um sinal de que o CSCW caminha para se
tornar em breve uma 'coisa do passado? Atravs da
metodologia de reviso da literatura Ioi possivel encontrar
algumas respostas para este questionamento.
Finalmente, e no menos importante do que as anteriores:
qual a classe de sistemas computacionais que permitem
explorar o espao mental de multides? Nosso grupo Iez
progressos neste sentido.
A pauta de desaIios longa, e devemos considerar que pouco ou
nada se sabe sobre a dinmica social de multides, por exemplo,
em aplicaes que envolvem conceitos relativamente novos como
peer proauction |36|, crowasourcing |29|, colaborao em massa
|24|, persuaso em massa |42|, computao humana |6|,
inteligncia coletiva |40| e interao multido-computador |13|.
Os nomes so muitos mas em comum eles trazem multides
dispostas a colaborar, se divertir, produzir conhecimento e
resolver problemas. Esta onaa ae multiaes, no entanto, tem
levantado uma srie de preocupaes na comunidade do CSCW,
tradicionalmente Iocada em apoiar pequenos grupos no contexto
de trabalho.
O resto do artigo esta organizado da seguinte maneira. A seo 2
introduz o conceito de crowa computing e descreve os principais
elementos do espao a ser investigado; a seo 3 apresenta uma
tipologia para multides virtuais; na seo 4 so discutidos os
Iatores ou condies que motivam o sucesso ou o Iracasso de
aplicaes que envolvem multides; a seo 5 apresenta o
Permission to make digital or hard copies oI all or part oI this work Ior
personal or classroom use is granted without Iee provided that copies
are not made or distributed Ior proIit or commercial advantage and that
copies bear this notice and the Iull citation on the Iirst page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior speciIic permission and/or a Iee.
SBSC 2011, Outubro 57, 2011, Paraty, Rio de Janeiro, Brasil.
Copyright 2011 ACM.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 24 -
conceito de crowaware, na seo 6 so discutidas as implicaes
da onda de multides no processo de Iragmentao vivenciado
pela comunidade de CSCW e a seo 7 apresenta as concluses
deste trabalho de pesquisa.
2. MULTIDES E CROWD
COMPUTING
Uma deIinio inIormal, encontrada na Wikipdia, sugere que
uma multido representa 'um grupo granae ae pessoas aefiniao
atraves ae um obfetivo em comum ou confunto ae sentimentos
|10|. A deIinio tradicional de multido desaIiada por
tecnologias de comunicao emergentes. De acordo com
Roughton et al. |5|, a utilizao de tecnologias baseadas em
nuvem como o Twitter em tempo real mostra que a co-localizao
dos participantes no mais necessaria para engendrar o
comportamento coletivo comumente associado com a Iorma
tradicional de multido. Na opinio destes autores, multides
oIerecem um espao de problema unico para a implantao da
tecnologia em Iuno da organizao e composio dos seus
membros, e a escala apresentada pelo possivel numero de
participantes |5|.
Ainda que no exista uma deIinio amplamente aceita e
diIundida na literatura de Computao para uma crowa
computing, algumas tentativas Ioram Ieitas nos ultimos anos. Na
viso de |27|, a crowa computing combina aparelhos moveis e
interaes sociais para alcanar computao distribuida em larga
escala. Ha quem veja tambm a crowa computing como um
complemento a cloua computing (computao em nuvem), como
o pesquisador Srini Devadas do MIT. Na opinio de Devadas |8|,
a crowa computing seria uma nova aproximao a computao,
relativamente nova e descrita como bilhes de seres humanos
conectados a Internet, analisando, sintetizando, inIormando,
destilando e provendo opinio de dados, usando apenas a maquina
cerebral. Por outro lado, esta deIinio no exatamente a mesma
encontrada em |5|, onde os autores estudam a inIluncia de smart
phones e da inIra-estrutura da nuvem na experincia das
multides.
Neste trabalho, lanaremos mo de uma deIinio mais
abrangente de crowa computing, descrita na Wikipdia |30|, que
sustenta-a como 'um termo abrangente para aefinir uma miriaae
ae ferramentas ae interao humana que permitem a troca ae
iaeias, tomaaa ae aeciso no-hierarquica e a plena utili:ao
ao espao mental ao globo terrestre. A Iigura 1 ilustra nossa
proposta de caracterizao de sistemas de crowa computing na
Iorma de um diagrama de Venn, mostrando as interseces que
identiIicamos entre as diversas classes de aplicaes.
Com base neste modelo, cumpre salientar os seguintes pontos
levantados pelo nosso grupo:
O principal objetivo do diagrama descrever a estrutura
do espao a ser estudado e projetado, motivando
pesquisadores - no apenas do CSCW - a entender a
paisagem onde esto inseridos os sistemas de
computao envolvendo multides.
O espao em questo bem mais abrangente do que a
Web 2.0`, ou mesmo a esIera da 'Computao Social,
a qual a comunidade de CSCW ja vem dedicando
ateno nos ultimos anos.
Todas essas elipses descritas incentivam a explorao do
espao mental e da inteligncia coletiva na escala de
multides.
Figura 1. Sistemas de Crowd Computing
As sub-sees que se seguem discutem cada uma das elipses da
Iigura 1.
2.1 Web 2.0
O termo Web 2.0 associado com aplicaes da Web que
Iacilitam o compartilhamento de inIormao, a interoperabilidade,
o design centrado no usuario e a colaborao na Web |31|. Assim,
exemplos de aplicaes da Web 2.0 incluem blogs, servios de
rede social, wikis, Iolksonomias e outros exemplos do chamado
software social.
As principais conIerncias e fournals do CSCW ampliaram seu
escopo nos ultimos anos e passaram a dar ateno as comunidades
virtuais e a toda Iorma de Computao Social no contexto da Web
2.0. Existe uma vasta literatura abordando no apenas as
tecnologias e aplicaes da Web 2.0, como as sinergias entre esta
e o CSCW motivo pelo qual no investiremos nossos esIoros
na descrio desta seo.
2.2 Computao Humana
Na computao humana, ao invs de o ser humano Iazer uso do
computador para resolver problemas - como acontece na
computao 'tradicional' - o computador coloca uma pessoa ou
grupo de pessoas para resolver o problema, posteriormente
agregando os resultados e obtendo a soluo Iinal. A deIinio
mais conhecida de Computao Humana encontrada na
dissertao de doutorado de Luis von Ahn, deIendida em 2005, e
entitulada "Human Computation" |6|:
"Um paraaigma para a utili:ao ao poaer ae
processamento humano para resolver os problemas que
os computaaores ainaa no poaem resolver" |6|.
Outras deIinies encontradas na literatura sugerem
explicitamente o envolvimento de multides nos sistemas de
Computao Humana, como a deIinio que se segue:
"Uma nova area ae pesquisa que estuaa o processo ae
canali:ao aa vasta populao aa Internet para
reali:ar tarefas ou fornecer aaaos para resolver
problemas aificeis que nenhum algoritmo eficiente
computacional poae ainaa resolver" |7|
De acordo com |9|, porm, tais deIinies deixam claro que a
Computao Humana no abrange sistemas onde a iniciativa e
Iluxo de atividades so direcionados principalmente pela
inspirao dos participantes - ao contrario de um plano
predeterminado concebido para resolver um problema
computacional. Portanto, uma parcela razoavel das aplicaes da
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 25 -
Web 2.0, como projetos criativos de co-criao, no so
considerados dentro da esIera da Computao Humana. A
incluso ou no da Wikipdia no arcabouo da Computao
Humana motivo de debate entre alguns pesquisadores, havendo
o consenso, porm, de que o trabalho dos wikipedianos no se
limita meramente a realizar uma computao`.
Embora seja plenamente possivel que uma computao seja
realizada por apenas uma pessoa, as aplicaes descritas na
literatura at o momento envolvem um numero grande de pessoas,
sendo o turco mecnico da Amazon e o reCAPTCHA do Google
dois dos principais sistemas discutidos. Este ultimo consiste em
um servio gratuito que usa o conhecido teste CAPTCHA para
ajudar na digitalizao de livros, jornais e programas de radio
antigos, ao mesmo tempo que previne a invaso a sites por robs
|35|. De acordo com a pagina do oIicial do produto, cerca de 200
milhes de CAPTCHAs so resolvidos diariamente por pessoas de
todo o mundo. A soma de cada esIoro humano resulta na
digitalizao de obras completas. Este exemplo um exemplo
tipico de sistema que encaixa-se perIeitamente na interseco dos
sistemas de computao humana com os sistemas de
crowasourcing, que sero descritos na seo seguinte.
Acreditamos que muitos dos desaIios de suportar o trabalho
humano cooperativo no contexto destes sistemas so semelhantes
aos desaIios do crowasourcing. Por este motivo, adiaremos esta
discusso para a proxima seo.
2.3 Crowdsourcing
O termo crowasourcing Ioi cunhado em 2006 pelo jornalista JeII
Howe, editor da revista americana Wired. Howe Ioi o primeiro a
apontar a tendncia, num artigo publicado na revista em 2006
|29|. E comumente deIinido como o ato de terceirizar tareIas,
tradicionalmente realizadas por um empregado de uma empresa, a
um grupo indeIinido e grande de pessoas (a "multido"), atravs
de uma chamada aberta. Uma deIinio mais abrangente,
Iornecida em |9|, deIine o crowasourcing como 'o ato ae
explorar as habiliaaaes perceptivas, enativas e cognitivas ae
muitas pessoas para alcanar um resultaao bem aefiniao, como
resolver um problema, classificar um confunto ae aaaos, ou
proau:ir uma aeciso. Consideramos esta deIinio bem mais
abrangente, sem compromisso como o empregado` ou a
empresa`, e com ela que trabalhamos nesta pesquisa. E
importante salientar tambm o descomprometimento da deIinio
com o computador` ou a tecnologia`, muito embora os exemplos
Irequentemente discutidos na literatura sobre o assunto envolvam
alguma Iorma de apoio computacional. E o caso, por exemplo, da
Wikipdia, do Linux, do Yahoo! Respostas, ou mesmo do turco
mecnico da Amazon. Segundo |2|, 'a Internet e o surgimento aa
Wikipeaia fi:eram com que a multiao passasse a ser
iaentificaaa como aetentora ae uma sabeaoria capa: ae criar
solues improvaveis.
Arthur |32| aIirma que muito esIoro esta sendo dirigido para o
desenvolvimento de sistemas de crowasourcing e este esIoro tem
sido reIerenciado atravs de diversos nomes, incluindo peer
proauction, conteudo gerado pelo usuario, sistemas colaborativos,
sistemas comunitarios, sistemas sociais, pesquisa social, midia
social, inteligncia coletiva, wikinomics, sabedoria das multides,
smart mobs, colaborao em massa, e computao humana. Essas
nomeaes so, na verdade, temas distintos e com caracteristicas
proprias. Isso deixa evidente a dimenso dessa area e conIirma a
possibilidade de interseces com outras areas - ja ilustradas na
Iigura 1 - e variedade de exemplos que podem ser listados dentro
destas interseces.
Muitas empresas tm investido em plataIormas de crowasourcing
para promover a inovao nos ultimos anos. O Innovation Jam,
por exemplo, traz um conceito mais genrico, o Jam`, deIinido
como um gigantesco brainstorming virtual onde Iuncionarios,
clientes e mesmo Iamiliares de Iuncionarios contribuem
ativamente, e em tempo real, na gerao de idias |34|. E um
evento que tem sido promovido pela IBM anualmente desde 2006
como parte de um plano de projeto para engendrar a inovao. Em
2006, por exemplo, a IBM reuniu mais de 150.000 pessoas de 104
paises e 67 empresas, lanando 10 novas empresas IBM |35|.
Um dos desaIios identiIicados pelo nosso grupo de pesquisa aqui
inclui a investigao dos obstaculos ao envolvimento de
multides em contexto de crowasourcing, e de que maneira o
CSCW - ou um groupware para multides` - poderia contribuir
neste contexto. Muitos sustentam que a globalizao da Iora de
trabalho atravs da multido pode aIetar a maneira como as tareIas
so realizadas, bem como os eIeitos sociais de oIerecer este tipo
de trabalho em outros sistemas de crowasourcing. Na opinio de
|28|, a magia` do crowasourcing em grande parte esta em como
permitir que muitas pessoas contribuam na execuo de uma
tareIa - de diversas maneiras - sem desIazer o que outros Iizeram
antes deles, em sua maior parte. Ja Erickson |28| sugere que uma
dimenso Iundamental do crowasourcing diz respeito a nature:a
aas tarefas que os individuos de uma multido iro executar.
TareIas simples com resultados bem deIinidos esto intimamente
ligadas a incentivos simples e so candidatas a serem
incorporadas em jogos - como o ESP GAME. Na nossa viso,
essas tareIas estaro associadas a entidade social do coletivo e, em
alguns casos, a multiaes em reae |18|, conIorme descrio que
sera Ieita na seo III. Ja tareIas complexas em que os individuos
precisam desenvolver competncias so mais adequadas aos
mecanismos de incentivo enraizados na dinmica social das
comunidades - envolvendo explicitamente mecanismos de suporte
a colaborao. Tais tareIas estaro relacionadas a multides
organizadas em grupos.
2.4 Interao Audincia-Computador
As audincias envolvem individuos e grupos desconhecidos, para
os quais a comunicao em massa abordada, geralmente unidos
por sua participao no uso da midia |34|. Uma tendncia recente
esta voltada exatamente para o apoio a interao com multides.
Segundo |13|, as pesquisas em Interao Humano-Computador
(IHC) esto evoluindo para incluir interaes onde multides
podem colaborar para produzir algum tipo de saida em uma
maquina. A area que trata especiIicamente desse assunto
conhecida como Interao Multido-Computador (do ingls,
Crowa Computer Interaction) e neste campo de pesquisa que se
encaixa a interao audincia-computador. Sistemas que permitem
a interao de grandes publicos trazem novas oportunidades para
o entretenimento, educao e Iormao de equipe |39|.
A Interao Multido-Computador comeou a se destacar em
1991, durante uma apresentao no teatro eletrnico do
SIGGRAPH da implantao do Cinematrix Interactive
Entertainment System |40|. O Cinematrix descreve o sistema
como um 'mouse para as massas sem Iio, de Iorma que toda a
audincia possui um controle em tempo real sobre jogos de
computador exibidos em um display |39|.
Tecnologias de interao audincia-computador so utilizadas, em
sua maioria, para aumentar o engajamento do publico em eventos,
com o objetivo de estimular uma maior interao social entre os
integrantes e obter um Ieedback util. Os trabalhos desenvolvidos
voltam-se especialmente para grandes exposies publicas, como
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 26 -
eventos olimpicos e shows musicais. Uma gama de produtos se
destacam, incluindo:
Displays interativos: Em geral, no contexto de
audincias, grandes teles so utilizados com o intuito
de Iornecer inIormao, prover interatividade e
aumentar a colaborao entre os membros. A interao
com o usuario vai desde a simples apresentao de uma
inIormao, passando pela capacidade de deteco de
publico, at Iormas mais soIisticadas que usam
reconhecimento de expresso Iacial e gestos.
Sistemas de Resposta a Audincia (Audience
Response System): Ferramentas voltadas para a criao
de apresentaes interativas, criando um vinculo entre o
apresentador e o publico, conectando a audincia nos
diversos tipos de eventos e ajudando a estimular a
participao. Estes sistemas so mais explorados em
contextos educativos e os dispositivos utilizados pelos
alunos para transmitir suas respostas as perguntas so
conhecidos como lecture clickers ou, simplesmente,
clickers |14|.
Cheering meters: Proposto em |11| e |12|, Ioi resultado
de estudos em interao publico-artista onde os autores
analisaram as Iormas de interao do publico para criar
o prototipo apresentado. O prototipo desenvolvido usa
uma unica variavel, o som emitido pelo publico,
podendo distinguir diIerentes niveis de vibrao da
platia, ao invs de apenas a presena de aplausos |11,
12|.
Em geral, as pesquisas tm se voltado para a construo de
solues que visam apoiar audincias em grandes eventos, tendo
destaque para os eventos esportivos, como as Olimpiadas. Em sua
maioria, os sistemas se baseiam em aplausos, aclamaes da
platia, e clickers. O SoMo |41|, por exemplo, um sistema de
votao cujo objetivo julgar grandes eventos esportivos, como
Olimpiadas. A soluo baseada na captura de som e animao
do publico, batendo palmas, aplaudindo ou acenando, para avaliar
o desempenho dos atletas de Iorma natural |41|. A captura de som
Ieita atravs de microIones distribuidos ao longo do estadio e o
movimento captado por meio de cmeras que gravam o
comportamento da platia. Um telo utilizado para mostrar as
repeties e os melhores momentos do evento, alm de Iornecer
um Ieedback da votao para a platia. Ja o Opnionizer, descrito
em |20|, um display projetado com o objetivo de promover a
interao entre as pessoas em ambientes publicos.
Tendo em vista as categorias de crowasourcing listadas
anteriormente, observa-se um estreitamento deste com a interao
audincia-computador a partir de duas categorias:
- Crowd Wisdom: A expresso do publico, capturada em sistemas
como o Opnionizer e o Magic Board |10|, muito bem
aproveitada em pesquisas de opinio ou mercados preditivos; o
lecture clicker tambm um exemplo onde a participao dos
alunos pode ajudar a encontrar solues otimas para um dado
problema.
- Crowdvoting: E um exemplo que se encaixa bem nessa
interseco de interao audincia-computador com
crowasourcing. Embora isto no seja mencionado na literatura
investigada, os sistemas cujo objetivo principal o julgamento do
publico representam uma Iorma de crowavoting, sendo o sistema
de votao das Olimpiadas de Inverno de 2010 |38| um exemplo
Iiel. O objetivo era envolver o publico nos eventos dos jogos,
dando oportunidade de participar da pontuao. Foram criados
trs prototipos voltados para os seguintes espectadores: para o
publico participante do evento, dispositivos ARS Ioram instalados
no descanso de brao de cada assento; os telespectadores tinham a
oportunidade de votar utilizando um aplicativo para smart phone;
e para os espectadores online, uma interIace de votao Ioi
disponibilizada junto ao video.
3. TIPOLOGIA DE MULTIDES
VIRTUAIS
Fenmenos de massa so investigados desde o sculo XIX por
sociologos como Gustave Le Bon |23|, Sigmund Freud |22| e
outros. Desde ento, diversas teorias Ioram desenvolvidas para
explicar o comportamento de multides e diIerencia-lo do
comportamento individual de seus membros, como a psicologia
de multides e a teoria do comportamento de multides de Freud.
Alguns mitos sobre multides reais tambm so reportados na
literatura |21|.
Russ |16| sustenta que as multides virtuais tm suas origens nas
mesmas leis que regem as multides reais, variando porm de
tamanho, velocidade e alcance. Carr |17| props recentemente
uma tipologia para melhor caracteriza-las, em um dos posts de seu
blog Rough Type. E importante observar que os tipos propostos
pelo autor no so mutuamente exclusivos, ou seja, uma mesma
aglomerao de pessoas pode apresentar caracteristicas de
diversos tipos, em determinado momento da interao ou ao longo
do tempo. Na opinio de Dron e Anderson |18|, uma conIuso
Ieita na literatura quando se tenta explicar as varias Iormas de
organizao social das multides virtuais atravs de uma unica
lente. Segundo os autores, ha de Iato trs entidades distintas - o
Grupo, a Reae, e o Coletivo - e a conscincia dessas entidades
pode ser explorada pelos projetistas de soItware para melhor
atender aos usuarios das aplicaes envolvendo multides. A
Figura 2 ilustra a tipologia proposta por Carr, onde cruzamos os
tipos propostos no trabalho do autor com as entidades de Dron e
Anderson. Nosso grupo tambm descreveu algumas instncias
representativas destas multides ilustrando cada um dos tipos.
Figura 2. Tipologia de Multides Virtuais 17]
A multiao aa proauo social - primeira entidade identiIicada
por Carr representa um grande grupo de pessoas que emprestam
seus talentos distintos para a criao de produtos - como a
Wikipedia ou o Linux; ja a multiao aa meaia atua como um
grupo de estudo, proporcionando um julgamento 'mdio que, em
alguns casos, mais preciso que o de um individuo; a multiao
aa minerao descreve um grande grupo de pessoas que, sem o
conhecimento explicito dos seus membros, produz um conjunto
de dados que podem ser coletados e analisados a Iim de obter
inIormaes sobre os padres de comportamento. O quarto tipo
identiIicado Ioi denominado multiao aa reae e representa
qualquer grupo que negocie inIormaes atravs de um sistema de
comunicao compartilhada como o Facebook. O autor
identiIicou ainda a multiao aa transao Iomentando operaes
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 27 -
ponto-a-ponto e, por sugesto de um leitor do seu blog, um sexto
e ultimo tipo chamado de multiao ao evento, representando um
grupo que atravs das Ierramentas de comunicao virtual
organiza-se para eventos que podem acontecer no mundo real ou
virtual. A Iigura 3 ilustra as trs Iormas de organizao social de
multides virtuais.
Multiaes em grupos normalmente possuem papis para seus
integrantes e raramente apreciam o anonimato. So os menos
escalaveis, uma vez que sua eIicacia diminui depois de atingir um
determinado numero de participantes. Isto ocorre porque os
mecanismos que garantem a eIicacia da colaborao como o
'social grounaing' e o a carga cognitiva compartilhada, so podem
ocorrer com poucos participantes. Multiaes em Reae constituem
uma Iorma mais Iluida de entidade social em que os membros
aderem, criam e se retiram de conexes sociais e vinculos em
Iuno de alguns Iatores. Uma rede conecta individuos
distribuidos, que no necessariamente conhecem todos os outros a
quem esto conectados. Sua Iorma mutavel. A terceira e ultima
entidade, o Coletivo, representa a Iorma mais escalavel de
multido na qual os membros participam para o beneIicio
individual, mas suas atividades so colhidas e agregadas para
gerar a sabedoria das multides`. No Coletivo, o conjunto de
aes dos membros processado por algoritmos de agregao que
podem ser to simples como uma contagem de votos, ou to
complexos quanto um Iiltro colaborativo multi-camadas.
Individuos no tm conhecimento dos outros, no esto
conectados e nem comprometidos.
Figura 3. Organizao Social de Multides Virtuais
4. SUCESSO E FRACASSO DE
APLICAES ENVOLVENDO
MULTIDES
O sucesso das aplicaes que tiram proveito do espao mental de
multides parece depender Iundamentalmente do conceito de
massa critica, como pode ser observado em servios de redes
sociais virtuais como o Facebook, que se Iosse uma nao seria
uma das trs mais populosas do mundo com mais de 750 milhes
de usuarios ativos em julho de 2011. Pensando nestas questes,
Russ |16| desenvolveu um modelo ou arcabouo de quatro Iases
cujo principal objetivo era entender as caracteristicas e o
comportamento de multides reais e virtuais - para melhor
projetar e prever o sucesso ou Iracasso de servios e comunidades
virtuais. A Iigura 4 ilustra graIicamente o modelo de Russ para
multides virtuais.
Na Iase de iniciao, o Iator mais importante o conteudo
valioso. Sem nenhum atrativo ningum vai estar disposto a gastar
tempo com o servio virtual. Alm do conteudo, usabilidade e
simplicidade da interIace do usuario so essenciais. Na segunda
Iase - de propagao - os melhores membros so deIinidos. Os
usuarios comeam a popular a plataIorma virtual e a deciso sobre
juntar-se ou no a comunidade depende dos membros existentes.
Esta transio desencadeada pelo airecionamento nos outros`.
Em resumo, os membros ativos e que ocupam uma posio central
na multido exercem sua inIluncia: a) gerando conteudo novo; b)
minimizando o risco para os outros que querem entrar; e c)
ajudando os novatos nos problemas diarios do sistema (gerando
conIiana).
Figura 4. Modelo de Multides Virtuais 16]
Todavia, os melhores` membros no so suIicientes para o
crescimento da multido e Iormao de uma estrutura auto-
organizavel, sendo necessaria uma terceira etapa, a de
ampliIicao. Nesta Iase, importante oIerecer aos usuarios no
apenas uma plataIorma estavel e escalavel, mas um ambiente
social saudavel. A transio de Iase marcada pela massa
critica`. Nesta etapa, caracteristicas de Iacilitao social que
suportam as praticas cotidianas e comportamentos sociais so
essenciais para manter o servio em expanso e viabilizar a
diIuso viral. Na quarta e ultima Iase - de terminao - alguns
servios virtuais so descontinuados ou desmembrados, em
decorrncia da saturao.
Para Iinalizar esta seo, cumpre salientar que a construo de
massa critica ja era uma preocupao antiga dos teoricos do
groupware. Da mesma Iorma, preocupaes com avaliaes dos
sistemas de groupware tambm ja Ioram reportadas na literatura, e
no contexto de multides, elas se tornam ainda mais desaIiadoras.
5. MULTIDES E GROUPWARE
Embasados nos requisitos basicos de comunicao, coordenao e
cooperao, os sistemas colaborativos apoiam os grupos na
realizao dos seus trabalhos, quebrando barreiras de tempo e
espao. Produtos comerciais CSCW so Ireqentemente
reIerenciados como Groupware |19|. Segundo |19|, groupware
pode ser visto como a classe de aplicaes, para pequenos grupos
e para as organizaes, resultante da Iuso entre computadores,
grandes bases de inIormao e tecnologia de comunicaes;
podendo ou no apoiar especiIicamente a cooperao.
Embora o conceito induza um entendimento que se restringe a um
pequeno grupo de trabalho, CSCW passou a abranger
recentemente mais que isso. Pode-se pensar em aglomeraes de
propores maiores, onde os membros compartilham ou no
algum tipo de interesse, colaboram mesmo que
inconscientemente, podem ou no se conhecer, porm esto
inseridos em um contexto comum, quaisquer que sejam as
chances que os uniu. Dentro desse dominio maior, nosso grupo de
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 28 -
pesquisa esta interessado em estudar uma nova modalidade dentro
do CSCW: o crowaware.
Neste trabalho, crowawares so deIinidos como sistemas voltados
para o suporte a multides virtuais e reais, herdando os
componentes principais do groupware, aliados a Web 2.0 e a
Computao em Nuvem; de Iorma a prover servios avanados a
qualquer momento e em qualquer lugar, conectando individuos
inseridos em ambientes heterogneos. Sendo assim, as classes de
sistemas esquematizadas na Figura 1 adquirem um espao mais
Iormalizado dentro do CSCW como um crowaware.
Os sistemas de crowdware podem ser analisados da mesma Iorma
que os de groupware, categorizados na noo de tempo e espao,
conIorme a matriz 2x2 proposta por |19|:
Mesmo tempo e mesmo local: Trata-se de sistemas que
apoiam multides reunidas em um mesmo local Iisico e
ao mesmo tempo. Os exemplos mais comuns desse tipo
de multides so as audincias. Isso torna evidente que,
para determinados dominios de aplicao, a ubiqidade
torna-se um requisito indispensavel em crowawares.
Como exemplos dessa categoria, pode-se destacar os
seguintes sistemas: Cinematrix, onde os membros se
encontram no mesmo espao Iisico; e o GoogleDocs,
no qual o mesmo espao virtual compartilhado.
Mesmo tempo e locais diferentes: Os membros podem
interagir compartilhando do mesmo espao virtual (a
exemplo do Twiddla e GoogleDocs), como tambm
podem utilizar espaos de trabalho diIerentes, porm,
tendo a percepo da presena e atividade dos demais
membros (como ocorre em redes sociais). E importante
lembrar que, em certos casos, onde a multido coopera
em prol de um trabalho comum, esses sistemas precisam
coordenar as atividades realizadas.
Figura 5. CROWDWARE
Tempos Diferentes e Mesmo Local: Em geral,
multides encaixadas nesta classe alcanam um grau de
anonimidade alto. A tecnologia pode interagir com uma
multido que muda a todo momento, que compartilha de
interesses em comum (noticias em displays) ou que
colabora para um objetivo comum (uma pesquisa em
um terminal eletrnico), sem a necessidade da
percepo e de uma interao explicita. Como tambm
pode existir a necessidade de percepo em um contexto
onde o grau de anonimidade baixo (Google Gocs).
Tempos Diferentes e Locais Diferentes: Esta classe
inclui sistemas que vo de baixa (redes sociais) a alta
anonimidade (compra coletiva), pequenas
(comunidades, Google Docs) e grandes multides
(crowavoting), com (Flick, Google Docs) ou sem
necessidade de percepo (compra coletiva),
compartilhando (Wikipdia, Google Docs) ou no
compartilhando (crowafunaing) de um espao virtual
em comum.
Observamos que os quadrantes no so mutuamente exclusivos, e
que o crowasourcing se Iez presente em todos. A Figura 5,
analisada em conjunto com a Figura 1, revela a dimenso que
crowasourcing possui dentro da crowa computing. A maioria dos
sistemas esto inclusos nesta elipse e todas as regies de
interseco so crowasourcing. Isso leva a uma reIlexo e ao
seguinte questionamento: no Iuturo, o crowasourcing se
transIormara em um termo designando o arcabouo de todas as
modalidades da crowa computing?
6. MULTIDES E A FRAGMENTAO
DO CSCW
Como programa de pesquisa, o CSCW surgiu em resposta ao
desdobramento de duas crises do Iinal dos anos 80: a da
comunicao mediada por computador (CMC) e a da automao
do escritorio. At a dcada de 80, a maioria dos trabalhos sobre
apoio a grupos e ao trabalho em equipe Iocavam em apoiar os
processos de deciso de grupos de pessoas Iisicamente juntas.
Com o advento da tecnologia de redes de computadores, o Ioco
mudou para o apoio ao trabalho em equipe a distncia |37|.
Nos ultimos anos, a evoluo dos soItwares, tecnologias de
hardwares incluindo as redes sem Iio e dispositivos de
posicionamento, somados ao continuo amadurecimento da
Internet e da computao ubiqua, proporcionaram o uso intensivo
de aplicaes e servios avanados, a qualquer momento e em
qualquer lugar, gerando graves implicaes para a matriz do
CSCW. Em uma conIerncia realizada em 2008 (COOP08),
muitos praticantes demonstraram preocupao com os novos
ventos, sobretudo com a popularizao da midia social e dos
Ienmenos de colaborao de massas que comeavam a proliIerar.
De la para ca, muitos pesquisadores da area, incluindo alguns
veteranos do CSCW e do Groupware, envolveram-se numa
disputa por posies, assumindo novos papis, como Grudin e
Krault que publicaram recentemente na area de Wiki. As ultimas
duas conIerncias anuais do CSCW promovidas pela ACM (2010-
2011) apresentaram trabalhos abordando todas as elipses
ilustradas na Iigura 1 deste artigo, da Web 2.0 a interao
audincia-computador. Alega-se que este tipo de pesquisa
reativa no que se reIere a tecnologia e ao projeto, no
contribuindo de Iorma sistematica e construtiva para o
desenvolvimento tecnologico |25|. Dentro desse cenario, existe o
sentimento de perplexidade compartilhado por uma parcela da
comunidade do CSCW de que o programa de pesquisa no mais
oIerece direes conIiaveis |33|.
Em um recente trabalho de avaliao critica do cenario de
pesquisa atual do CSCW, Schmidt |25| sustenta que a pesquisa do
CSCW dos dias atuais representa uma vida apos a morte das
tecnologias de comunicao mediada por computador (CMC)
dentro do CSCW: "Onaa apos onaa (ae faciliaaaes ae
comunicao), aparentemente novas, chamaram a ateno
repetiaas ve:es aa miaia e ao publico em geral. mensagens
instantaneas, mensagens ae texto, chat, blogs, e assim por aiante.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 29 -
[...{ E agora, mais uma ve:, como resultaao aa super-
plataforma` forneciaa pelo navegaaor web, estas faciliaaaes
atingiram uma escala ae massa tambem" |25|. No mesmo
trabalho de pesquisa do autor, um espao consideravel dedicado
a critica aspera a alguns dos principais representantes do CSCW,
que lamenta o estagio avanado de Iragmentao` a que chegou o
mesmo. A esperana de Schmidt se perde quando aqueles que
poderiam Iazer algo para mudar esta situao, hesitam, ratiIicando
uma indeciso da comunidade de pesquisa desde os primeiros
anos de sua existncia. Tal Iato evidenciado quando ele comenta
o trabalho de reviso bibliograIica realizado em 2003 por Olson &
Olson |26| - dois veteranos do CSCW: "Ele associa o CSCW com
a area ae pesquisa ae CMC que o preceaeu por muitos anos. Mas
o mais notavel e que ele aeixa ae fora o corpo significativo ae
pesquisa ao CSCW que envolve investigaes ae praticas ae
trabalho cooperativo em ambientes profissionais [...{ Termos
como etnografia`, estuao ao local ae trabalho`, ou trabalho ae
campo`, nem mesmo aparecem no artigo" |25|.
E como se ele dissesse: 'Eles no sabem o que Iazem". Na
concluso do trabalho, o autor enIatiza que as aplicaes da Web
envolvendo colaborao de massas - nos ultimos anos - Iizeram
ressurgir um CSCW ja sem gas para prosseguir, levantando at
mesmo a possibilidade do campo de estudo como prejudicial` a
cincia. Todavia, o autor no Iornece nenhum indicativo dos
rumos que poderiam ser tomados, ou mesmo se as quatro letras
|1| teriam salvao. O trabalho do autor no Iaz nenhuma
reIerncia aos Ienmenos mais recentes envolvendo massas como
o crowasourcing, os sistemas de computao humana e de
interao audincia-computador. Tal Ierramental seria tambem
apenas uma reedio das tecnologias de comunicao mediada por
computador nos tempos atuais do CSCW?
E Iato que o acrnimo do CSCW, pelo menos da Iorma como Ioi
concebido ha algumas dcadas, no mais encontra lugar no
Mundo 2.0` da ubiquidade, da Web social, e das multides. O
primeiro 'C' mudou bastante, ja que os tablets, smartphones e
outros dispositivos concorrem de igual para igual com os
computadores tradicionais; o 'S' do suporte mudou sensivelmente:
de Ierramenta de apoio a tecnologia essencial; o segundo 'C' - do
cooperativo - evoluiu dos grupos pequenos para as multides; e
Iinalmente o 'W' do trabalho migrou dos ambientes proIissionais
das grandes corporaes para contextos de trabalho inIormais, ou
mesmo outros contextos como o lazer e a educao. Resta agora a
duvida do que sera dito a nova gerao de pesquisadores, pois
durante dcadas vendeu-se a idia de que o CSCW era uma Iesta
da qual todos poderiam participar - e ningum pagaria a conta.
7. CONCLUSES
O principal objetivo deste artigo Ioi apresentar uma proposta de
caracterizao de sistemas de crowa computing - deIinida como
uma miriade de Ierramentas de interao humana que permitem a
utilizao do espao mental de multides - e investigar as
sinergias com o campo de pesquisa do CSCW. Na opinio dos
autores, esta miriade representada atualmente pela unio de
quatro classes de sistemas identiIicadas na Iigura 1 do artigo.
O estudo realizado pelo nosso grupo at aqui nos permite
enxergar a Web 2.0 apenas como ponto de partida para um
Mundo 2.0 no qual as multides tero seu lugar garantido, e no
qual o arcabouo do CSCW precisa ser revisto. Para que se
viabilize a plena utilizao do espao mental de multides e
explorao da inteligncia coletiva, papel de destaque devera ser
exercido pelas tecnologias ubiquas, persuasivas, e tambm
colaborativas.
Para alguns pesquisadores mais otimistas do CSCW a onda das
multides tende a ser vista apenas` como mais um exemplo dos
dilemas que historicamente vm atormentando uma parcela da
comunidade. Outros alegam que o Iato de o CSCW abranger
diIerentes programas de pesquisa, o que para muitos implica uma
virtude dessa comunidade, impede que se crie uma contribuio
sistematica e cumulativa ao desenvolvimento de novas tecnologias
|25|. Apesar dessas divergncias, descritas sobretudo em |25|, ha
uma opinio unnime no nosso grupo de pesquisa de que o
modelo de programa multidisciplinar e o sistema de quatro letras
em busca de um contexto chegaram a um impasse. Na luta para
superar esta situao, encontra-se em jogo o Iuturo do CSCW.
8. REFERNCIAS
|1| BANNON, Liam J.; SCHMIDT, Kjeld: CSCW: Four
characters in search oI a context. In ECSCW89, 13-15 Sept.
1989, Gatwick, London, London, 1989, pp. 358-372.
|2| DOAN, Anhai; RAMAKRISHNAN, Raghu; HALEVY,
Alon Y.. Crowdsourcing systems on the World-Wide Web.
Communications of the ACM 54.4 (2011): 86. Web.
|3| ANDERSON, Terry. Higher education evolution: Individual
Ireedom aIIorded by educational social soItware. In: M.
Beauaoin (Ea.), Perspectives on the Future of Higher
Eaucation in the Digital Age. (pp. 77-90). New York: Nova
Science Publishers.
|4| SUROWIECKI, James. A sabeaoria aas multiaes. Rio de
Janeiro: Record, 2006.
|5| ROUGHTON, A. et al. The Crowd in the Cloud. In: 12th
Australasian User Interface Conference (AUIC2011), Perth,
Australia, January 2011.
|6| VON AHN, L. Human computation. In: Proceeaings of the
4th International conference on Knowleage capture, p.5-
6,October 28-31, 2007, Whistler, BC, Canada.
|7| CHANDRASEKAR, R.; CHI, E.; CHICKERING, M.;
IPEIROTIS, P. G.; MASON, W.; PROVOST, F.; TAM, J.;
VON AHN, L. Front matter. In: Proc. SIGKDD HCOMP
2010.
|8| DEVADAS, S. Especialista aefenae conceito ae crowa
computing. Disponivel em:
http://computerworld.uol.com.br/tecnologia/2010/07/22/esp
ecialista-deIende-conceito-de-crowd-computing~. Acesso
em: jul. 2011.
|9| QUINN, A.; BEDERSON, B.B. Human Computation: A
Survey and Taxonomy oI a Growing Field. In: Proceeaings
of CHI 2011.
|10| WIKIPEDIA. Crowa. Disponivel em:
http://en.wikipedia.org/wiki/Crowd~. Acesso em: jul. 2011.
|11| BARKHUUS, Louise. Engaging the Crowa at Concert
Events. Web. 14 Fev 2011.
|12| BARKHUUS, Louise; JORGENSEN, Tobias. Engaging the
crowd: studies oI audience-perIormer interaction. In: CHI
08 extenaea abstracts on Human factors in computing
systems. New York, NY, USA: ACM, 2008. 29252930.
Web.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 30 -
|13| SETIADARMA, Katherine. Crowa computer interaction.
Disponivel em:
http://www.cs.auckland.ac.nz/courses/compsci705s2c/assig
nments/SeminarReports09/crowdComputingkset010.pdI~.
Acesso em: jan. 2011.
|14| MURPHY, Trevor. Success and Iailure oI audience response
systems in the classroom. Proceeaings of the 36th annual
ACM SIGUCCS fall conference. moving mountains, bla:ing
trails. New York, NY, USA: ACM, 2008. 3338. Web.
|15| TANG, Anthony et al. Designing Ior bystanders: reIlections
on building a public digital Iorum. Proceeaing of the twenty-
sixth annual SIGCHI conference on Human factors in
computing systems. New York, NY, USA: ACM, 2008. 879
882.
|16| RUSS, C. Online Crowds - Extraordinary mass behavior on
the Internet. In: Proceeaings of i-Meaia 07, Graz, Austria,
pp.65-76, October 2007.
|17| CARR, Nicholas. A typology of crowas. Disponivel em:
http://www.roughtype.com/archives/2010/03/atypologyoI
c.php~ . Acesso em: jul. 2011.
|18| DRON, J.; ANDERSON, T. How the crowd can teach. In: S.
Hat:ipanagos & S. Warburton (Eas.), Hanabook of
Research on Social Software ana Developing Community
Ontologies (pp. 1-17).
|19| ELLIS, Clarence A.; GIBBS, Simon J.; REIN, Gail.
Groupware - Some Issues and Experiences. Communications
of the ACM, v.34, p. 38-58, 1991.
|20| BRIGNULL, Harry; ROGERS, Yvonne. Enticing people to
interact with large public displays in public spaces. IN:
PROCEEDINGS OF THE IFIP INTERNATIONAL
CONFERENCE ON HUMAN-COMPUTER INTERACTION.
2003.
|21| SCHWEINGRUBER, David; WOHLSTEIN, Ronald T. The
Maaaing Crowa Goes to School. Myths about Crowas in
Introauctory Sociology Textbooks. Teaching Sociology
33(2):136-53. 2005.
|22| FREUD, S. Group Psychology ana Analysis of the Ego.
XVII (2nd ed.), Hogarth Press, 1955.
|23| LE BON, Gustav. The Crowa. A Stuay of the Popular Mina.
London: T. Fisher Unwin.
|24| TAPSCOTT, Don; WILLIAMS, Anthony D. (2007).
Wikinomics. como a colaborao em massa poae muaar o
seu negocio. Rio de Janeiro: Editora Nova Fronteira. 2006.
|25| SCHMIDT, K. Divided by a common acronym: On the
Iragmentation oI CSCW. In: Proceeaings of the European
conference on Computer Supportea Cooperative Work 2009,
Springer London: Viena, Austria. p. 223-242.
|26| OLSON, Gary M.; OLSON, Judith S. Groupware and
computer-supported cooperative work. In: The Human-
Computer Interaction Hanabook. Funaamentals, Evolving
Technologies ana Emerging Applications, Lawrence
Erlbaum, Mahwah, New Jersey, 2003, pp. 583-595.
|27| MURRAY, D.G.; YONEKI, E.; CROWCROFT, J.; HAND,
S. 2The Case Ior Crowd Computing. In: ACM MobiHela,
2010.
|28| ERICKSON, T. Some Thoughts on a Framework Ior
Crowdsourcing. In: CHI 2011 Workshop on Crowasourcing
ana Human Computation. IBM T. J. Watson Research
Center.
|29| HOWE, J. The Rise of Crowasourcing, Wired, 14.
|30| WIKIPEDIA. Crowa computing. Disponivel em:
http://en.wikipedia.org/wiki/Crowdcomputing~. Acesso
em: jul. 2011.
|31| WIKIPEDIA. Web 2.0.
http://pt.wikipedia.org/wiki/Computaosocial~. Acesso
em: jul. 2011.
|32| ARTHUR, Edgard. Crowasourcing. Quanao a multiao
supera o especialista. Disponivel em:
http://www.crowdlabore.com.br/blog/~. Acessado em: Iev.
2011.
|33| SCHMIDT, Kjeld. Cooperative Work ana Coorainative
Practices. Contributions to the Conceptual Founaations of
Computer-Supportea Cooperative Work. 1 ed. Springer,
2011. Print.
|34| IBM. Software, Open Source, SOA, Innovation, Open
Stanaaras, Trenas. Disponivel em:
https://www.ibm.com/developerworks/mydeveloperworks/b
logs/ctaurion/entry/innovationjam2008?langen~. Acesso
em: jul. 2011.
|35| IBM. The history of Jams. Disponivel em:
https://www.collaborationjam.com/~. Acesso em: jul. 2011.
|36| BENKLER, Y. Coases Peguin, or, Linux and the Nature oI
the Firm. In: Yale Law vol. 112.
|37| TERKEN, Jacques; SUBRAMANIAN, Sriram;
ZANCANARO, Massimo. Special issue on user-centred
design and evaluation oI ubiquitous groupware. In: Personal
ana Ubiquitous Computing 12 (2008): 179180. Web.
|38| LAM, Christopher; LANG, Phun; SOO, JeII; BOND, Tim;
HAGGMAN, Lindsay. 2010 Winter Olympics Crowd
Voting. In: CHI 2009, April 4 9, 2009, Boston.
|39| Maynes-Aminzade, Dan; PAUSCH, Randy; SEITZ, Steve.
Techniques Ior Interactive Audience Participation. In:
Proceeaings of the 4th IEEE International Conference on
Multimoaal Interfaces. Washington, DC, USA: IEEE
Computer Society, 2002. 15. Web. 14 Fev 2011.
|40| CARPENTER, L. Cinematrix, viaeo imaging methoa ana
apparatus for auaience participation. US Patent, Nos.
5210604 (1993), 5365266 (1994).
|41| VAN BEUSEKOM, Marcelle; BIGNERT, Jakob; TASAR,
zgr. SoMo: an automatic sound & motion sensitive
audience voting system. In: CHI 04 extenaea abstracts on
Human factors in computing systems. New York, NY, USA:
ACM, 2004. 16801684. Web.
|42| FOGG, BJ. Mass interpersonal persuasion. An early view of
a new phenomenon.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 31 -

S E S S O 2
Inteligncia Coletiva
Um modelo para o suporte computacional da inteligncia
coletiva na web
Straus Michalsky
Departamento de Cincia da Computao
Instituto de Matemtica e Estatstica (IME)
Universidade de So Paulo (USP)
straus@ime.usp.br
Marco Aurlio Gerosa
Departamento de Cincia da Computao
Instituto de Matemtica e Estatstica (IME)
Universidade de So Paulo (USP)
gerosa@ime.usp.br

ABSTRACT
The web 2.0 is collaborative. From the interactions between
people, emerges what has been called collective intelligence.
There are several algorithms to support collective intelligence in
web systems, but their use is often complicated, making it difficult
to exploit their potential. Since the concept of collective
intelligence is very broad, we performed a domain analysis in
existing systems to create a computational model for the
collective intelligence in the web.

RESUMO
A web 2.0 caracterizada por ser colaborativa. Das interaes
entre pessoas, emerge o que vem sendo chamado de inteligncia
coletiva. H vrios algoritmos para dar suporte inteligncia
coletiva em sistemas web, porm muitas vezes seu uso
complicado, dificultando a explorao do seu potencial em
aplicaes web. Como o conceito de inteligncia coletiva muito
amplo e mal definido, foi realizada uma anlise de domnio, uma
classificao das tcnicas e seus usos nos sistemas atuais de forma
a criar um modelo para o suporte computacional da inteligncia
coletiva na web.
Categories and Subject Descriptors
H.5.3 [Group and Organization Interfaces]: Web, H.5.3
[Group and Organization Interfaces]: Web-based interaction
General Terms
Algorithms, Design, Human Factors.
Keywords
Collective Intelligence, Domain analysis, Web, collaborative
systems.
Palavras-Chave
inteligncia coletiva; anlise de domnio; web 2.0; sistemas
colaborativos.
1. INTRODUO
De 2000 a 2010 a quantidade de usurios da internet subiu 440%
1
,
atingindo quase dois bilhes de pessoas. Essa quantidade de
indivduos navegando e gerando informaes, direta ou
indiretamente, produz uma quantidade de dados inimaginvel h
algumas dcadas. Anderson [1] caracteriza essa situao como
Era do Petabyte.
A web 2.0 colaborativa. Sites que possibilitavam apenas
interaes monousurio passaram a incorporar recursos voltados
para colaborao direta e indireta entre os usurios. Sites de
comrcio eletrnico, como a Amazon
2
, por exemplo, passaram a
oferecer para cada produto suporte avaliao, resenha, troca de
mensagens, wiki, compartilhamento de fotos, filtragem
colaborativa, recomendao. Os sistemas web 2.0 ficam melhores
na medida em que mais usurios interagem e contribuem [2], [3].
A inteligncia coletiva (IC) comumente entendida com um
comportamento que emerge da colaborao em um grupo de
indivduos. Uma das razes do sucesso dos sites na web 2.0
justamente aproveitar a inteligncia coletiva [4]. Assim, um
desafio para os sites da web 2.0 consiste em oferecer ferramentas
que fomentem a inteligncia coletiva.
A fim de simplificar o suporte inteligncia coletiva, este
trabalho apresenta uma modelagem do suporte computacional
para a inteligncia coletiva em aplicaes web 2.0. Para que tal
modelagem seja avaliada, ser executada uma anlise de domnio
a fim estudar como a inteligncia coletiva explorada na web 2.0,
utilizando uma abordagem baseada no mtodo Feature-Oriented
Domain Analysis (FODA) [6].
2. INTELIGNCIA COLETIVA NA WEB
Apesar de ser um tema muito comentado atualmente, a
inteligncia coletiva j vem sendo estudada desde o incio do
sculo XX. As primeiras ligaes do termo inteligncia coletiva
com computadores foram feitas em 1980 por Johnson-Lenz &
Johnson-Lenz [7] em um trabalho chamado 'Groupware. the
emerging art of orchestrating collective intelligence`. A
capacidade de coletar informaes de milhes de pessoas na web
abriu novas possibilidades adicionando assim uma nova dimenso
a esse tema. O conceito web 2.0 e suas caractersticas foram
definidas durante uma conferncia realizada com a participao de
Tim O`Reilly e Dale Dougherty. Nela Ioram observados que
varias das empresas que sobreviveram ao estouro da 'bolha ponto
com que aconteceu em 2001 possuiam caractersticas em
comum, dentre essas caractersticas est a utilizao da
inteligncia coletiva. Essa inteligncia vem recentemente

1
http://www.internetworldstats.com/stats.htm.
2
http://www.amazon.com.

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference10, Month 12, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010.$10.00.

VIII Simpsio Brasileiro de Sistemas Colaborativos
- 33 -
ganhando notoriedade de socilogos e tericos [5] e [8], nos
negcios [9] e [10] e na cincia da computao [2] e [3].
O termo inteligncia coletiva ainda amplo e mal definido. A
seguir so apresentadas algumas definies encontradas na
literatura. [8] descreve a inteligncia coletiva como uma
'inteligncia distribuida por toda a parte, incessantemente
valorizada, coordenada em tempo real, que resulta em
mobilizao eIetiva das competncias. De acordo com Alag [3]
quando um grupo de indivduos colabora ou compete entre si,
surge uma inteligncia ou um comportamento que de outra forma
no existiria; isto conhecido como inteligncia coletiva. J no
Handbook of Collective Intelligence [11], produzido
colaborativamente e organizado pela equipe do MIT Center for
Collective Intelligence, a inteligncia coletiva definida como
sendo grupos de indivduos fazendo coisas coletivamente que
parecem ser inteligentes. Eles tambm caracterizam a inteligncia
coletiva como grupos enfrentando ou tentando novas situaes ou
grupos aplicando o conhecimento para se adaptar a um ambiente
em mudana. Normalmente tecnlogos usam o termo inteligncia
coletiva no sentido de que a combinao de comportamento,
preferncias ou ideias de um grupo cria novas percepes [2]. Em
analogia inteligncia individual, Woolley et al. [12] definem
inteligncia coletiva em um grupo como a habilidade geral do
grupo de executar uma ampla variedade de tarefas. Em resumo, as
definies encontradas na literatura colocam a inteligncia
coletiva como um comportamento ou 'inteligncia resultante da
colaborao em um grupo.
3. SUPORTE COMPUTACIONAL DA
INTELIGNCIA COLETIVA
A inteligncia coletiva pode emergir como um resultado natural
da colaborao e, portanto, recursos computacionais para suporte
colaborao podem ser vistos como suporte computacional
inteligncia coletiva. Entretanto, neste trabalho daremos o
enfoque na inteligncia coletiva que fomentada em um grupo de
pessoas por informaes derivadas por meio do processamento de
dados proveniente da interao social e individual com o sistema.
Dessa forma, importante salientar a diferena entre um
mecanismo de inteligncia coletiva e um mecanismo de
colaborao. Enquanto um mecanismo de colaborao fornece
meios diretos de colaborao, os mecanismos de inteligncia
coletiva apresentam as informaes derivadas dos dados
coletados. Um exemplo de mecanismo de colaborao um bate-
papo, que facilita a comunicao em tempo real entre os usurios
do sistema. J um exemplo de mecanismo de inteligncia coletiva,
do ponto de vista deste trabalho, uma lista de recomendaes de
objetos de interesse do usurio, apresentado na pgina cujo objeto
est sendo visualizado e que construda com base nas aes dos
usurios.
Alag [3] apresenta uma diviso para o suporte computacional
inteligncia coletiva em trs partes: a primeira consiste nos meios
de coleta de dados, a segunda, nas formas de derivao de
inteligncia coletiva, e a terceira, nas aplicaes nos sistemas web
2.0. Baseado nessa diviso foi criado um modelo (Figura 1) de
como a inteligncia coletiva fomentada computacionalmente em
um grupo de usurios que esto interagindo em um sistema web
2.0. Para que a inteligncia coletiva seja fomentada necessria a
coleta de dados das interaes dos usurios, a derivao da
inteligncia coletiva desses dados e a apresentao dos resultados
na forma de mecanismos de inteligncia coletiva.
A coleta de dados efetuada capturando-se aes realizadas na
colaborao ou mesmo durante a interao de um indivduo com o
sistema (representada pelo termo interao individual na Figura
1). A coleta explcita ou implcita [3]: a coleta explcita
acontece quando o usurio est ciente que ele est adicionando
informao ao sistema. So exemplos de coleta explcita:
votaes, criao de revises, produo de contedo, insero de
tags ou mesmo adio de comentrios. J a coleta implcita
acontece sem o usurio ter cincia da sua ocorrncia e os dados
dessa coleta normalmente so originados de uma interao
individual. A navegao, os cliques em uma pgina, a ao de
salvar o contedo, a gerao de verso de impresso e a efetivao
de uma compra so exemplos de coleta implcita.









Figura 1. Modelo para suporte computacional da IC

A etapa de coleta de dados engloba tambm a estruturao dos
dados. Para se atingir a estruturao dos dados necessrio seu
mapeamento e tratamento para que possam ser utilizados por
algoritmos que derivem a inteligncia coletiva. No mapeamento,
os dados so organizados em dicionrios previamente definidos
pelos algoritmos. Alguns dados necessitam tambm de tratamento
para representar as interaes dos usurios computacionalmente.
Um exemplo o processamento de textos para gerao de vetores
de termos [3].
O passo de derivao da inteligncia coletiva executa a
derivao das informaes que iro fomentar a inteligncia
coletiva. Esse passo utiliza os dados estruturados e algoritmos de
recuperao de informao, inteligncia artificial, minerao de
dados, entre outros. Um exemplo simples de derivao da
inteligncia coletiva o uso de um algoritmo que verifica a
quantidade de acessos de cada objeto do sistema e entrega ao
mecanismo de inteligncia coletiva de listagem dos objetos mais
populares, a lista dos objetos mais acessados.
Um mecanismo de inteligncia coletiva um elemento de
interface cujo objetivo fomentar a inteligncia coletiva. Como
citado anteriormente um exemplo de mecanismo de inteligncia
coletiva uma lista de recomendaes de objetos de interesse.
Outro exemplo de mecanismo de inteligncia coletiva uma
nuvem de tags que apresenta as tags mais utilizadas pelos usurios
do sistema.
4. ANLISE DE DOMNIO
A anlise do domnio uma das etapas da engenharia de domnio
e possibilita que caractersticas comuns e variveis sejam
identificadas e organizadas utilizando um processo sistemtico
[13]. So identificadas, coletadas e organizadas informaes
relevantes do domnio, utilizando para tal o conhecimento
existente e tcnicas para modelagem de informao [6].
Inteligncia coletiva
Interao social/Interao individual
Coleta de
Dados
Mecanismos
de IC
Derivao
da IC
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 34 -
Foi escolhida neste trabalho a tcnica Feature-Oriented Domain
Analysis (FODA). A modelagem FODA orientada a
caractersticas (features). De acordo com Kang et al.[6] essas
caractersticas so atributos do sistema que afetam diretamente os
usurios finais. Assim, as informaes obtidas na anlise
determinam os limites que norteiam o domnio, as caractersticas
comuns e variveis de aplicaes.
Para classificar as caractersticas levantadas foi utilizado o modelo
3C de colaborao [14] de forma similar ao trabalho feito por
Oliveira & Gerosa [15], no qual foi feita a anlise de domnio
tendo como domnio a colaborao em redes sociais de
compartilhamento na web 2.0. No modelo 3C, a comunicao est
relacionada com a troca de mensagens e informaes entre
pessoas; a coordenao relacionada ao gerenciamento de
pessoas, suas atividades e recursos; e a cooperao a produo
que acontece em um espao compartilhado.
Para avaliar a utilizao da anlise de domnio com o modelo 3C
de colaborao para inteligncia coletiva na web 2.0, foi feito
anteriormente um estudo piloto utilizando como domnio o
jornalismo online na web 2.0[16]. Na anlise de domnio final
foram consideradas aplicaes diversas da web 2.0. Essas
aplicaes foram analisadas e foram levantadas caractersticas que
possibilitam a coleta de dados para derivao da inteligncia
coletiva e caractersticas que sirvam como mecanismos de
inteligncia coletiva. Como os sites avaliados normalmente no
disponibilizam os algoritmos utilizados para derivar a inteligncia
coletiva, no foi possvel averiguar qual algoritmo foi utilizado na
derivao da inteligncia coletiva.
Os sites que foram utilizados para a anlise so os 10 mais
acessados globalmente listados pelo Alexa
3
que atendam as
seguintes caractersticas: segue os conceitos da web 2.0 e possui
verses em ingls ou portugus.
5. RESULTADOS
Os resultados obtidos na Anlise do domnio bem como
discusses sobre os mesmos so encontrados nesta sesso. A lista
de sites obtidos utilizando os critrios definidos na seo 4 dia
20/05/2011 a seguinte: Google, Facebook, YouTube, Yahoo,
Blogger, Wikipdia, Windows Live, Twitter e MSN.
A lista de caractersticas que so possveis fontes de dados no
domnio proposto levantada a partir dos sites selecionados
juntamente com a lista de caractersticas j levantada por
Michalsky et al. [16] : comentrio, enquete, lista de discusso,
denncia, seguir tpico, compartilhamento, avaliao, produo
que possibilita aos usurios adicionarem novas notcias no
sistema, indicao, upload, busca, tags, verso de impresso,
salvar que possibilita aos usurios salvarem objetos para prximos
acessos ao sistema, login, dados de outras redes que possibilita
aos usurios definirem outros sistemas que participam para uma
possvel integrao, publicar status, favoritos, localizao, pr-
visualizao. J a lista de mecanismos de IC contem as seguintes
caractersticas: resultados de busca, recomendaes, tendncias,
lista de atualizaes, objetos em destaque, tag cloud, tags do
sistema.
5.1 Anlise das Caractersticas
A avaliao das caractersticas foi feita visualmente, em imagens
capturadas de cada site avaliado. Cada caracterstica encontrada
foi marcada como ilustrado na Figura 2.

3
http://www.alexa.com.

Figura 2 - Avaliao das caractersticas
Na Tabela 1 apresentada a lista de sites avaliados com a lista de
caractersticas que so possveis fontes de dados. Essas
caractersticas foram classificadas de acordo com sua funo no
modelo 3C .
Tabela 1 Possveis fontes de dados

Os mecanismos de IC no foram classificados no modelo 3C pois
como eles so elementos de interface podem ser colocados em
diferentes funes de acordo com sua aplicao. Esses
mecanismos tm uma funo direta de manter a awareness dos
usurios. A Tabela 2 apresenta a lista de sites avaliados bem como
a lista de mecanismos de IC encontrados.
5.2 Discusso
O mecanismo de IC recomendaes foi encontrado em todos sites
avaliados, no possvel descrever qual a forma que as
recomendaes so executadas e nem quais dados so utilizados.
Mas possvel verificar sua importncia nas aplicaes.
A possvel fonte de dados busca foi encontrada em todos os sites
avaliados. No se pode afirmar se ele utilizada durante a
derivao da IC em todos os sites, mas em alguns sites avaliados,
como a Wikipdia, ela umas das poucas formas de coleta de
dados disponveis para serem utilizadas neste momento.

C
a
r
a
c
t
e
r

s
t
i
c
a
s

Comunicao
Coorde-
nao
Cooperao Interao Individual
C
o
m
e
n
t

r
i
o

E
n
q
u
e
t
e

L
i
s
t
a

d
e

D
i
s
c
u
s
s

o

D
e
n

n
c
i
a

S
e
g
u
i
r

T

p
i
c
o

C
o
m
p
a
r
t
i
l
h
a
m
e
n
t
o

A
v
a
l
i
a

o

P
r
o
d
u

o

I
n
d
i
c
a

o

U
p
l
o
a
d

B
u
s
c
a

P
u
b
l
i
c
a
r

S
t
a
t
u
s

F
a
v
o
r
i
t
o
s

T
a
g
s

V
e
r
s

o

I
m
p
r
e
s
s

o

S
a
l
v
a
r

L
o
g
i
n

D
a
d
o
s

P
r


v
i
s
u
a
l
i
z
a

o

L
o
c
a
l
i
z
a

o

Sites
Google x x x x x x
Facebook x x x x x x x x x x x x
Youtube x x x x x x x x x x x x
Yahoo x x
Blogger x x x x x x x x x
Wikipedia x x x
Windows
Live
x x x x x
Twitter x x x x x x x x
MSN x x x x
Linked In x x x x x x x x x
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 35 -

As seguintes caractersticas levantadas por Michalsky et al. [16]
no foram encontradas: verso de impresso, lista de discusso e
salvar. Esse fato pode ter ocorrido devido diferena nos
domnios avaliados, pois enquanto o domnio da primeira
avaliao abrangia o jornalismo online essa segunda avaliao foi
caracterizada por mecanismos de busca e redes sociais em sua
maioria.
Tabela 2 Mecanismos de IC
















6. CONSIDERAES FINAIS
Este artigo apresentou a anlise de domnio da Inteligncia
Coletiva na web 2.0 por meio do FODA, realizando uma
classificao das caractersticas dentro das formas de colaborao
apresentadas e das formas de Inteligncia Coletiva que podem ser
exploradas. Com os resultados obtidos temos um guia para o
desenvolvimento de novos sistemas web 2.0 e reavaliao dos
existentes. Espera-se com isso um maior suporte inteligncia
coletiva e consequentementente uma melhor iterao do usurio
com o site.
De todos os sites avaliados foram encontrados uma media de 7
possveis fontes de dados e 3,8 Mecanismos de IC por site.
Lembrando que no foram avaliadas todos as funcionalidades do
sites apenas as que esto diretamente relacionadas com o a
funcionalidade principal do site descrita no Alexa.
As etapas, coleta de dados, derivao da IC e apresentao dos
resultados por meio de um mecanismo de IC, apresentadas no
modelo da Figura 1, esto presentes em todos os sites avaliados.
As caractersticas levantadas sero implementadas na forma de
componentes para o Groupware Workbench
4
. Com estes
componentes prontos criao de aplicativos para web 2.0
facilitada uma vez que a complexidade encontrada na derivao
da Inteligncia Coletiva fica encapsulada dentro dos componentes
criados e quem desenvolve a aplicao pode manter o foco nas
funcionalidades do sistema.

4
http://www.groupwareworkbench.org.br.
7. REFERNCIAS
[1] ANDERSON C. The end of theory: The data deluge makes the
scientific method obsolete - Wired Magazine: 16.07. Disponvel em:
<http://www.wired.com/science/discoveries/magazine/16-
07/pb_theory>.
[2] SERAGAN, T. Programming Collective Intelligence: Building
Smart web 2.0 Applications, O`Reilly. 2007.
[3] ALAG, S. Collective Intelligence in Action. Manning Publications,
2008.
[4] O`REILLY, T. What is web 2.0: Design patterns and business
models for the next generation of software, 2005. Disponvel em:
<http://oreilly.com/web2/archive/what- is-web-20.html>. Acesso
em: 17 de Janeiro de 2011.
[5] SUROWIECKI, J. The Wisdom of Crowds, Anchor. 2005.
[6] KANG, K. C. et al. Feature-Oriented Domain Analysis (FODA)
Feasibility Study. : CMU/SEI. 1990.
[7] JOHNSON-LENZ, P.; JOHNSON-LENZ, T. Groupware: The
Emerging Art of Orchestrating Collective Intelligence. In: Global
Conference on the Future, 1., Toronto, Canada, 1980.
[8] LEVY, P. A Inteligncia Coletiva: por uma Antropologia do
Ciberespao. CIDADE: Loyola, 2003.
[9] SHIRKY, C. Here Comes Everybody: The Power of Organizing
Without Organizations, Penguin Press HC, 2008.
[10] TAPSCOTT, D.; WILLIAMS, A.D. Wikinomics: How Mass
Collaboration Changes Everything. 2008.
[11] HANDBOOK of collective intelligence (2011) Disponvel em:
<http://scripts.mit.edu/~cci/HCI/index.php>. Acesso em: fevereiro
2011.
[12] WOOLLEY, A. W.; CHABRIS, C. F.; PENTLAND, A.; HASHMI,
N.; MALONE, T. W. Evidence for a collective intelligence factor in
the performance of human groups. Science , v. 330, p. 686-688,
2010.
[13] PRIETO-DIAZ, R.; ARANGO, G. Domain Analysis Concepts and
Research Directions. In: PRIETO-DIAZ, R.; ARANGO, G. (ed.).
Domain Analysis and Software Systems Modeling: IEEE
Computer Society Press. 1991.
[14] FUKS, H.; RAPOSO, A.; GEROSA, M.A.; PIMENTEL, M.;
LUCENA, C.J.P. (2007) 'The 3C Collaboration Model In: KOCK,
Ned (org.). The Encyclopedia of E-Collaboration, p. 637-644,
2007.
[15] OLIVEIRA, L. S.; GEROSA, M. A. Uma engenharia de dominio
baseada em padres de interao e no modelo 3c de colaborao para
redes sociais de compartilhamento na Web 2.0. In: SIMPOSIO
BRASILEIRO DE SISTEMAS MULTIMIDIA E WEB, 2010, Belo
Horizonte, MG. Anais do WebMedia, 2010, v. 2, p. 4952.
[16] MICHALSKY, S.; MAMANI, E.Z.S.; GEROSA, M. A. A
Inteligncia Coletiva na Web: Uma Anlise de Domnio para o
Jornalismo Online. In: SIMPSIO BRASILEIRO DE SISTEMAS
MULTIMDIA E WEB, 2010, Belo Horizonte. Anais do
WebMedia, 2010.





C
a
r
a
c
t
e
r

s
t
i
c
a
s

R
e
s
u
l
t
a
d
o

d
e

B
u
s
c
a

R
e
c
o
m
e
n
d
a

o

T
e
n
d

n
c
i
a
s

L
i
s
t
a

d
e

a
t
u
a
l
i
z
a

e
s

O
b
j
e
t
o
s

e
m

d
e
s
t
a
q
u
e

T
a
g

C
l
o
u
d

T
a
g
s

d
o

s
i
s
t
e
m
a

Sites
Google x x
Facebook x x x
Youtube x x x x x
Yahoo x x x x
Blogger x x x x x
Wikipedia x x x
Windows Live x x x
Twitter x x x x
MSN x x x x
Linked In x x x
Amazon x x
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 36 -
Predio de falhas em projetos de software baseado em
mtricas de redes sociais de comunicao e cooperao
Vidal D. da Fontoura
UTFPR Universidade
Tecnolgica Federal do Paran
Campus Campo Mouro
vidalfontoura@hotmail.com
Igor Fabio Steinmacher
UTFPR Universidade
Tecnolgica Federal do Paran
Campus Campo Mouro
igorfs@utfpr.edu.br
Igor Scaliante Wiese
UTFPR Universidade
Tecnolgica Federal do Paran
Campus Campo Mouro
igor@utfpr.edu.br
Marco Aurlio Gerosa
IME/USP Universidade de
So Paulo
gerosa@ime.usp.br
ABSTRACT
This paper presents an approach to predict failures in open source
projects based on social networks metrics. Social networks will be
created by mining conversations from developers mailing list and
from the comments provided on the issue manager. Cooperation
social networks will be extracted from the log of versioning
management system, enabling the identification of developers that
worked on the same class. Matrices that represent the social
networks will keep the degree of interaction among developers in
each social network. Social Network Analysis (SNA) metrics will
be used to calculate and identify patterns on these interactions.
These values will be used as input to a Bayesian model which,
after being trained, will enable build failure prediction.
RESUMO
Este trabalho apresenta uma abordagem de predio de falhas em
projetos de software livre baseado em mtricas de redes sociais da
comunicao e cooperao entre os desenvolvedores. Sero
construdas redes sociais de comunicao extradas a partir das
conversas na mailing list de desenvolvedores e nos comentrios
realizados no sistema gerenciador de tarefas. Para a cooperao
sero extrados dados do log do sistema gerenciador de verso,
possibilitando identificar quando desenvolvedores trabalharam em
uma mesma classe. Matrizes que representem as redes sociais
sero criadas para armazenar o grau de interao em cada rede
social. Mtricas de Anlise de Redes Sociais (Social Network
Analysis) sero utilizadas para calcular e identificar padres
existentes na interao. Estes valores sero utilizados como
entrada no modelo bayesiano, que depois de treinado, possibilitar
a predio de falhas em uma build.
Keywords
predio de falhas, anlise de redes sociais, cooperao e
comunicao.
1. INTRODUO
Pesquisadores de engenharia de software tm uma variedade de
abordagens para criar redes sociais e estudar fenmenos da rea.
Dentre elas, Meneely et al [5] menciona aquelas baseadas em
minerao de logs de sistemas gerenciadores de verso
[2],[7],[9],[11],[16],[8] e minerao de mensagens de diferentes
meios de comunicao. [7],[16],[1].
Dentre os diversos fenmenos que podem ser estudados na
engenharia de software, destacam-se aqueles relacionados
comunicao e cooperao entre os membros de uma ou mais
equipes de software no desenvolvimento de suas tarefas. Para
analisar aspectos de cooperao e comunicao pode-se utilizar
recursos relacionados a criao e gerao de redes sociais [5]. O
uso de Anlise de Redes Sociais (SNA-Social Network Analysis)
possibilita descrever, caracterizar e entender redes sociais por
meio da explorao de suas propriedades. [4]
Diante deste cenrio este trabalho pretende estudar a comunicao
e a cooperao, considerando as mtricas e redes sociais utilizadas
nos trabalhos relacionados, com o objetivo de verificar se
possvel melhorar a predio de falhas em projetos de software
livre. Os projetos selecionados para o estudo emprico sero
minerados do repositrio da Apache Software Foundation (ASF).
Esta escolha foi feita a partir de uma investigao prvia, que
permitiu identificar que possvel minerar informaes sobre
falhas, comunicao e cooperao.
Este trabalho est organizado da seguinte forma: a Seo 2
apresentar os conceitos de comunicao, cooperao e mtricas
de SNA comparando as abordagens dos trabalhos relacionados. A
Seo 3 descreve a metodologia de coleta de dados para a
realizao do estudo emprico, as redes sociais que sero criadas e
como ser realizada a predio de falhas e sua validao. A Seo
4 apresenta os prximos passos da pesquisa e as concluses do
trabalho parcial j realizado.
2. CONTEXTO
Com o objetivo de predizer falhas em projeto de software livre
com base nas estruturas de comunicao e de cooperao dos
desenvolvedores, foi realizada uma reviso bibliogrfica. Nesta
Seo sero abordados conceitos de cooperao, comunicao e
mtricas SNA.
2.1 Cooperao
Esta subseo apresentar como os trabalhos relacionados que
utilizam dados de cooperao entre os desenvolvedores criam
redes sociais e utilizam mtricas de SNA para interpretar dados
destas redes e predizer falhas.
Fuks et al [3], define cooperao como membros de um grupo que
operam em conjunto para manipular e organizar informaes,
construindo e refinando objetos. Segundo Steinmacher et al [12]
identifica a cooperao quando um ou mais desenvolvedores
interagem com artefatos compartilhados de maneira sncrona ou
assncrona.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference10, Month 12, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010$10.00.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 37 -
Wolf et al [16] desenvolveu um estudo que tem por objetivo
predizer falhas utilizando SNA. No projeto de software estudado
as tarefas e os objetivos de cada release so agrupados em itens de
trabalho (work items) e atribudos a equipes de desenvolvimento.
Os itens de trabalho so desenvolvidos de forma paralela por mais
de uma equipe sendo necessria a sua integrao para a definio
de uma build do projeto. Desta forma as equipes tem que cooperar
entre si para conclurem os objetivos das releases. Assim,
conexes so criadas em uma rede social considerando aqueles
desenvolvedores que trabalharam em um mesmo item de trabalho.
J Meneely et al [5] analisou o histrico dos arquivos de um
projeto verificando os responsveis pelas atualizaes de cada
arquivo. Identificando todos os desenvolvedores que atualizaram
um determinado arquivo (classe), so criadas conexes entre esses
desenvolvedores. Estas conexes indicam quais foram os
desenvolvedores que cooperaram para o desenvolvimento de um
artefato.
2.2 Comunicao
Esta subseo apresentar como os trabalhos relacionados
consideram a comunicao no seu contexto, e como ela ser
considerada neste trabalho.
Wolf et. al [16] observou os comentrios deixados pelos
desenvolvedores nos commits dos itens de trabalho. No seu estudo
ele considera somente esta forma de comunicao para criar as
redes sociais.
Bier et, al [1] minerou os comentrios feitos por desenvolvedores
em um gerenciador de tarefas (issues). Ele optou por esta
comunicao porque considera que os desenvolvedores
expressavam suas opinies quando estes tm relaes com tarefas.
2.3 Mtricas de SNA
Esta seo apresentar os trabalhos relacionados que consideram o
uso de SNA com intuito de predizer falhas. Como visto nas
subsees 2.1 e 2.2, a literatura indica que estudos podem ser
realizados analisando a comunicao e cooperao para predizer
falhas. O Quadro 1 relaciona os estudos e as mtricas de SNA
utilizadas nos trabalhos descritos nas sees 2.1 e 2.2. A definio
de cada uma das mtricas pode ser encontrada nos trabalhos
correlatos e tambm so apresentadas em [14].
Observa-se no Quadro 1 que diferentes mtricas foram utilizadas
para medir as propriedades extradas das redes sociais dos
trabalhos relacionados identificados. Em todos os trabalhos estes
valores calculados a partir da SNA foram utilizados como entrada
para o modelo de predio.
Mtricas SNA [16] [5] [1]
Centralidade X X X
Densidade X X
Structural Hole X
Diametro X
Coeficiente de Clustering X
Bridge X
Characteristic Path Lenght X
Quadro 1: Comparao das mtricas de SNA
2.4 Consideraes finais
Este trabalho pretende utilizar a combinao das mtricas
identificadas nos trabalhos relacionados para verificar a
possibilidade de melhoria da predio de falhas utilizando SNA.
Outro diferencial encontra-se nos dados que sero minerados a
partir da comunicao e cooperao, oferecendo uma maior
quantidade de dados para criao das redes sociais. O Quadro 2
apresenta as redes sociais criadas nos trabalhos relacionados e
quais sero construdas nesta proposta.
Redes Sociais [16] [5] [1] Esta proposta
Comunicao em
Issues
X X
Comunicao em
Mailing list
X
Comunicao em
Commits
X X
Minerao de
Cooperao em
SVN
X X X X
Quadro 2: Comparao das redes sociais utilizadas para
clculo das mtricas de SNA.
3. Modelo de Predio de Falhas baseado
em mtricas de SNA para redes sociais de
comunicao e cooperao
Trs questes de pesquisa sero utilizadas para guiar a
metodologia deste trabalho.
D (Q1) Mtricas de SNA aplicadas a redes sociais
extradas de mecanismos de comunicao dos desenvolvedores
podem auxiliar a predio de falha em projetos de software?
D (Q2) Mtricas de SNA aplicadas a redes sociais
extradas de mecanismos de cooperao dos desenvolvedores
podem auxiliar a predio de falha em projetos de software?
D (Q3) Resultados combinados a partir da analise das
redes sociais criadas podem melhorar os resultados de predio?
Para responder estas questes um experimento ser realizado. A
subseo 3.1 apresentar como se pretende realizar a coleta de
dados. A subseo 3.2 apresenta os passos para criao das redes
sociais de comunicao e cooperao. A subseo 3.3 explica
como ser realizado o treinamento da rede bayesiana utilizada no
modelo de predio e por fim, a subseo 3.4 discute as mtricas
para validao da predio realizada.
3.1 Coleta de dados
Ser realizada a coleta de dados de projetos armazenados nos
repositrios da ASF.
Neste repositrio a comunicao ser minerada de diferentes
fontes de discusso, tais como: comentrios em tarefas (issues),
comentrios feitos por um desenvolvedor no instante em que ele
realiza commits e das discusses realizadas nos mailing lists de
desenvolvedores. A cooperao ser minerada a partir do conjunto
de arquivos modificados por um desenvolvedor (commits).
A minerao de dados referentes comunicao e dados
referentes cooperao nos garantir uma diversidade maior de
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 38 -
redes sociais em relao aos trabalhos relacionados que sero
apresentados na subseo 2.2 e 2.3.
Uma vez mineradas estas informaes sero geradas redes sociais,
que analisadas com SNA resultaro em valores para as mtricas,
que sero utilizadas como entrada para o modelo de predio de
falhas.
Os projetos escolhidos sero aqueles que possibilitem a
identificao de builds que obtiveram sucesso ou falha e que
utilizem mailing lists e gerenciadores de tarefas (issues).
Para a coleta de dados ser construdo um minerador capaz de
extrair as informaes dos projetos e salv-las em um banco de
dados local.
3.2 Construo das redes sociais
A partir dos dados minerados e armazenados no banco de dados
local, ser gerada uma matriz desenvolvedor versus
desenvolvedor com o grau da interao capturada. O grau de
interao representa a quantidade de trocas de mensagem
existente entre dois desenvolvedores, ou a quantidade de vezes
que eles trabalharam em um arquivo compartilhado. Este ltimo
ser obtido a partir do nmero de commits realizados por dois
desenvolvedores que alteraram uma mesma classe.
Para cada build de um projeto ASF sero criadas quatro redes
sociais:
D Rede social de mailing list: As conversas
realizadas dentro do intervalo de uma build sero
mineradas e uma matriz com a quantidade de troca de
mensagens entre os desenvolvedores ser criada.
D Rede social de comunicao de tarefas:
Sero identificadas as tarefas que compe uma build. A
partir das tarefas sero minerados todos os comentrios
realizados pelos desenvolvedores, formando uma nova
matriz.
D Rede social de cooperao a partir dos
arquivos (classes) compartilhados: Sero minerados a
partir do log do sistema gerenciador de verso, todos os
commits realizados pelos desenvolvedores para
implementar as tarefas que compe uma build.
D Unio das redes sociais anteriores: a
soma das matrizes anteriores, representa o grau total de
comunicao versus cooperao que inclui todos os
relacionamentos entre os desenvolvedores.
Pretende-se com estas redes sociais, melhorar a qualidade do
conjunto de dados que ser utilizado para treinamento da rede
bayesiana no modelo de predio. A utilizao de dados mais
abrangentes e da unio de todas as mtricas encontradas nos
trabalhos relacionados pode proporcionar uma melhora na
predio, uma vez que a melhoria da performance dos modelos de
predio no esta associado a implementao de novos
algoritmos, mas sim, da qualidade do conjunto de dados
minerados ou at mesmo, de mtricas que ainda no foram
utilizadas para predio. [1]
Para criao das redes sociais ser utilizada a ferramenta UCINet
[13], que permite importar as matrizes criadas e calcular as
mtricas apresentadas no Quadro 1.
3.3 Predio de Falhas
No experimento deste estudo tambm sero identificadas falhas
baseando-se no resultado de builds. Considera-se como premissa
que as builds podem resultar em dois estados: o de falha ou de
sucesso. Obtm-se os valores das mtricas de SNA para cada rede
social criada a partir de uma build conforme subseo 3.2. os
valores obtidos com as mtricas de SNA sero utilizados como
entrada de dados para o treino do classificador bayesiano.
Para o treinamento sero definidos quatro conjuntos de dados. O
primeiro referente s mtricas extradas das redes sociais de
comunicao de mailing list e comentrios feitas sobre as tarefas,
outro referente a rede social de cooperao extrada a partir dos
commits e um ltimo conjunto referente unio das redes sociais.
Para avaliar a predio outro conjunto de validao ser utilizado.
Este conjunto ficar fora da etapa de treinamento. Para executar a
predio de falhas ser utilizada a ferramenta WEKA
Software[15].
O WEKA (Waikato Environment for Knowledge Analysis)
uma ferramenta que implementa uma coleo de algoritmos de
aprendizagem de mquina para tarefas de minerao de dados. Ela
oferece suporte para pr-processamento de dados, treinamento e
classificao de redes bayesianas, oferecendo opes de escolha
de diferentes algoritmos.
Para este trabalho sero comparados os treinamentos com
propores de 80/20 e 66/34 utilizando o algoritmo nayve bayes
que tambm foi utilizado nos trabalhos relacionados. A
comparao das propores de treinamento ser feitas porque no
houve consenso nos trabalhos relacionados da proporo de builds
que foram utilizadas para treinamento e validao, assim,
pretende-se testar esta abordagem com as duas medidas.
3.4 Avaliao do modelo de predio
Para avaliar as predies sero utilizadas medidas de Recall e
Precision. No entanto, ser adicionada uma nova medida de
Accuracy. Estas mtricas definem a qualidade de dados
recuperados.
Precision definida como o nmero de dados relevantes
recuperados, dividido pelo nmero total de dados recuperados
[10], por exemplo, suponha que existam 50 builds que falharam
realmente, e o classificador bayesiano respondeu (predisse) que
30 builds falharam, e apenas 20 destas builds realmente falharam.
A Precision calculada da seguinte forma: 30 builds que o
classificador respondeu dividido pelas 20 builds que o
classificador respondeu corretamente, resultando em um
coeficiente de Precision de 1,5% e 66% expresso em
porcentagem. Recall definido como o nmero de dados
relevantes recuperados divididos pelo nmero total de dados
relevantes [10], por exemplo, suponha que 50 builds falharam
realmente, e o classificador respondeu (predisse) que 38 builds
falharam, e apenas 20 destas builds realmente falharam, o Recall
calculado da seguinte forma: 50 builds que falharam realmente
divididos por 20 builds que o classificador respondeu
corretamente, resultando em um coeficiente de Recall de 2,5% e
40% expresso em porcentagem.
Os trabalhos relacionados [16],[5],[1] utilizaram Recall e
Precision para avaliar o modelo de predio proposto. Este
trabalho alm de utilizar Recall e Precision tambm utilizar a
mtrica de Accuracy para avaliao do modelo de predio. Esta
mtrica medida pelo resultado da taxa de acerto positivo
calculado com base nas classificaes corretas e taxa de acerto
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 39 -
negativo calculado com base nas classificaes incorretas. Para
calcular a taxa de acerto positivo (TAP) e a taxa de acerto
negativo (TAN) utilizam-se as seguintes formulas:
TAP = SP / (SP + FN); TAN = FP/ (FP + SN).
D SP o numero de builds que obtiveram sucesso, preditas
corretamente;
D FN o numero de builds que falharam realmente;
D FP o numero de builds que obtiveram falha, preditas
corretamente;
D TN o numero de builds que obtiveram sucesso
realmente.
Ao final do experimento, ser verificado, analisando os valores
resultantes para Recall, Precision e Accuracy, se esta abordagem
poder predizer com maior taxa de acerto quando um build ter
sucesso ou falha, utilizando matrizes de comunicao e
cooperao.
4. Concluso e Prximos Passos
Espera-se com este trabalho oferecer um modelo de predio mais
preciso para predizer falhas em projetos de software livre. O uso
de mais mtricas e de uma quantidade maior de informaes para
criao de redes sociais pode possibilitar esta melhora.
Um primeiro experimento com o projeto Geronimo da ASF esta
sendo conduzido para minerao dos dados referentes a
comunicao e cooperao.
Testes preliminares de criao de matrizes que representam as
redes sociais j foram realizados. Os testes mostraram que
possvel importar as matrizes que representam as redes sociais
para a ferramenta UCINet para clculo das mtricas de SNA.
Os prximos passos compreendem a criao de redes sociais para
um conjunto de builds que permita testar o uso da ferramenta
Weka para treinamento e predio das builds.
Por fim ser replicado o experimento para outros projetos da ASF
para testar a validade da abordagem e assim comparar os
resultados obtidos com os trabalhos relacionados.
5. REFERNCIAS
[1] BIER, Serdar; BENER, Ayse; CAGLAYAN, Bora. Defect
Prediction Using Social Network Analysis on Issue
Repositories. In ICSSP '11 Proceedings of the 2011
International Conference on on Software and Systems
Process. New York, NY, USA, 2011.
[2] BIRD, Christian; PATTISON, David; D'SOUZA, Raissa;
FILKOV, Vladimir; DEVANBU, Premkumar. Latent Social
Structures in Open Source Projects. In SE, Atlanta, GA,
2008, p.p24-36.
[3] FUKS, Hugo; RAPOSO, Alberto; GEROSA, Marco. Do
Modelo de Colaborao 3C Engenharia de Groupware. In
WEBMIDIA 2003 -Simpsio Brasileiro de Sistemas
Multimdia e Web, Trilha especial de Trabalho Cooperativo
Assistido por Computador, Novembro 2003, Salvador-BA,
pp. 445-452
[4] MAGDALENO, Andra; WERNER, Cludia; Araujo,
Renata. Estudo de Ferramentas de Minerao, Visualizao e
Anlise de Redes Sociais. Rio de Janeiro, ES-735/10, 2010.
[5] MENEELY, Andrew; WILLIAMS, Laurie; SNIPES, Will;
Osborne, Jason. Predicting failures with developer networks
and social network analysis. In Proceedings of the 16th ACM
SIGSOFT International Symposium on Foundations of
software engineering (SIGSOFT '08/FSE-16). ACM, New
York, NY, USA, 2008.
[6] MENEELY, Andrew; WILLIAMS, Laurie. Socio-technical
developer networks: should we trust our measurements?. In
Proceeding of the 33rd international conference on Software
engineering (ICSE'11). ACM, New York, NY, USA, 281-290.
DOI=10.1145/1985793.1985832, 2011.
[7] MENEELY, Andrew; WILLIAMS, Laurie; CORCORAN,
Mackenzie. Improving Developer Activity Metrics with Issue
Tracking Annotations. In Workshop on Emerging Trends in
Software Metrics (WETSoM), Cape Town, South Africa,
2010.
[8] MENZIES, Tim; GREENWALD, Jeremy; FRANK, Art. Data
Mining Static Code Attributes to Learn Defect Predictors. In
Ieee Transactions On Software Engineering, West Virginia
Univ., Morgantown, WV, Jan. 2007.
[9] NIA, Roozbeh; BIRD, Christian; DEVANBU, Premkumar;
FILKOV, Vladimir. Validity of Network Analyses in Open
Source Projects. In Mining Software Repositories, Cape
Town, South Africa, 2010.
[10] SARR M. Improving precision and recall using a
spellchecker in a search engine. Royal Institute of
Technology, Sweden, 2003.
[11] SHIN, Yonghee; MENEELY, Andrew; WILLIAMS, Laurie;
OSBORNE Jason. Evaluating Complexity, Code Churn, and
Developer Activity Metrics as Indicators of Software
Vulnerabilities. In IEEE Transactions in Software
Engineering (TSE), vol. to appear, no. p. 2010.
[12] STEINMACHER, Igor; CHAVES, Ana; GEROSA, Marco.
Awareness Support in Global Software Development: A
Systematic Review Based on the 3C Collaboration Model.
In: 16th CRIWG Conference on Collaboration and
Technology, 2010, Maastricht. Lecture Notes in Computer
Science, 2010. v. 6257. p. 185-201
[13] Ucinet is a social network analysis program. Disponvel em
http://www.analytictech.com/ucinet/
[14] WASSERMAN, Stanley; FAUST, Katherine; Social Network
Analysis: Methods and Applications. 1 ed. Cambridge,
United Kingdom, Cambridge University Press. 1994.
[15] Weka Software is a collection of machine learning
algorithms for solving real-world data mining problems.
Disponvel em http://sourceforge.net/projects/weka/
[16] WOLF, Timo; SCHROTER, Adrian; DAMIAN, Daniela;
NGUYEN, Thanh. Predicting build failures using social
network analysis on developer communication. In
Proceedings of the 2009 IEEE 31st International Conference
on Software Engineering, 2009.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 40 -
Um aplicati vo baseado em inteligncia coletiva para
compartilhamento de rotas em redes sociais
Luiz Philipe Serrano Alves
Coordenao de Tecnologia em
Sistemas para Internet
Universidade Tecnolgica
Federal do Paran (UTFPR)
Campo Mouro - Brasil
luizphilipe02@gmail.com
Ana Paula Chaves
Coordenao de Tecnologia em
Sistemas para Internet
Universidade Tecnolgica
Federal do Paran (UTFPR)
Campo Mouro - Brasil
anachaves@utfpr.edu.br
Igor Steinmacher
Coordenao de Tecnologia em
Sistemas para Internet
Universidade Tecnolgica
Federal do Paran (UTFPR)
Campo Mouro - Brasil
igorfs@utfpr.edu.br


ABSTRACT
This paper presents a social network application that enables
users to create routes on maps that can be edited collaborative-
ly. Collaboration on maps is a result of collective intelligence,
which combines the knowledge of many people to accomplish a
goal. This proposal presents one feature of a system called
UbiBus, which aims to combine many applications that aim to
help public transportation users.
RESUMO
Este artigo prope um aplicativo para rede social que permite a
criao de rotas em mapas que possam ser editados colaborati-
vamente. A colaborao em mapas um fruto da inteligncia
coletiva, que une a sabedoria de vrias pessoas para cumprir
com um objetivo. Essa proposta apresenta uma das funcionali-
dades de um sistema denominado UbiBus, que une uma varie-
dade de aplicaes que tem o objetivo de ajudar e aproximar os
usurios de transporte pblico.
Palavras-chave
Rotas colaborativas, mapas colaborativos, redes sociais, inteli-
gncia coletiva, colaborao.
1. INTRODUO
A populao com acesso a internet tem aumentado cada vez
mais nos ltimos 10 anos, segundo pesquisas do Instituto Brasi-
leiro de Geografia e Estatstica [1]. Com os avanos tecnolgi-
cos e a disseminao da internet, uma nova cultura de produo
de contedo e compartilhamento est sendo criada [2]. Essa
cultura envolve blogs, wikis, fruns e redes sociais.
As redes sociais so ambientes de colaborao muito utilizados.
Hoje em dia, grande parte das pessoas que acessam a internet,
tem um perfil ativo em pelo menos uma rede social. Os dados
da Pesquisa Nacional de Amostras por Domiclio (Pnad) apon-
tam que a quantidade de usurios de todas as faixas etrias
aumentou em cerca de 12 milhes de 2008 a 2009 [3]. O suces-
so das redes sociais tem facilitado o compartilhamento de in-
formaes entre as pessoas, pois elas frequentemente utilizam
essa tecnologia para relatar o que passaram e possvel utilizar
esses dados de forma inteligente e colaborativa [4].
A participao de um grande grupo de pessoas em um objetivo
comum pode gerar resultados muito melhores do que os feitos
por uma s pessoa. Essa participao denominada inteligncia
coletiva. A inteligncia coletiva parte do princpio de que as
inteligncias individuais so somadas e compartilhadas por toda
a sociedade. O conceito foi potencializado com o advento das
novas tecnologias de comunicao, como a Internet [5]. Gran-
des exemplos so os sites wikis, formados pelo compartilha-
mento das informaes dos prprios usurios, e podem ser
considerados frutos da Web 2.0 [6].
Algumas ferramentas que a Web 2.0 proporcionou facilitam a
inteligncia coletiva. Um exemplo disso o servio de pesqui-
sa, visualizao de mapas e imagens de satlite do Google
Maps
1
. Com ele possvel que um usurio comum crie seu
prprio mapa ou rota e compartilhe como desejar. Porm, esse
compartilhamento disponvel pode no ser interativo o suficien-
te, pois as pessoas precisam ser convidadas para ver o seu con-
tedo e esse mapa no fica disponvel a todos os usurios que
possam estar interessados, o que ocorreria se ele fosse publica-
do em uma rede social.
Paralelo a esse cenrio de compartilhamento de informaes e
colaborao online, existem setores da sociedade que ainda
sofrem com a escassez de informaes importantes, como o
caso dos passageiros de transportes pblicos no Brasil. Com o
trnsito nas grandes cidades cada vez mais catico, utilizar
transportes pblicos pode ser uma alternativa para reduzir o
trfego e melhorar as condies de mobilidade urbana. De
acordo com Barry [19], as pessoas esto dispostas a deixar os
seus carros, ou motos, desde que possam obter informaes em
tempo real a respeito dos meios de transporte pblico. Aliado a
isso, o Brasil receber vrios grandes eventos esportivos nos
prximos anos. Esse fato pode agravar a situao dos transpor-
tes e, alm disso, pode gerar mais demanda por transportes
pblicos de qualidade.
Dentre as informaes que as pessoas podem necessitar no dia a
dia das grandes cidades, uma delas est relacionada ao caminho
mais adequado para realizar um determinado percurso. Com
isso, interessante que as pessoas consigam criar rotas, sejam
elas para compartilhar os locais que pretendem ir ou para com-
partilhar locais tursticos para visitao. Nesse contexto, rota
qualquer percurso ou trajeto que uma pessoa pode utilizar para
se deslocar entre duas ou mais localidades. importante que
essas rotas possam ser editadas colaborativamente para, dessa
forma, aproveitar o poder da inteligncia coletiva na criao de
percursos que atendam aos interesses dos colaboradores. Essas
rotas podem ter objetivos diversos, como caminhos que sejam
mais rpidos ou mais seguros at um destino, ou ainda cami-
nhos mais completos com relao quantidade de lugares para
visitar. Ainda no existem aplicaes que possibilitam esta
interao.
Diante desse contexto, o sistema UbiBus foi proposto com o
objetivo de oferecer um conjunto de solues tecnolgicas para
facilitar o acesso a informaes de transporte pblico aos usu-
rios, em tempo real, baseado em informaes dinmicas de
contexto, integrados em um sistema de transporte pblico inte-
ligente, ubquo e sensvel ao contexto [7].
O projeto UbiBus prev o desenvolvimento de diferentes apli-
caes, que vo desde aplicaes web e de redes sociais a apli-

1
http://maps.google.com/
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 41 -
caes para dispositivos mveis, terminais (e.g. nos pontos de
nibus) e quiosques (e.g. estaes rodovirias). Uma das aplica-
es que esse projeto prope envolve aplicativos de redes soci-
ais com o objetivo de aproximar os passageiros do transporte
pblico. Ao acess-las, os usurios podero indicar rotas de sua
preferncia, visualizar rotas criadas por outros usurios, atribuir
reputao (ou comentrios) para uma rota que utilizou e at
mesmo criar rotas colaborativamente com outros usurios. Esse
artigo prope os primeiros passos em direo a esse fim.
O objetivo deste artigo propor um aplicativo para rede social
que permita aos usurios criarem rotas colaborativamente, de
forma que essas rotas fiquem disponveis para os contatos na
rede social e possam ser alteradas por eles. O aplicativo apro-
veita o poder da inteligncia coletiva, repassando para os conta-
tos da rede social a tarefa de construir uma rota que atenda os
interesses do grupo que dela se utiliza.
Este artigo est organizado da seguinte forma: a Seo 2 discute
os conceitos de inteligncia coletiva, mapas colaborativos e
redes sociais. A Seo 3 apresenta o aplicativo proposto e a
Seo 4 traz as concluses e trabalhos futuros.
2. REFERENCIAL TERICO
2.1 Inteligncia coletiva
A inteligncia coletiva uma inteligncia distribuda por toda a
parte, continuamente valorizada, coordenada em tempo real e
resulta na mobilizao efetiva de competncias. A base e o
objetivo da inteligncia coletiva o enriquecimento mtuo das
pessoas. Ningum sabe tudo, todos sabem alguma coisa, desse
modo todo saber est na humanidade [5]. Este conhecimento
pode ser compartilhado por meio da interatividade que encon-
trada facilmente em comunidades virtuais, fruns e wikis. Desse
modo, as produes intelectuais no seriam exclusivas de uma
s pessoa, mas sim dos apoios coletivos crescentes.
A inteligncia coletiva proporcionou o surgimento de um novo
modelo de negcio conhecido como crowdsourcing [8]. O
termo, criado por Jeff Howe e Mark Robinson, descreve um
modelo que aproveita as solues criativas que vrias pessoas
podem criar por meio de um convite aberto a sugestes. Devido
aos avanos tecnolgicos, a diferena entre profissionais e
amadores foi diminuda e com isso qualquer pessoa est apta a
realizar certos tipos de trabalho [9].
O site Amazon.com
2
lanou em 2005 o Amazon Mechanical
Turk, um sistema que possibilita s empresas ter acesso mo
de obra sob demanda. Nesse site, possvel buscar pessoas
interessadas em realizar pequenos trabalhos, assim como inserir
ofertas de tarefas simples a serem executadas. Os indivduos
que colaboram so remunerados, normalmente com alguns
centavos de dlar.
A principal caracterstica da inteligncia coletiva aproveitar a
interatividade para melhorar e disseminar os conhecimentos
globais e com isso ela est sendo utilizada em vrios contextos.
Um deles sob a forma de colaborao em mapas, que ser
visto na prxima sesso.
2.2 Mapas Colaborativos
O mapeamento colaborativo uma iniciativa da produo cole-
tiva. Por meio dele, possvel que um conjunto de pessoas
produza modelos do mundo real para que outras pessoas tam-
bm acessem e contribuam anotando localizaes no espao
[10]. O mapeamento colaborativo ocorre quando mais de uma
pessoa tem a iniciativa de ajudar, mapeando algum fenmeno
ou acontecimento em um mesmo local, de forma com que todas
as colaboraes se comuniquem e contribuam.

2
http://www.amazon.com
O valor do mapeamento colaborativo determinado pela pro-
ximidade fsica e social que o grupo de pessoas que ajudaram se
encaixa. Assim, a informao no apenas filtrada com base na
proximidade geogrfica, mas tambm classificada de acordo
com a confiana que uma pessoa tem em outra atravs de redes
sociais, que chamado de 'Web of Trust [10].
A inveno dos mapas colaborativos tambm fornece uma
soluo para o problema da mobilidade nas grandes reas urba-
nas [11]. Com o desenvolvimento das tecnologias mveis (celu-
lares, smartphones e GPS) e a liberao de mapas via satlite
como o Google Maps, a possibilidade das pessoas criarem suas
prprias rotas tem se tornado cada vez mais vivel.
Vrios exemplos disso podem ser destacados. O OpenStreet-
Map
3
um projeto colaborativo para criar um mapa livre e
editvel. Ele permite visualizar, editar e usar dados geogrficos
de maneira colaborativa em qualquer lugar do mundo. J o
TrackSource
4
tem por objetivo produzir mapas do Brasil para
disponibilizar em aparelhos GPS. Atravs do site, os usurios
contribuem com informaes que so encaminhadas para os
desenvolvedores que atualizam os mapas. Periodicamente as
novas verses dos mapas so disponibilizadas para serem bai-
xados pela comunidade.
O WikiMapps
5
um sistema para a criao de aplicaes cola-
borativas baseadas em mapas. A principal caracterstica que o
difere de outros mapas colaborativos, que ele possui funes
que inserem o conceito de redes sociais. As pessoas podem criar
um mapa com marcadores, rotas, imagens, reas e cones. As-
sim outras pessoas so capazes de comentar, votar, identificar
marcadores de amigos, adicionar usurios como amigos e con-
sequentemente gerar interao entre integrantes da rede social.
O WikiCrimes [12] um software que permite a pesquisa,
visualizao e registro de ocorrncias criminais em uma mapa
digitalizado. Todos podem participar e mapear colaborativa-
mente os crimes, assim todos tero o benefcio de ter acesso s
informaes criminais no mapa. Para confirmar a veracidade de
uma ocorrncia, os usurios tm a opo de confirmar positi-
vamente ou negativamente as informaes encontradas.
Como pode ser observado, h vrios projetos que utilizam
mapas colaborativos e sugerem que expressar o seu conheci-
mento em um mapa interessante. Em aplicativos como o
WikiMapps, possvel aproveitar a inteligncia coletiva atravs
de recursos de uma rede social. Existem inmeras redes sociais
em que isso possvel. Esse assunto ser abordado na prxima
sesso.
2.3 Redes Sociais
Uma rede social composta por indivduos (ou organizaes)
conectados atravs de laos sociais [13]. Esses laos partilham
valores e objetivos em comum, como amizade, parentesco,
crenas, conhecimentos ou prestgio.
Define-se uma rede social como um sistema baseado na Web
em que (a) os usurios possam construir um perfil pblico ou
semipblico dentro de um sistema limitado, (b) adicionar uma
lista de outros usurios com quem eles compartilhem uma
conexo, (c) visualizar e percorrer suas listas de conexes,
assim como outras listas criadas por outros usurios [14].
Existem vrios tipos de redes sociais disponveis na Internet,
que variam de acordo com seus objetivos primrios. H redes
sociais genricas, baseadas principalmente em fazer novas
amizades, que apresentam diversos tipos de contedos textuais
ou multimdia e provm vrias funcionalidades para que os
usurios possam interagir com seu contedo. Pode-se dizer que

3
http://www.openstreetmap.org
4
http://www.tracksource.org.br
5
http://wikimapps.com
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 42 -
o foco dos contedos e das funcionalidades encontradas esto
orientados a um contexto ldico, pois promovem nas pessoas
uma interao informal e recreativa [15]. Algumas redes sociais
dessa categoria so o Facebook, Orkut e Twitter. H tambm a
categoria de redes sociais especializadas, que fornecem ferra-
mentas para um trabalho especfico, tratando uma temtica em
particular e cobrindo necessidades de um determinado tipo de
usurio [15]. Essas redes, so utilizadas com propsito especfi-
co, como o caso do LinkedIn
6
e Xing
7
que so voltadas a
adquirir contatos profissionais.
As redes sociais tambm so usadas por empresas que aprovei-
tam a inteligncia coletiva atravs da comunicao livre e hori-
zontal que ela possibilita [16]. possvel que as empresas
monitorem o comportamento dos seus clientes em relao aos
produtos oferecidos, identifiquem tendncias de mercado e
divulguem a empresa, j que a opinio das pessoas relevante
no processo de compra de outras pessoas.
Algumas redes sociais como Orkut e Facebook oferecem apli-
cativos que renem pessoas para que elas possam interagir com
um objetivo em comum. Essas interaes podem ser feitas por
meio de jogos, em que as pessoas jogam com os contatos da
rede social. Exemplos disso so o Colheita Feliz (Orkut), um
jogo cujo objetivo plantar e colher em sua fazenda, e do City-
Ville (Facebook), que tem por objetivo administrar uma cidade;
Tambm possvel outros tipos de interao, como marcar em
um mapa um lugar que voc pretende ir no vero, ver onde seus
amigos pretendem ir e ver os lugares mais populares, como o
caso do aplicativo Vero Coca-Cola (Facebook).
O TravelMap um aplicativo em que possvel criar rotas de
viagem de onde voc deseja ir ou j foi. possvel adicionar
fotos da sua viagem, adicionar mais locais no caminho e com-
partilhar com seus amigos. Tambm possvel criar um blog
sobre sua viagem, em que possvel compartilhar todas as
informaes sobre ela. Porm, no possvel interagir colabora-
tivamente nos mapas criados por seus amigos.
Um aspecto importante das redes sociais est relacionado ao
trfego de contedo gerado pelos usurios. Existe uma diferen-
a entre publicar contedos na Web tradicional ou em uma rede
social online. Quando as pessoas publicam contedo na Inter-
net, a inteno que usurios do mundo inteiro possam acessar.
Por outro lado, quando usurios publicam em redes sociais
online, eles possuem uma audincia especfica em mente, ge-
ralmente, seus amigos [17]. Isso acontece porque usurios
adjacentes em uma rede social tendem a confiar uns nos outros
[18].
3. EDIO COLABORATIVA DE ROTAS
Como pode ser observado em [7], o sistema UbiBus tem por
objetivo reunir um conjunto de soluo que possam ser utiliza-
das para melhorar o dia a dia das pessoas que utilizam o trans-
porte pblico nas cidades brasileiras. A Figura 1 representa a
arquitetura deste conjunto de solues.
Dentro dessa arquitetura, a Camada de Aplicaes concentra as
diferentes aplicaes que sero desenvolvidas para compor o
UbiBus. A proposta desse artigo a criao de um aplicativo
dessa camada que possibilite aos usurios de uma rede social
criar, editar colaborativamente, visualizar e compartilhar rotas.
O aplicativo proposto far parte da rede social Facebook e seu
acesso ser disponibilizado a partir do sistema UbiBus.
O Facebook foi escolhido pela sua crescente popularizao no
Brasil. Dados do site Alexa.com, que mostra o ranking dos sites
mais visitados de cada pas, mostram o Facebook em 3 lugar,
enquanto o Orkut aparece em 6 (consulta realizada em abril de

6
http://www.linkedin.com
7
http://www.xing.com
2011). Alm disso, pesquisas realizadas entre maro de 2010 a
maro de 2011 pela ComScore.com, empresa especializada em
medir a evoluo do mundo digital, aponta para uma estabiliza-
o no uso do Orkut em cerca de 70% dos usurios da Internet,
enquanto o Facebook teve uma expanso de 159% (de 15,7%
dos usurios da internet em 2010 para 40,8% em 2011).

Figura 1. Arquitetura do sistema UbiBus [7]
O aplicativo ser desenvolvido por meio de uma API Java
disponibilizada especificamente para o Facebook, que fornece
as Iuncionalidades de publicao em mural, de 'curtir, de
compartilhar e outras disponveis na rede social. O aplicativo
utilizar tambm uma API do Google Maps para oferecer a
funcionalidade de edio das rotas. A arquitetura do aplicativo
pode ser observada na Figura 2.

Figura 2. Arquitetura do Aplicativo
O Facebook se comunicar com a sua base de dados interna,
onde salvar os dados das rotas criadas pelos usurios. As
configuraes sobre esta base de dados podem ser feitas pela
interface visual da pgina de criao do aplicativo no Facebook.
O usurio poder interagir na aplicao por meio da criao de
uma rota, que ser exibida dentro de um mapa gerado pelo
Google Maps. Ser possvel escolher o local de origem, ou
ponto de partida, e adicionar pontos intermedirios na rota,
assim como editar esses pontos, adicionar novos pontos e exclu-
ir pontos. Depois de adicionar todos os pontos a rota ser arma-
zenada e os pontos sero exibidos como pode ser visualizado na
Figura 2-1.
Aps o usurio criar uma rota, este poder compartilh-la com
os seus amigos da rede social. O aplicativo pedir autorizao
para a rota ser publicada no mural (Figura 2-2). Dessa forma,
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 43 -
todos os 'amigos (contatos na rede social) desse usurio tero
acesso rpido rota criada (Figura 2-3).
Os 'amigos do usurio dono da rota podem 'curtir a rota e
compartilhar com outros amigos (Figura 2-3), dessa forma ser
possvel que a rota fique visvel para 'amigos de amigos (con-
tatos de 'amigos que no so meus contatos). Porm, 'amigos
de amigos no tero permisso para colaborar (editar a rota).
Essa funcionalidade estar disponvel apenas para os contatos
do criador da rota.
A Iuncionalidade de colaborar permite que 'amigos do dono
da rota adicionem novos pontos, excluam pontos desnecess-
rios, ou ainda alterem o local de pontos existentes (Figura 2-4).
Qualquer pessoa que visualize ou edite uma rota pode comparti-
lhar o link para a rota com seus amigos (Figura 2-2).
4. CONCLUSO
Este artigo apresentou a proposta de um aplicativo para Face-
book que permite a criao e edio colaborativa de rotas. Esse
aplicativo ser integrado posteriormente ao sistema UbiBus,
para facilitar que os usurios de transporte pblico tenham
acesso a informaes referentes a rotas.
Aps o desenvolvimento do aplicativo, uma prova de conceito
ser realizada para verificar a viabilidade das funcionalidades
propostas. A prova de conceito ser realizada por um grupo de
pessoas selecionadas para utilizar o aplicativo. Essas pessoas
respondero a um questionrio, com o objetivo de oferecer
feedback sobre o aplicativo. O objetivo, inicialmente, no
realizar um experimento formal, mas sim demonstrar como a
utilizao do aplicativo contribui para o compartilhamento de
rotas, e descobrir pontos fortes e fracos da abordagem proposta
[20].
O aplicativo apresentado neste artigo apenas o primeiro passo
em direo soluo envolvendo inteligncia coletiva e edio
colaborativa de rotas para o sistema UbiBus. Depois do desen-
volvimento das funcionalidades bsicas para edio colaborati-
va de rotas, recursos sero acrescentados para direcionar o foco
para usurios de transporte pblico. Para isso, pretende-se
incluir nesse aplicativo dados relacionados a linhas de nibus,
para indicar quais linhas so necessrias para cumprir um per-
curso criado por um usurio. Deseja-se ainda incluir funcionali-
dades para votao do melhor percurso, para permitir que as
pessoas que realizaram o percurso informem sua opinio sobre
o trajeto, para classificar e promover as rotas de acordo com a
popularidade, entre outras funcionalidades que possam aumen-
tar a colaborao entre usurios do transporte pblico.
Agradecimentos
Os autores agradecem ao CNPq (processo 560135/2010-6) pelo
apoio financeiro. Este trabalho foi parcialmente apoiado pelo
Instituto Nacional de Cincia e Tecnologia para Engenharia de
Software (INES).
5. REFERNCIAS
[1] IBGE - Instituto Brasileiro de Geografia e Estatstica.
(2009). Disponvel em: http://www.ibge.gov.br/home/presidenc
ia/noticias/noticia_visual iza.php?id_noticia=1517, 2009
[2] A. Vivacqua and M. Borges, "Collective Intelligence for
the Design of Emergency Response," Computer Supported
Cooperative Work in Design (CSCWD), pp. 623-628, 2010.
[3] Microsoft. MSN Tecnologia. [Online].
http://tecnologia.br.msn.com/noticias/artigo.aspx?cp-
documentid=25499097, 2010
[4] T. Segaran, Programming Collective Intelligence: Build-
ing Smart Web 2.0 Applications, 1st ed. O'Reilly, 2007.
[5] P. Lvy, A inteligncia coletiva: por uma antropologia do
ciberespao, 3rd ed. So Paulo: Loyola, 2000.
[6] T. O'Reilly. (2006) O'Reilly Radar. [Online].
http://radar.oreilly.com/2006/12/web-20-compact-definition-
tryi.html, 2006.
[7] V. Vieira, L. R. Caldas, and A. C. Salgado, "Towards an
Ubiquitous and Context Sensitive Public Transportation Sys-
tem," International Conference on Ubi-Media Computing, Jul.
2011.
[8] J. Howe, "The Rise of Crowdsourcing," Wired Magazine,
vol. 14, Jun. 2006.
[9] D. C. Brabham, "Crowdsourcing as a Model for Problem
Solving: An Introduction and Cases," Convergence: The Inter-
national Journal of Research into New Media Technologies, pp.
75-90, 2008.
[10] E. M. Gillavry. (2003) webmapper - what the map can be.
[Online]. http://www.webmapper.net/carto2003/
[11] M. Drodzynski, S. Edelkamp, A. Gaubatz, S. Jabbar, and
M. Liebe, "On Constructing a Base Map for Collaborative Map
Generation and its Application in Urban Mobility Planning,"
10th International IEEE Conference on Intelligent Transporta-
tion Systems, pp. 678-683, 2007.
[12] V. Furtado, et al., "Collective intelligence in law en-
forcement - The WikiCrimes system," Information Sciences: an
International Journal, vol. 180, no. 1, pp. 4-17, Jan. 2010.
[13] D. Watts, Six Degrees: The Science of a Connected Age,
1st ed. New York: W. W. Norton & Company, 2003.
[14] D. Boyd and N. Ellisson, "Social Network Sites: Defini-
tion, History and Scholarship," Journal of Computer-Mediated
Communication, pp. 210-230, 2008.
[15] V. F. d. Santana, D. S. Melo-Solarte, V. P. d. A. Neris, L.
C. d. Miranda, and M. C. Baranauskas, "Redes Sociais Online:
Desafios e Possibilidades para o Contexto Brasileiro," XXIX
Congresso da Sociedade Brasileira de Computao (CSBC), pp.
339-353, 2009.
[16] M. Castells, A Galxia da Internet: reflexes sobre a
Internet, os negcios e a sociedade, 1st ed. Rio de Janeiro:
Zahaar, 2003.
[17] B. Krishnamurthy, "A measure of online social net-
works," Conference on Communication Systems and Networks
(COMSNETS), pp. 190-199, 2009.
[18] R. d. Costa, "Por um novo conceito de comunidade: redes
sociais, comunidades pessoais, inteligncia coletiva," Interface -
Comunicao, Sade, Educao, vol. 9, pp. 235-248, 2005.
[19] K. Barry, How Smartphones Can Improve Public Transit.
Wired Maganize, Londres, abr. 2011. Disponvel em
<http://www.wired.com/autopia/2011/04/how-smartphones-
can-improve-public-transit/>. Acesso em: 01 jul. 2011.
[20] P. Tonella, M. Torchiano, Bart Du Bois, and Tarja Syst;.
2007. Empirical studies in reverse engineering: state of the art
and future trends. Empirical Softw. Engg. vol. 12, n. 5, pp. 551-
571, 2007.

VIII Simpsio Brasileiro de Sistemas Colaborativos
- 44 -

S E S S O 3
Colaborao em Micromundos e Atravs
de Dispositivos Mveis
Using Microworlds to Study Teamwork
at the Cognitive Level
Cludio Sapateiro
Polytechnic Institute of Setbal
Campus do IPS, Estefanilha
2914-508 Setbal, Portugal
+351 265 790 000
csapateiro@est.ips.pt
Antnio Ferreira
LASIGE, University of Lisboa
Campo Grande
1149-016 Lisboa, Portugal
+351 21 750 00 00
asfe@di.fc.ul.pt
Pedro Antunes
LASIGE, University of Lisboa
Campo Grande
1149-016 Lisboa, Portugal
+351 21 750 00 00
paa@di.fc.ul.pt
ABSTRACT
This paper studies teamwork using a Microworld: a synthetic en-
vironment that allows analyzing the cognitive behavior of teams
in the laboratory. We developed a Microworld supporting the fol-
lowing functionality: control the experimental conditions; mediate
collaboration; integrate testable technological affordances; execute
experimental protocols; and collect experimental data. An exten-
sive study with the Microworld involving critical incident re-
sponse management is described in the paper. The study demon-
strates that the Microworld supports analyzing teamwork at the
cognitive level and facilitates the overall laboratorial set up.
Categories and Subject Descriptors
H.4.2 [Information Systems Applications]: Types of Systems
Decision Support. H.5.3 [Information Interfaces and Presentation]:
Group and Organization InterfacesComputer-Supported Co-
operative Work, Synchronous Interaction, Evaluation/Methodology.
General Terms
Measurement, Performance, Design, Experimentation, Human
Factors.
Keywords
Situation Awareness, Mobile devices, Microworlds.
1. INTRODUCTION
This paper discusses teamwork from a cognitive perspective. The
distinction between teamwork and other terms like collaboration,
cooperation and coordination is somewhat faint. We may take the
propositions discussed by Oravec [1] to point out that our research
addresses interdependent work teams who share responsibility
for outcomes of their organization. The focus on the cognitive
perspective also underscores that our aim is to understand how the
cognitive processes of the mind support teamwork. Within this
context we may account for important phenomena such as infor-
mation sharing, sensemaking [2, 3], decision-making [4], attention
[5, 6], situation awareness [7, 8] and information overload [9].
The selected application area concerns Critical Incident Response
Management (CIRM), a collaborative task performed by highly
focused teams who often make complex decisions in dynamic
contexts, facing emerging events, constant time pressure, and the
need to recover normal operational levels without severe losses
[10-12]. Critical incidents (CI) are characterized as unwanted,
unexpected, and to some extent unprecedented problems. Instead
of one single event, CI often involve chains of events, making the
course of action even more uncertain [13]. Examples of CI range
from common failures of key organizational resources to extreme
natural hazards and industrial disasters.
CIRM assumes a collaborative dimension because teams can lev-
erage expertise, information processing, flexibility, decision-
making and confidence. Under extreme circumstances, CIRM
teams must lead the organizations beyond pre-established struc-
tures, rules and behaviors. CIRM is strongly dependent on the
teams knowledge and experience. Furthermore, as largely empha-
sized by the related literature [14, 15], Team Situation Awareness
(TSA) constitutes a critical asset for high performance teams
working in emergency situations. Therefore the role of cognitive
processes (considering a broader perspective of cognition) on es-
tablishing TSA is a fundamental dimension of teamwork analysis.
Our main research objective is studying - at the cognitive level -
teams performing CIRM activities. More specifically, we have
been trying to understand how teams use technology to communi-
cate, coordinate and collaborate under the demanding conditions
raised by CIRM. The adopted research approach relies on Mi-
croworlds.
Microworlds are real-time, task-oriented and synthetic environ-
ments used to study human behavior in simulated scenarios [16-
18]. Furthermore, a key characteristic that distinguishes a mi-
croworld environment regarding other simulation approaches is
the fact that it implements an autonomous dynamic of the evolv-
ing situation. In other words, the effects from users interaction
with the environment are not linear. The research literature has
been gathering evidence that Microworlds are capable to support
behavioral studies in challenging scenarios such as the ones pre-
sented by CIRM [19]. Microworlds must be carefully designed to
support experimental manipulation and control of the task envi-
ronment without removing many of the naturalistic conditions
faced by teams. One important challenge posed to Microworlds is
engaging teams in synthetic scenarios up to the point that their
behavior becomes natural and can therefore be analyzed as if in a
naturalistic setting [20]. A number of reasons impelled us to adopt
Microworlds to analyze CIRM scenarios:
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
Conference10, Month 12, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010$10.00.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 46 -
1. Incidents and their response have unexpected courses of action
therefore are difficult to set up in traditionally highly controlled
experiments. The inherent microworlds dynamic characteristics
allow specifying quasi-realistic scenarios and still preserve
some degree of control;
2. The ways teams address incidents are context dependent,
which often makes it difficult to generalize the findings. Mi-
croworlds can control the experimental context across multiple
scenarios and thus ease the definition of generalizable causal
interpretations;
3. Due to the nature of their work, the access to CIRM teams op-
erating in critical scenarios is typically difficult. Microworlds
accomplish two main purposes: training and unveiling team
processes dynamics.
Of course Microworlds also exhibit some limitations that should
be recognized beforehand. One that has been raised by several
researchers is the lack of ecological validity, i.e. results that are
significant beyond the laboratory. [21, 22] also present two other
concerns: (1) the need to design experimental scenarios that pro-
vide trustworthy representations of the problem domain; and (2)
the need to specify dependent and independent variables that fo-
cus on the naturalistic aspects and overcome the artificial traits of
the laboratorial scenarios. The research described in this paper
delves into these problems, proposing a Microworld that stream-
lines the construction of experimental scenarios and management
of experimental variables.
The paper is organized in the following way. We start with a re-
view of the related work. In Section 3 we present the main re-
quirements for developing a Microworld. Section 4 briefly de-
scribes the developed Microworld. In Section 5 we provide
experimental data from one extensive study done with the Mi-
croworld. Finally, Section 6 discusses the obtained results and
provides some concluding remarks.
2. RELATED WORK
The study of teamwork at the cognitive level has been evolving
over the past 20 years [23, 24]. Broadly speaking, the main focus
of research has been centered on understanding how teams: detect
salient cues in the environment; assimilate and combine infor-
mation; solve problems and make decisions; remember significant
information; plan courses of action; and develop high-
performance abilities.
Team cognition is deeply rooted on the traditional constructs of
individual cognition, including perception, interpretation, plan-
ning, and execution [25], memory storage and retrieval, and filter-
ing mechanisms [26]. Still, team cognition encompasses more
than the sum of individual cognitions, namely it covers team pro-
cesses such as communication, which has been regarded as a criti-
cal function [27-29].
The most recent research is converging towards understanding
how teams operate in naturalistic settings, that is, in realistic tasks
that require collaboration in the real world [30, 31]. This area of
concern is known as Macrocognition [32].
One major concern of Macrocognition is preserving the real-world
context while doing laboratory studies. This raises considerable
challenges, particularly when teams have to operate in complex
settings like CIRM. Cognitive phenomena such as emergence,
sensemaking, and attention must therefore be studied closer to
natural settings as much as possible [33].
Reinforcing this perspective, the research on Naturalistic Deci-
sion-Making (NDM) has been trying to understand how teams
make decisions in time-pressured environments [34]. One funda-
mental assumption of NDM is that teams diverge from the typical
rationalistic approach in which problems are analyzed in detail
and options are thoroughly evaluated until the best one is selected
[35]. According to NDM, decision makers tend to experience,
recognize, classify, and react in fast cycles.
The Macrocognition and NDM bodies of research extend cogni-
tion beyond the traditional information-processing paradigm [25]
considering the role of collaboration, pro-activity, and continuous
interaction in shaping decision making and action. Such perspec-
tive shares the ground of ecological psychology. Ecological psy-
chology relies on the concept of affordances as properties of the
interaction between the individual and the environment to unveil
opportunities/possibilities for action [36]. The dynamic, continu-
ous, and exploratory nature of affordances thus provides the con-
ceptual basis for understanding decision and action [37].
The development of this ecological perspective raises some
epistemological implications. By acknowledging affordances, we
must recognize that cognition extends beyond the human towards
the material setting. Thus team cognition is distributed across hu-
man and material settings, involving group interaction and embod-
iment [38, 39]. Based on this ecological perspective, Macrocogni-
tion studies may therefore focus on observable interactions, taken
in a broad sense, encompassing human-human, human-
technology, and human-environment interactions.
In [40], the authors distinguish internalized and externalized men-
tal processes employed by teams during one-of-a-kind problem-
solving situations. The internalized mental processes can only be
analyzed through indirect measurements, typically based on quali-
tative methods such as questionnaires and think-aloud protocols,
and also via surrogate quantitative metrics like pupil size and skin
response. On the other hand, externalized mental processes are
associated with actions that are analyzed through methods such as
process tracing and communication analysis.
Bringing collaborative technology to this fore raises many meth-
odological concerns [41], The analysis must be multidimensional,
since it must consider the individual, the group, and the technolog-
ical affordances as units of analysis that mutually influence each
other. Several models such as TAM [42] and TTM [43] have been
developed to address these problems. One common characteristic
of these models is the notion that both the technological af-
fordances and the needs experienced by individuals and teams
should be confronted.
TAM states that perceived usefulness and perceived ease of use
are instrumental to determine the users behavioral intentions and
consequently predict the human-technology interactions. TTM
builds on TAM to incorporate other cognitive factors such as per-
ceived frequency of net value and perceived magnitude of net
value. Both models highlight the importance of the group in the
construction of a positive or negative attitude towards the techno-
logical affordances.
According to several authors, two complementary research para-
digms have been guiding the study of technological affordances:
Behavioral Science and Design Science [44-46]. Behavioral Sci-
ence develops models and theory explaining and predicting how
humans and organizations behave. Causal models, and controlled
laboratory experiments contribute to develop rigorous studies of
team cognition. Nevertheless, the relevance of these results may
vary, as pointed out by [47].
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 47 -
The Design Science paradigm has its roots on engineering and is
primarily a problem-solving endeavor. It seeks to understand how
technology may solve specific problems in particular domains.
Thus, theory is subsumed by technology development. In this
view, the Design Science paradigm emphasizes a cyclic approach
where iterative developments followed by evaluation actions con-
tribute to understand complex cognitive phenomena.
The Design Science paradigm targets practical knowledge con-
struction. As such, its rigor has been questioned, mostly because it
frequently relies on common sense and heuristics [48]. When con-
trasted with the Behavioral Science paradigm, the Design Science
approach often lacks a commonly accepted reference model.
The strengths and weaknesses of these paradigms lead to their
complementary use in technology development. Each paradigm
may be viewed as one particular phase of the technology devel-
opment lifecycle. The Behavioral Science studies contribute to
establish the theoretical grounds for understanding human-human,
human-technology and human-environment interactions, while the
Design Science studies contribute with substantive test cases for
the claims brought by behavioral studies [49].
Hevner [50] proposed a research framework that combines these
two paradigms into three cycles: 1) the relevance cycle establishes
that relevance is attained through the identification of require-
ments and field-testing of concrete technological affordances; 2)
the rigor cycle posits that rigor is achieved by grounding the tech-
nological developments in solid conceptual foundations, including
methodologies, models, and theory; and 3) the design cycle is
responsible for the conception and implementation of technologi-
cal affordances. We adopted this framework in our research.
2.1 Microworlds as a Design-Evaluation Tool
The emphasis on naturalistic environments to study team cogni-
tion and the interplay between the behavioral and design sciences
in the development of technology that we identified earlier can be
combined in microworlds.
Microworlds are carefully crafted to support the laboratorial ma-
nipulation of the task environment without removing its natural-
istic characteristics [20]. An important feature is they explicitly
handle the dynamic and emergent aspects of the task, a long-time
prime concern of many decision-making studies, to the point that
microworlds are also known as management flight simulators
[51], which implies a degree of realism and engagement in the
games managers play [52].
Microworlds have also been adopted in scenarios such as naval
warfare [53], industrial process control [54], air traffic control
[55], naturalistic decision-making [16], fire fighting [19], and
other complex problem solving situations [17, 56], mostly for
training purposes. The potential to deal with unpredictable events
has also been investigated, uncovering many intricacies of cogni-
tive behavior [21]. Thus, microworlds definitively address the
relevance cycle.
A key aspect of microworld engagement is the dialog between
mental models and the running simulation [57]. This is because
disparities can happen between the beliefs people have about the
environment and team behavior: the former is described by com-
plex cause/effect networks, while the latter is oftentimes dysfunc-
tional, unpredictable, and yet naturally emergent, revealing, for
instance, contradictions in team strategies [52]. Consequently,
microworlds enable teams to learn from empirical experimenta-
tion, and allow them to evaluate and redesign existing policies.
This kind of practical knowledge construction reflects the design
cycle, which has also been applied to identify and resolve situa-
tion awareness problems in automation systems [58], to examine
how human behavior varies with the design of the human-
computer interface [22], and particularly, to augment the function-
ality of a preliminary tool for crisis response [59].
Furthermore, since microworlds can capture large amounts of
data, which are necessary for hypothesis testing, they also defi-
nitely contribute to the rigor cycle. We may therefore hypothesize
that microworlds may be excellent design-evaluation tools.
3. A CONCEPTUAL FRAMEWORK FOR
MICROWORLD DEVELOPMENT
We define a set of requirements for the development of a Mi-
croworld supporting teamwork studies at the cognitive level:
1. User engagement elements. In order to experience realistic
teams behavior the microworld environment must accommo-
date elements that promote engagement regarding the task and
environment (these elements may range from representations
that mimic real situation affordances to more sophisticated user
immersion elements)
2. Control the experimental conditions. This requirement is at
the core of any laboratory approach, on which Microworlds are
grounded. It assumes that the experimental setting must be
controlled to ensure precision and generalizability [60]. The
Microworld should provide experimental control while at the
same time preserving some degree of realism. For instance,
controlling the chain of events while reproducing real-world
incidents.
3. Mediate interaction, communication and collaboration.
These are the foundational elements of team cognition. They
emerge from the externalized mental processes and provide the
outputs necessary to analyze team cognition. The Microworld
should operationalize these outputs using a number of measur-
able metrics about human interaction, communication and col-
laboration.
4. Accommodate testable technological affordances. This re-
quirement meets the fundamental tenet of supporting the de-
sign-evaluation cycle. The Microworld should smoothly inte-
grate new technological designs in a way that ease innovation
but also model building and rigorous testing.
5. Execute experimental protocols. The Microworld should be
able to execute experimental protocols in accordance with a
domain specification. The domain specification should account
for the roles, tasks, messages, affordances and actions that con-
stitute the teamwork setting.
6. Collect experimental data. The Microworld must capture and
preserve data regarding interaction, communication and col-
laboration. This data should be kept in context with the envi-
ronmental and task conditions that influenced teamwork. The
granularity may range from the keystroke level to voice con-
versations. The flexibility handling various levels of detail is
essential to feed teamwork analysis.
We note that exploratory studies may have to be conducted before
starting a design-evaluation action using the Microworld. These
exploratory studies generate the contextual information necessary
to define the above-mentioned experimental protocols. These ex-
ploratory studies are also crucial to reproduce the application do-
main with some degree of realism.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 48 -
Figure 1 highlights the main concepts underlying the Microworld
development. It positions the exploratory study as a first step lead-
ing to subsequent design-evaluation actions. The dashed arrows
emphasize the iterative nature of the Microworld approach.
4. THE DEVELOPED MICROWORLD
4.1 Architecture
The developed Microworld adopts the client-server architecture
shown in Figure 2. The client consists of four different applications:
1. VoIP (Voice over IP) application, which allows two team
members to communicate with each other, emulating typical
phone and walkie-talkie conversations;
2. Task environment application, which loads a set of rules and
actions that the operators may accomplish in the environment,
e.g. move around;
3. Mobile Emulator, which emulates a mobile device delivering
the technological affordances under evaluation; and
4. Freeze-probe Questionnaires, which periodically freezes the
task to inquire the team about a set of cognitive factors, e.g.
situation awareness and sensemaking.
The server was developed as an application proxy that integrates
the required server components of the client applications. The
VoIPServer, manages the VoIP communications and the Mo-
bileServer, synchronizes clients running in the mobile emulator.
Complementarily, the server uses the applications supportive da-
tabases to maintain a coherent state between all applications (e.g.
to know when to trigger the freeze probes and provide contextual-
ly bounded questions). The supportive databases accomplish two
main goals: support the necessary data management to provide
proper application functioning and persist relevant data for results
analysis (e.g. task environment performed operations, freeze
probes answers). The complete description of the databases struc-
ture is outside the scope of this work, nevertheless one may out-
line that the Task database holds the exercises description com-
prehending network structures, allowed operations, existing roles
and respective operational profile.
4.2 Experimental set up and management
The major purpose of the developed Microworld is supporting
laboratory experiments with collaborating teams while facilitating
data collection and experimental control. We overview the main
requirements previously discussed and briefly describe how they
have been addressed in the developed Microworld in Table 1.
5. EXPERIMENT
5.1 Research goals
The research scenario involved helpdesk teams performing
maintenance tasks on a network infrastructure after an unknown
event had disrupted connectivity in some network links. These
operations are typically distributed on the physical space and the
teams rely on phone communications to coordinate their work. For
a previous study on the requirements of help desk teams operating
in CIRM scenarios see [11].
The main research goal was assessing the impact on team perfor-
mance and TSA caused by using a collaborative application
providing data sharing and task coordination. The hypothesis was
that the application would improve performance and TSA. Two
main collaborative settings should then be evaluated: one based
solely on phone communications, and another combining phone
communications with the collaborative application.
5.2 Experimental design
The experiment engaged 33 students from the final year of an
undergraduate programme in Informatics and they had already
completed a computer networks course. These students were
knowledgeable about the task setting and goals. They were orga-
nized in 11 teams with three elements. A consent form was signed
stating their commitment to the task and authorizing data collec-
Figure 1. Microworld development framework
Figure 2. Microworld architecture
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 49 -
tion. Prize money and extra course credits were offered to the best
performers to encourage deeper task engagement.
The Microworld was configured to support three different roles: 1)
Team Member 1 (TM1) has high-level credentials, allowing op-
erations on servers, routers, and computers; 2) Team Member 2
(TM2) has middle-level credentials, allowing operations on rout-
ers and computers, but not on servers; and 3) Team Member 3
(TM3) can only operate computers.
Before the experiment, the teams received a manual describing the
experiment goals, roles, and tools. Briefing sessions were orga-
nized to clarify any doubts regarding the experiment.
Four exercises were designed and loaded into the Microworld
environment. The odd teams accomplished two exercises without
the collaborative application support (W/O condition). The first
one was for training purposes, while the second one was effective
experimental data collection.
After the first two exercises, the odd teams were subject to two
more exercises with the collaborative application support (W/
condition). Again, the first one was for training purposes while the
second one was for data collection. Even teams performed in the
reverse order.
Figure 3a depicts one of the network infrastructures loaded in
microworld, which is operated through the task environment ap-
plication component (screenshot in Figure 3b). Table 2 presents a
sample exercise to be performed over the network. The questions
used in the freeze probes during the data collection exercises are
presented in Table 3. These questions are focused on evaluating
situation awareness. Finally, Table 4 presents the set of measure-
ments used to evaluate the research hypothesis.
a. Network Architecture
b. Screenshot of the task environment user interface
Figure 3. Example of a network loaded in microworld
5.3 Results
Concerning performance, [P1] in the W/ condition was signifi-
cantly longer than with the W/O condition. Considering the data
distribution, we used the non-parametric Wilcoxon signed-rank
test for pairwise comparisons to evaluate the statistical signifi-
cance of the results (Table 5). The analysis of [P2] and [P3] did
not reveal any statistically significant differences. [C] is on the
threshold of statistical significance urging that teams in the W/
condition perform fewer VoIP calls.
Three freeze probes were accomplished during the data collection
exercises. [IA] was analyzed for each team role (TM1, TM2 and
TM3) and regarding the three questions prompted by the freeze
Table 1. Experimental set up and management
Requirements
Issues
addressed Implementation
User
Engagement
Elements pro-
moting team
commitment
with the task
Two counts were provided to
team members expressing: the
total number of team actions and
the total moves of team members
through the environment (Team
score was maximized with min-
imal counts)
Task environ-
ment representa-
tion
A representation of the task envi-
ronment is provided to teams.
Experimental
control
Team size
Currently supports teams with
three elements
Team composi-
tion and struc-
ture
Different roles may be defined
for each team element, distin-
guishing technological and also
environmental actions
Task complexity
Various tasks and operational
environments, with different
complexity levels (variety of
actions and goals), may be up-
loaded in the Microworld
Location of
team members
The location of team elements in
the physical environment may be
emulated by the task environ-
ment application
Mediation
Human-human
VoIP application supports one-
to-one voice communications
Human-
environment
A predefined set of actions that
may be executed on the operat-
ing environment is uploaded in
the Microworld
Human-
technology
The prototype component may
be configured to emulate the
user-interfaces and the function-
ality offered by collaborative
applications
Technological
affordances
Application
design
Various application designs may
be emulated by the prototype
component
Experimental
protocols
Practice task
The Microworld may instantiate
a practice task, so that the opera-
tors may get familiar with the
experimental environment
Task completion
time
The task duration may be de-
fined in the task environment
Freeze probes
Define moments when the task is
frozen and the questions deliv-
ered to the operators
Data
collection
Record opera-
tions
Support three main dimensions of
analysis: performance, team pro-
cesses and situation awareness
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 50 -
probes (Table 2). The collected data did not reveal any significant
statistical differences between the two experimental conditions.
Table 2. Exercise Description
Reported problem
Connectivity lost in rooms B, C, E
and Computers connected to Router
D1
Problem source
Broken link between Router A1 and
Server
Required operations
(to optimal solution)
Connect Router A1 to Router A2,
Update Router B, Restart Router C
and Restart Router D1
Table 3. Questions used in the freeze probes
ID Question
[Q1] What are the states of the devices linked to the last oper-
ated device?
[Q2] In what room are the team members currently located?
[Q3] Which devices are currently constraining the network
connectivity?
Table 4. Measurements
ID Metric Description
[P1] Completion Time Time to complete the exercise
[P2] Efficiency
ideal number of operations to solve the exercise
numbei of opeiations in the viitual netwoik
[P3] Efficacy
numbei of woiking uevices
achievable number of working devices
[C] Communication numbei of voIP communications
[IA] Individual
Awareness
number of correct items in freeze probes
number of questioned items
[ShA] Shared Awareness
Overlap:



Precision:


[DA] Distributed
Awareness
Team average of individual scores in the freeze
probes
Table 5. Performance
Metric W/O W/ p value
[P1] 8.23 10.55 0.016
[P2] 0.78 0.76 0.56
[P3] 0.97 0.98 0.51
[C] 10.09 7.73 0.05
Regarding [ShA] we defined two dimensions of analysis: the
overlap of answers between team members (common knowledge)
and the precision of the answers (the extent that such knowledge
is correct). Table 6 summarizes the achieved scores regarding the
three questions during the three freeze probe iterations.
[Q1] scores exhibit a growing knowledge overlap between the
first freeze probe and the second and then maintain similar scores
at the final freeze probe. The precision scores indicate that the
existing overlap is highly accurate regarding the real situation.
Nevertheless, no significant differences are observed between the
two experimental conditions.
Overlap scores and particularly precision regarding [Q2] decay as
exercise evolves. Besides the first freeze probe overlap score and
the precision scores in the two first freeze probes reveal slightly
better in the W/ condition, no statistically significant differences
were found.
[Q3] exhibited the lower overlap scores of the three questions and
had kept low through all the freeze probes. Despite the poor com-
mon knowledge achieved regarding [Q3] it was accurate, consid-
ering the precision scores. Particularly, although without yielding
a statistically significant difference, in the W/ condition teams
achieved better precision as exercise evolve.
The analysis of distributed awareness [DA] was based on the av-
erage scores of individual answers to the freeze probes of [Q1,
Q2, Q3], constituting an aggregated measure of team knowledge
considering the team as the unit of analysis (actionable knowledge
existing in the team). Despite the results again not revealing any
statistically significant differences between conditions, a more
detailed analysis provides interesting insights about the evolution
of [DA] over time.
[Q1] shows a slight improvement from the first to the second
freeze probe, and then reached a plateau in the third iteration (Fig-
ure 4). The answers to [Q2] reveal that as the exercise unfolds the
teams loose awareness of where the others are located. However,
the W/ condition obtains better scores than the W/O condition
(Figure 4). Finally, [Q3] shows that the teams improved their ag-
gregated situation awareness throughout the freeze probes, with a
slightly advantage obtained by the W/ condition.
6. CONCLUDING REMARKS
Grounded on previous research streams emphasizing the im-
portance of studying human action in naturalistic settings, i.e. as
closer as possible to real operating environments, we have re-
searched the adoption of Microworlds in the study of teamwork at
the cognitive level. We have specifically focused on the challeng-
ing context of CIRM, where access to real operating environments
often reveals difficult or even impossible.
We defined a set of requirements these Microworlds should ac-
complish to support teamwork studies. Based on these require-
ments, we developed a Microworld. The capacity of the Mi-
croworld to capture experimental data at the cognitive level was
evaluated. Along the development process, we also assessed the
Microworlds capacity to control the experimental setting and to
facilitate the experimental set up and management.
The extensive study briefly reported in this paper demonstrates the
relevance of the Microworld approach. In the one hand, it serves
to collect large amounts of varied cognitive-level information. In
Table 6. Shared awareness scores
Iteration 1 Iteration 2 Iteration 3
Overlap Precision Overlap Precision Overlap Precision
w/o w/ w/o w/ w/o w/ w/o w/ w/o w/ w/o w/
Q1 0.26 0.25 1.00 1.00 0.57 0.63 0.95 1.00 0.62 0.60 0.99 0.98
Q2 0.75 0.81 0.78 0.93 0.68 0.63 0.61 0.71 0.65 0.63 0.42 0.41
Q3 0.09 0.06 0.96 0.86 0.10 0.09 0.75 1.00 0.14 0.13 0.86 0.93
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 51 -
the other hand, it also facilitates de definition and execution of the
several experimental conditions necessary to obtain the experi-
mental data.
As it is often the case, the concrete experiment reported in the
paper does not reveal a breakthrough technological solution to
improve the teams performance (considering the tested collabora-
tive application). It nevertheless allowed us to analyze at the cog-
nitive level how the collaborative application was used by the
teams, and also why significant differences do not actually occur.
We therefore conclude that the Microworld environment proved to
be a rich and systemic data collection medium and provides solid
grounds for consistent data collection and analysis.
7. ACKNOWLEDGMENTS
This research was partially funded by the Portuguese Foundation
for Science and Technology (PTDC/EIA/102875/2008).
8. REFERENCES
[1] Oravec, J. 1996. Virtual Individuals, Virtual Groups: Human
Dimensions of Groupware and Computer Networking.
Cambridge University Press.
[2] Zurita, G., et al. 2007. Mobile sensemaking: Exploring
proximity and mobile applications in the classroom. Journal
of Universal Computer Science, 13(10), 1434-1448.
[3] Weick, K., K. Sutcliffe, and D. Obsfeld 2005. Organizing
and the process of sensemaking. Organization Science,
16(4), 409-421.
[4] Antunes, P., et al. 2010. Integrating spatial data and decision
models in a e-planning tool. In Proceedings of the 16th
CRIWG Conference on Collaboration and Technology
(Maastricht, The Netherlands). Springer-Verlag, 97-112.
[5] Ferreira, A., P. Antunes and V. Herskovic 2011. Improving
group attention: An experiment with synchronous brain-
storming. Group Decision and Negotiation, 20(5), 643-666.
[6] Ferreira, A. and P. Antunes 2008. An attentive groupware
device to mitigate information overload. In Proceedings of
the 2008 Conference on Design, Specification, and
Verification of Interactive Systems (Kingston, Canada).
Springer-Verlag, 29-42.
[7] Antunes, P. and A. Ferreira 2011. Developing collaboration
awareness support from a cognitive perspective. In
Proceedings of the 44th Hawaii International Conference on
System sciences (Hawaii, HI, USA). IEEE Press.
[8] Endsley, M., B. Bolt, and D. Jones 2003. Designing for
Situation Awareness. Taylor & Francis.
[9] Ferreira, A. and P. Antunes 2008. Tackling information
overload in electronic brainstorming. In Proceedings of the
2008 GDN (Coimbra, Portugal).
[10] Antunes, P., et al. 2011. Development of a mobile situation
awareness tool supporting disaster recovery of business
operations. In Supporting Real Time Decision-Making: The
Role of Context in Decision Support on the Move. Springer,
337-360.
[11] Sapateiro, C., et al. 2011. Developing a mobile collaborative
tool for business continuity management. Journal of
Universal Computer Science, 17(2), 164-182.
[12] Sapateiro, C. and P. Antunes 2009. An emergency response
model toward situational awareness improvement. In
Proceedings of the 2009 ISCRAM (Gteborg, Sweden).
[13] Rosenthal, U., A. Boin, and L.K. Comfort 2001. Managing
Crises: Threats, Dilemmas, Opportunities. Charles Thomas.
[14] Milis, K. and B.V.d. Walle 2007. IT for Corporate Crisis
Management: Findings from a Survey in 6 different
Industries on Management Attention, Intention and Actual
Use. In Proceedings of HICSS.
[15] Kanno, T. and K. Futura 2006. Resilience of Emergency
Response Systems.2
nd
Symposium on Resilience Engineering
(Juan-les-Pins, France)
[16] Chapman, T., et al. 2006. Investigating the construct validity
associated with microworld research: A comparison of
performance under different management structures across
expert and non-expert naturalistic decision-making groups.
Australian Journal of Psychology, 58(1), 40-47.
[17] Jobidon, M.E., et al. 2006. Team response to workload
transition: The role of team structure. In Cognition: Beyond
the Brain. 22-32.
[18] Brehmer, B. and D. Drner 1993. Experiments with
computer-simulated microworlds: Escaping both the narrow
straits of the laboratory and the deep blue sea of the field
study. Computers in Human Behavior, 9(2), 171-184.
[19] Omodei, M.M. and A.J. Wearing 1995. The Fire Chief
microworld generating program: An illustration of computer-
simulated microworlds as an experimental paradigm for
Figure 4. Distributed awareness [DA]
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 52 -
studying complex decision-making behavior. Behavior Research
Methods, Instruments, and Computers, 27(3), 303-316.
[20] Gray, W. 2002. Simulated task environments: The Role of
high-fidelity simulations, scaled worlds, synthetic
environments, and laboratory tasks in basic and applied
cognitive research. Cognitive Science Quarterly, 2(2) 205-
207.
[21] Gonzalez, C., P. Vanyukov, and M.K. Martin 2005. The use
of microworlds to study dynamic decision making.
Computers in Human Behavior, 21(2), 273-286.
[22] Sauer, J., D.G. Wastell, and G.R.J. Hockey 2000. A concep-
tual framework for designing micro-worlds for complex
work domains: a case study of the Cabin Air Management
System. Computers in Human Behavior, 16(1), 45-58.
[23] Cooke, N.J., et al. 2001. Advances in Measuring Team
Cognition.
[24] Cuevas, H.M., et al. 2007. Augmenting Team Cognition in
Human-Automation Teams Performing in Complex
Operational Enviornments. Aviation, Space, and
Environmental Medicine, 78(5).
[25] Card, S., T. Moran, and A. Newell 1983. The Psychology of
Human-Computer Interaction. Lawrance Elrbaum.
[26] Reason, J. 1990. Human Error. Cambridge University Press.
[27] Kiekel, P.A., et al. 2001. Automating measurement of team
cognition through analysis of communication data. Usability
Evaluation and Interface Design. Lawrence Erlbaum.
[28] Keyton, J., S.J. Beck, and M.B. Asbury 2010. Macro-
cognition: a communication perspective. Theoretical Issues
in Ergonomics Science, 11(4), 272-286.
[29] Kennedy, D.M. and S.A. McComb 2010. Merging internal
and external processes: Examining the mental model
convergence process through team communication.
Theoretical Issues in Ergonomics Science, 11(4), 340-358.
[30] Salas, E., et al. 2010. Emerging multi-disciplinary theoretical
perspectives in team cognition: an overview. Theoretical
Issues in Ergonomics Science, 11(4), 245-249.
[31] Wallace, D.M. and V.B. Hinsz 2010. Teams as technology:
applying theory and research to model macrocognition
processes in teams. Theoretical Issues in Ergonomics
Science, 11(4), 359-374.
[32] Cacciabue, P.C. and E. Hollnagel 2005. Simulation of cognition:
Applications. In Expertise and Technology: Issues in Cognition
and Human-Computer Cooperation. Lawrance Elrbaum.
[33] Klein, G., et al. 2003. Macrocognition. IEEE Intelligent
Systems, 18(3), 81-85.
[34] Klein, G. 1993. A recognition-primed decision (RPD) model
of rapid decision making. In Decision Making in Action:
Models and Methods. Ablex Publishing.
[35] Wallace, B. and A. Ross 2006. Beyond Human Error. CRC
Press, London UK. ISBN 0849327180.
[36] Gibson, J.J. 1966. The senses considered as perceptual
systems. Houhton Mifflin.
[37] Turvey, M.T. and R.E. Shawn 1995. Toward an ecological
physics and physical psychology. In The Science of the
Mind: 2001 and Beyond. Oxford University Press, 144-169.
[38] Dourish, P. 2011. Where the Action Is. MIT Press.
[39] Suchman, L. and R. Trigg 1993. Artificial Intelligence as
Craftwork. In Understanding Practice, Cambridge Uni-
versity Press.
[40] Fiore, S.M., et al. 2010. Towards an understanding of
macrocognition in teams: developing and defining complex
collaborative processes and products. Theoretical Issues in
Ergonomics Science, 11(4), 250-271.
[41] Antunes, P., et al. (to appear). Structuring dimensions for
collaborative systems evaluation. ACM Computing Surveys.
[42] Davis, F. 1986. A technology acceptance model for
empirically testing new end-user information systems:
Theory and results. PhD Thesis. Sloan School of
Management, Massachusetts Institute of Technology.
[43] Briggs, B., J. Nunamaker, and D. Tobey 2001. The
technology transition model: A key to self-sustaining and
growing communities of GSS users. in Proceedings of the
34th Hawaii International Conference on System Sciences
(Hawaii, HI, USA).
[44] Hevner, A., et al. 2004. Design science in information
systems research. Management Information Systems
Quarterly, 28(1), 75-105.
[45] Niehaves, B. and B. Stahl 2006. Criticality, epistemology,
and behaviour vs. design: Information systems research
across different sets of paradigms. Leicester, England.
[46] Cleven, A., P. Gubler, and K.M. Hner 2009. Design
alternatives for the evaluation of design science research
artifacts. In Proceedings of the 4th International Conference
on Design Science Research in Information Systems and
Technology. (Philadelphia, PA, USA). ACM Press, 1-8.
[47] Winter, R. 2008. Design science research in Europe.
European Journal of Information Systems, 17(5), 470-475.
[48] Briggs, R.O. 2006. On theory-driven design and deployment
of collaboration systems. International Journal of Human-
Computer Studies, 64(7), 573-582.
[49] March, S.T. and G.F. Smith 1995. Design and natural science
research on information technology. Decision Support
Systems, 15(4), 251-266.
[50] Hevner, A. 2007. A three cycle view of design science
research. Scandinavian Journal of Information Systems,
19(2), 87-92.
[51] Sterman, J.D. 2000. Business Dynamics: Systems Thinking
and Modeling for a Complex World. McGraw-Hill.
[52] Keys, J.B., R.M. Fulmer, and S.A. Stumpf 1996.
Microworlds and simuworlds: Practice fields for the learning
organization. Organizational Dynamics, 24(4), 36-49.
[53] Arthur, W., et al. 2010. The effect of distributed practice on
immediate posttraining, and long-term performance on a
complex command-and-control simulation task. Human
Performance, 23(5), 428-445.
[54] Sauer, J., et al. 2008. The effects of heuristic rule training on
operator performance in a simulated process control
environment. Ergonomics, 51(7), 953-967.
[55] O'Brien, K.S. and D. O'Hare 2007. Situational awareness
ability and cognitive skills training in a complex real-world
task. Ergonomics, 50(7), 1064-1091.
[56] Funke, J. 2001. Dynamic systems as tools for analyzing
judgment. Thinking and Reasoning, 7, 69-89.
[57] Morecroft, J.D.W. 1988. System dynamics and microworlds
for policymakers. European Journal of Operational
Research, 35(3), 301-320.
[58] Itoh, M. and T. Inagaki 2004. A microworld approach to
identifying issues of human-automation systems design for
supporting operator's situation awareness. International
Journal of Human-Computer Interaction, 17(1), 3-24.
[59] Schraagen, J.M. and J. van de Ven 2008. Improving decision
making in crisis response through critical thinking support.
Journal of Cognitive Engineering and Decision Making, 2,
311-327.
[60] McGrath, J. 1984. Groups: Interaction and performance.
Prentice-Hall.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 53 -
SLMEETINGROOM: UM MODELO DE AMBIENTE PARA SUPORTE A
REUNIES REMOTAS, ORIENTADAS A TAREFAS, COM GRUPOS
PEQUENOS PARA O SECOND LIFE
Cintia Ramalho Caetano da Silva
Instituto de Computao (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
ccaetano@ic.uff.br
Ana Cristina Bicharra Garcia
Instituto de Computao (IC)
Universidade Federal Fluminense (UFF)
Rio de Janeiro, Brasil
bicharra@ic.uff.br

AbstractThis research investigates the use of
SLMeetingRoom model, an environment model to support
collaborative activities in Second Life

that occur in meetings


where participants are geographically distant. The
SLMeetingRoom model is composed of the a set of ten
components that supports collaborative activities including
communication between participants, coordination of tasks
and people, cooperation between participants and awareness of
work and group. This work hypothesizes that the use of
SLMeetingRoom model to support meetings, provides results
closest to face to face interactions. A comparative experimental
study with groups of graduate students, enrolled in the
discipline of Interface and Multimedia of the Fluminense
Federal University (UFF) was conducted. Results show that a
group using the SLMeetingRoom model has less cognitive
effort and a greatest sense of presence to realize the meetings,
that a group using Second Life without the SLMeetingRoom
model and a group using videoconferencing systems.
Keywords-component; CSCW, Second Life, SLMeetingRoom
model, work meetings.
I. INTRODUO
Quando as pessoas atuam em grupos, em geral, a
sinergia produz resultados melhores do que trabalhando
individualmente, pois, juntas, podem buscar ideias e
informaes para auxiliar na resoluo dos problemas. Ao
realizar uma tarefa, um grupo pode utilizar determinados
modos de trabalho [1], como, por exemplo, uma reunio,
definida por [2] e [3] como um ponto de encontro para um
determinado grupo estabelecer comunicao e interagir,
conjuntamente, para atingir determinados objetivos.
Com o surgimento da Web 3.0 e das tecnologias de
ambientes virtuais 3D, novas possibilidades para a realizao
de reunies virtuais tem sido propostas [2][4][5]. O Second
Life (SL) tem despontado como ambiente para interao
entre pessoas geograficamente distribudas, despertando o
interesse de organizaes como IBM, Intel e NASA, para
realizar reunies virtuais entre funcionrios, filiais ou
clientes distribudos, reduzindo os custos de alocao de
espao e tempo de viagem [2][6]. A comunidade acadmica
utiliza o SL como ferramenta educacional, facilitando a
imerso dos alunos e professores [7][8]. J a comunidade de
pesquisa acredita na possibilidade de desenvolvimento de
uma postura profissional dentro de ambientes virtuais 3D [9].
A problemtica deste trabalho se concentra no fato de
que, mesmo com tantas plataformas existentes no mercado
(chats, videoconferncia, EMS
1
), falta uma soluo satisfat-
ria para o suporte das reunies remotas. Ambientes virtuais
3D, como o SL, so uma boa proposta, mas ainda no
possuem as funcionalidades necessrias para apoiar as
atividades vitais de reunies remotas. Segundo [12][24][43],
as atividades vitais em uma reunio de trabalho remota, que
necessita de suporte, so: agendamento de compromissos e
eventos, acompanhamento das tarefas, tomada de decises,
votao, armazenamento de informaes e percepo.
Com o objetivo de resolver o problema desta pesquisa,
propomos a criao de um modelo de ambiente para suporte
s atividades bsicas que ocorrem em reunies de trabalho.
Posteriormente, levantamos a hiptese de que, ao enriquecer
o Second Life com o modelo SLMeetingRoom, a qualidade
das reunies sero mais prximas a das reunies face-a-face
('padro ouro). Consideramos que a qualidade das reunies
pode ser medida pelos seguintes critrios: grau de
completude das tarefas ao final da reunio, nvel de
participao de cada integrante do grupo, esforo cognitivo
para a interao entre os participantes e senso de presena
percebido pelos participantes do grupo.
O mtodo de pesquisa adotado foi o estudo experimental
comparativo, que visa comparao entre grupos
experimentais e controle, atravs da alocao aleatria dos
participantes [10]. O estudo experimental comparativo foi
realizado em duas etapas: estudo piloto e experimento.
Na anlise das medidas objetivas foram utilizadas
tcnicas estatsticas como medidas-resumo (mdia, varincia,
desvio padro e porcentagem), regresso e correlao. O
teste de hipteses foi utilizado como um mecanismo para
fornecer evidncia estatstica de diferenas entre os grupos
experimentais. Com o objetivo de comparar os grupos, foi
utilizado o teste de Jonckheere-Terpstra JT [11], um teste
no-paramtrico que verifica as diferenas entre tratamentos
ordenados.
II. FUNDAMENTAO TERICA
A utilizao de computadores para apoio ao trabalho em
conjunto deu origem a rea de pesquisa conhecida como
CSCW (Computer Supported Cooperative Work), que visa
entender como a tecnologia atua na execuo de trabalhos e

1
Eletronic Meeting System ou Sistemas de Reunio Eletrnica
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 54 -
tarefas em conjunto, abrangendo o suporte computacional a
atividades que envolvem mais de uma pessoa [12]. Segundo
[12], a tecnologia virtual tem a capacidade de afetar,
profundamente, a natureza do trabalho em grupo, atravs da
utilizao de plataformas dedicadas, que do o suporte,
devidamente adequado, ao processo de interao do grupo.
A maioria das pessoas considera as reunies face-a-face
como a forma ideal de comunicao. Estas reunies so
avaliadas por muitos como o 'padro ouro para as
interaes em um grupo [9][24]. possvel notar os
benefcios do espao de trabalho comum, como o aumento
da aprendizagem, motivao, coordenao e produtividade
[25], quando pessoas interagem em reunies presenciais. A
facilidade da utilizao do olhar, gestos e posturas, assim
como o acesso mtuo a artefatos compartilhados (telas,
modelos, paineis, etc.) reforam as vantagens das reunies
presenciais [24]. Porm, h, tambm, alguns problemas,
como: custos elevados associados ao tempo e alocao de
espao; ateno excessiva a questes menores;
apreensividade sobre como as ideias sero recebidas [3];
nervosismo associado ao fato de ocupar a condio de
falante (dificuldades na eloquncia e exposio de
ideias)[26]; falta de um bom registro; etc. Estes problemas
podem resultar, muitas vezes, em reunies menos
participativas [3].
A utilizao da tecnologia, por muitas vezes, organiza e
realiza reunies eficazes, no entanto, mesmo depois de uma
preparao intensa, no h garantias de que a reunio vai
progredir sem qualquer problema e alcanar as metas
desejadas. Alm disso, a avaliao de uma 'boa reunio
algo subjetivo e embora as reunies mal sucedidas ocorram,
frequentemente, suas causas exatas so, em grande parte,
no-documentadas e no-compreendidas. Torna-se
necessrio, certa quantidade de estrutura para garantir o
sucesso da reunio, para que o grupo permanea concentrado
e realize a tarefa necessria com o mnimo de interrupo.
A comunicao mediada por vdeo, tambm conhecida
como videoconferncia, foi apontada por inmeros autores
como a substituta para a comunicao face-a-face [27][28]
[29]. Os sistemas de videoconferncia so excelentes
ferramentas para CSCW, pois facilitam a comunicao,
aumentam o nvel de participao [30] e reduzem custos com
deslocamento fsico [24]. Essas vantagens tornam a
videoconferncia um meio rico para a comunicao. No
entanto, considerada uma soluo invasiva, que, de certa
forma, tira a privacidade durante as interaes [31]; com alto
custo para configurao e manuteno das tradicionais salas
de reunies [32]; e no permite a configurao de um
contexto real de sala de reunio, com participantes remotos
atuando sentados em uma mesa de trabalho [29].
O lento crescimento e as limitaes dos sistemas de
videoconferncia para a realizao de reunies distribudas
[33][34], possivelmente, fortaleceram o aparecimento dos
sistemas de reunio eletrnica (EMS) - que surgiram na
tentativa de preencher a falta de sistemas que apoiassem,
especificamente, a colaborao entre participantes de um
grupo em reunies virtuais, melhorando, consequentemente,
a eficcia, eficincia e satisfao [3]. Os sistemas EMS
apresentam vantagens como: apoio comunicao, atravs
de ferramenta de brainstorming, organizao de ideias e
votao; apoio coordenao das tarefas, atravs de
ferramentas para facilitadores de reunies, agendas e
cronogramas; apoio cooperao, atravs de ferramentas de
compartilhamento de rea de trabalho; e apoio percepo,
atravs de ferramentas de feedback das atividades dos
participantes. Apesar dos sistemas EMS cobrirem todos os
requisitos essenciais para a colaborao, estudos indicam que
a adoo dos EMS tem sido bastante restrita. As limitaes
so inmeras, como alto consumo de banda de Internet,
complexidade de manuteno e instalao, resistncia s
mudanas, dificuldade em mensurar os benefcios, etc. [35].
Aps o advento dos EMS, surgiram os ambientes virtuais
3D, que esto, gradualmente, se tornando mais comuns como
ferramentas cotidianas para a comunicao, socializao e
realizao de reunies [2][4][5]. Nos ambientes virtuais 3D
disponveis para interao social e comunicao,
encontramos, dentre outros, o There [36], o Active World
[37] e o Second Life (SL) [38]. O mais popular representante
dos metaverso
2
interativos o SL, um ambiente de realidade
virtual, compartilhado entre usurios remotos, que se
assemelha ao universo real.
Segundo [4], o SL cobre a maior parte dos aspectos
essenciais da comunicao sncrona to importante na rea
de CSCW, como chat direto, mensagens instantneas,
conversas de voz, gestos, grupos internos, etc. Ele tambm
permite alargar os limites da interao remota, atravs de
modelos 3D, que oferecem um excelente potencial para
novas formas de interao, cooperao e socializao. A
imerso do participante no contexto da interao o ponto
forte do SL, que gera um sentimento de co-localizao,
simulando a sensao de estar fisicamente co-localizado,
tornando um ambiente possvel e favorvel para a realizao
de reunies de trabalho, tendo em vista a apresentao das
caractersticas de reunies face-a-face e remotas.
O Second Life tem se mostrado um excelente potencial
para o desenvolvimento de atividades colaborativas, uma vez
que suas caractersticas de mundo real permitem que o
usurio esteja imerso nas atividades e sinta-se parte do
ambiente. Assim como os EMS, o SL consegue atingir,
positivamente, os requisitos essenciais para a colaborao,
isto , as atividades de comunicao so bem desenvolvidas,
a percepo e cooperao so apoiadas pela qualidade das
interaes 3D e, em menor escala, garante a coordenao
atravs dos grupos internos.
Tais vantagens afirmam o escopo desta pesquisa
utilizando o SL como um groupware para suporte a reunies
distribudas, no intuito de verificar se a criao de um
ambiente de reunies, composto por um conjunto de
componentes essenciais para a colaborao, permitir obter
resultados mais prximos das interaes face-a-face.
III. MODELO SLMEETINGROOM
A colaborao pode ser vista como a combinao das
atividades de comunicao, coordenao, cooperao,
aliadas a percepo. Esse trip de atividades conhecido

2
Terminologia para indicar um mundo virtual. A palavra metaverso uma
juno do preIixo 'meta (que signiIica 'alm) e 'universo [39].
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 55 -
como modelo 3C de colaborao. Um modelo que determina
os requisitos essenciais para que possa existir uma
colaborao efetiva entre os membros de uma equipe e
visto como o objetivo do groupware [12]. Dessa forma,
utilizamos o modelo 3C de colaborao para implementar e
avaliar os componentes que compe nosso modelo.
O modelo SLMeetingRoom um modelo de trabalho em
grupo em reunies onde os participantes esto
geograficamente distribudos. Para desenhar o modelo, nos
inspiramos na representao dos modelos de sistemas
distribudos organizados em camadas. A Figura 1 apresenta a
representao do modelo SLMeetingRoom.


Figure 1. Modelo SLMeetingRoom
O Second Life a camada mais externa do modelo. Ele
oferece a infraestrutura de sistema distribudo para apoiar o
processo de reunio, atravs de espaos compartilhados para
interao do grupo. Os usurios, que ingressarem na sala de
reunies apoiada pelo modelo SLMeetingRoom, tero acesso
a todas as camadas. Cada camada, por sua vez, representa os
servios disponibilizados pelo modelo. Os componentes
atuam como provedores de servios nas camadas, podendo
atuar em vrias camadas ao mesmo tempo.
Da mesma forma como no modelo de sistemas
distribudos em camadas, existe um relacionamento de
dependncia entre as camadas do modelo SLMeetingRoom.
A comunicao gera compromissos para a coordenao. A
coordenao eficiente facilita as atividades de cooperao. E
a percepo, por sua vez, apoia a comunicao e a
coordenao. De um modo geral, cada camada separada
para fins de anlise, porm elas atuam de forma integrada
durante o trabalho em grupo.
Os componentes que compe o modelo SLMeetingRoom
foram propostos, a partir de trs experimentos utilizando o
SL para realizao de reunies. Atravs desses experimentos,
notamos que a maior dificuldade em utilizar o SL, para
realizar reunies, foi a falta de um ferramental mnimo para
apoiar as reunies de trabalho, de forma a conduzir as
atividades, visando atingir os objetivos do grupo.
Tendo em vista que um componente pode atuar em mais
de uma camada, apresentamos a Tabela 1 com um resumo
dos componentes, as camadas para a qual ele foi criado e as
camadas que ele tambm apoia.
TABELA 1: COMPONENTES DO MODELO SLMEETINGROOM.
COMPONENTE
CRIADO
PARA APOIAR
TAMBM APOIA
Whiteboard Cooperao Comunicao
Agenda de reunio Coordenao Comunicao
Cronograma Coordenao Percepo
Repositrio Cooperao Comunicao
M. Argumentao Cooperao Comunicao
Social Proxy Percepo Comunicao/Coordenao
Urna de votao Cooperao Comunicao/Coordenao
Painel de gestos Comunicao Percepo
Lista de presena Coordenao Percepo
Cronmetro Coordenao Percepo
IV. ESTUDO EXPERIMENTAL COMPARATIVO
A. Estudo Piloto
1) Viso geral: O estudo piloto caracterizou-se por um
conjunto de reunies de trabalho continuadas, com grupos
atuando em quatro condies de trabalho (Face-a-Face,
Videoconferncia, SL sem o SLMeetingRoom e SL com o
SLMeetingRoom), a fim de avaliar se o modelo proposto
atende hiptese que orienta essa pesquisa.
2) Participantes: Doze alunos do curso de Mestrado em
Computao da UFF, matriculados na disciplina de
Interface e Multimdia. A participao foi uma das
exigncias para o trmino da disciplina, conforme revisto e
aprovado pela professora responsvel. Os alunos j se
conheciam, mas nunca tinham executado trabalhados juntos.
Os participantes no receberam qualquer remunerao, mas
a nota atuou como um incentivo a participao.
3) Tarefa: Projeto em grupo de uma interface web para
uma tica, assim como, todas as etapas para o
desenvolvimento do prottipo do sistema web da tica.
4) Durao: Os grupos foram acompanhados em um
perodo de quinze dias. Cada grupo realizou quatro
reunies, com durao mxima de uma hora. Apenas um
dos grupos ultrapassou dois minutos do tempo estipulado.
Cada grupo participou de quatro reunies (totalizando
dezesseis) e utilizou um dos quatro cenrios propostos.
5) Configurao dos Grupos e Espaos de Trabalho:
Quatro grupos foram formados com trs participantes em
cada grupo, de forma aleatria (por meio de sorteio). Na
condio Face-a-Face`, o grupo atuou em uma sala de
reunies disponibilizada no Laboratrio ADDLabs
(Laboratrio de Documentao Ativa e Design Inteligente)
da UFF. Na condio VideoconIerncia` os participantes
utilizaram um cliente de videoconferncia, chamado ooVoo
(http://www.oovoo.com). Na condio SL sem o
SLMeetingRoom`, Ioi construida uma sala de reunies no
SL (na Ilha ADDLabs), onde o grupo atuou sem qualquer
componente para apoiar a realizao das reunies. Na
condio SL com o SLMeetingRoom`, tambm Ioi
construda uma sala de reunies no Second Life, na Ilha
ADDLabs, onde o grupo atuou utilizando o modelo
SLMeetingRoom para apoiar o processo de realizao das
reunies. Todas as conversas foram videogravadas,
audiogravadas e, os logs de chat, registrados.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 56 -
6) Processo: Antes de iniciar as reunies do estudo
piloto, os participantes Ioram submetidos ao Questionario
de PerIil do Participante`, baseado em [13]. Tambm foi
solicitado o preenchimento e assinatura do Termo de
Consentimento Livre e Esclarecido` (TCLE), adaptado de
[14], que visa obteno do consentimento para
participao dos experimentos. Em seguida, os participantes
Ioram submetidos ao Termo de Autorizao de Uso de
Imagem e Depoimentos`, adaptado de [15], que visa
autorizao para o uso das imagens e depoimentos
capturados durante os experimentos. Ao final de cada
reunio, os participantes Ioram submetidos ao Questionario
de ps-reunio`, baseados na escala Likert de 5 pontos (0-
discordo totalmente a 4-concordo totalmente), onde foram
aferidos sobre suas impresses durante a utilizao do
cenrio para a realizao das reunies. Todas as reunies
contaram com a presena de um observador para as
filmagens, os registros de tempo, e as anotaes, etc. O
observador, no entanto, no teve qualquer comunicao com
os participantes do grupo.
7) Dados Coletados: As variveis coletadas, em cada
critrio de avaliao, foram:
x Completude das tarefas: medida objetiva: NTA
r

(nmero de tarefas da agenda de uma reunio), NTR
r

(nmero de tarefas da agenda realizadas durante uma
reunio r) e T
r
(tempo gasto para realizar a reunio); e
medida subjetiva: questionrio de ps-reunio
baseados em [16].
x Participao: medida objetiva: NTC
i
(nmero total de
turnos de conversa de um participante i durante a
reunio r) e DTC
i
(durao total dos turnos de
conversa de um participante i); e medida subjetiva:
questionrio de ps-reunio baseado em [16] e [17].
x Esforo cognitivo: medida subjetiva: questionrio de
ps-reunio baseado no NASA-TLX MANUAL [18].
A aplicao da ferramenta NASA-TLX baseada em
seis subescalas, a partir da anlise da demanda mental
e fsica exigida dos indivduos, da exigncia temporal
feita pela tarefa, bem como pelo desempenho, esforo
exercido e nvel de frustrao atingido.
x Senso de presena: medida objetiva: quantidade de
pronomes eu, ns, voc e ele/ela, quantidade de
verbos na 1 pessoa do plural, quantidade de dixis
3

locais e remotas; e medida subjetiva: questionrio
ps-reunio baseado em [19], SUS Slater-Usoh-
Steed [20] e PQ Presence Questionnaire [21].
B. Experimento
Os resultados do teste de hipteses do estudo-piloto
indicaram que o grupo utilizando o modelo
SLMeetingRoom, apresentou menor esforo cognitivo e
maior senso de presena para realizar as reunies. Estes
resultados nos estimularam a entender melhor quais os
ganhos com a utilizao de um ambiente preparado para
suporte a reunies, ou seja, quais os benefcios do modelo
proposto.

3
Propriedade que tem alguns elementos lingusticos, tais como pronomes
pessoais e demonstrativos (esse, ali, aqui, l, aquele, etc.) [45].
Desta forma, preparamos um experimento comparando
apenas duas condies de trabalho (com o SLMeetingRoom
e sem o SLMeetingRoom). Trabalhamos com mais pessoas
em cada grupo, realizando mais reunies, e, tambm, outra
tarefa. Os participantes eram os mesmos do estudo piloto, o
que nos garante que todos estavam aquecidos, amadurecidos
e engajados em todas as atividades. Quanto validade
interna do experimento, ressaltamos que o amadurecimento
do grupo no piora seu desempenho, pois, de certa forma,
no a varivel que estamos avaliando.
O experimento tem como objetivo avaliar como o
preparo do ambiente para reunies pode trazer benefcios
para o Second Life. A grande questo verificar se vale
pena investir, preparando um ambiente de reunio no Second
Life, e se esse ambiente sempre levar os usurios mais
prximos s interaes face-a-face. Nossa expectativa com a
criao desse ambiente elaborado (SLMeetingRoom) que
as pessoas consigam atingir melhor seus objetivos.
1) Viso geral: O experimento caracterizou-se por um
conjunto de reunies de trabalho continuadas, com grupos
atuando em reunies, utilizando duas condies de trabalho
(SL sem o SLMeetingRoom e SL com o SLMeetingRoom),
a fim de avaliar o modelo proposto em atender a hiptese
que orienta essa pesquisa.
2) Participantes: Os participantes foram os mesmo do
estudo piloto (um total de onze) e foram designados para os
grupos atravs de sorteio. Novamente, os participantes no
receberam qualquer remunerao, mas a nota atuou como
um incentivo a participao.
3) Tarefa: A tarefa foi a realizao do projeto final da
disciplina, onde cada grupo escolheu o tema para o trabalho.
4) Durao: Os grupos foram acompanhados em um
perodo de 30 dias. Cada grupo realizou cinco reunies, com
durao mxima de uma hora. Apenas um dos grupos
ultrapassou dois minutos do tempo estipulado. A quantidade
de reunies foi de cinco reunies para cada grupo,
totalizando quinze reunies.
5) Configurao dos Grupos e Espaos de Trabalho:
Trs grupos foram formados atravs de sorteio (um grupo
com quatro participantes e dois grupos com trs
participantes). Assim como no estudo-piloto, o grupo que
utilizou o SLMeetingRoom atuou sem qualquer componente
de apoio ao processo de realizao das reunies, e o grupo
que utilizou o SLMeetingRoom atuou com o apoio dos dez
componentes do modelo.
6) Processo: Como os participantes foram os mesmos
do estudo piloto, no foi necessrio submet-los,
novamente, aos questionrios aplicados. Os participantes
foram aferidos somente pelo questionrio de ps-reunio.
7) Dados Coletados: As variveis coletadas para cada
critrio de avaliao foram as mesmas do estudo-piloto.
V. ANLISE E DISCUSSO
A. Estudo Piloto
1) Completude das tarefa
Por meio das medidas objetivas, foi possvel observar um
alto grau de completude das tarefas em todos os grupos.
Acreditamos que o alto grau de completude das tarefas
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 57 -
ocorre pelas vantagens na utilizao de agendas de reunio,
que, segundo Niederman e Volkema [22], altera a qualidade
dos resultados, a satisfao e, principalmente, o desperdcio
de tempo. Verificamos, tambm, que os questionrios
traduzem as mesmas porcentagens das medidas objetivas, ou
seja, o sentimento dos participantes em relao completude
das tarefas expresso no questionrio exatamente como
ocorre nas reunies. Apenas o grupo SL com o
SLMeetingRoom` ultrapassou o tempo estipulado de reunio
de uma hora, comprometendo a realizao de uma das
tarefas da agenda de reunio.
2) Participao
O turno de conversa compreende o momento em que o
participante comea a falar at o momento que ele termina
sua fala [41]. Assim, definimos o turno de conversa como o
tempo durante o qual um participante fala,
independentemente das interrupes mal sucedidas ou
sobreposies de fala de outro participante, similar ao
esquema usado por Sellen [42]. Um turno termina quando o
participante para de falar, seja por uma interrupo causada
por um participante, seja por causa de um perodo
significativo de silncio/pausa.
O grau de participao foi calculado pela razo entre o
tempo total de fala do participante (DTC
i
) e o total de turnos
de conversa do participante (NTC
i
). Atravs deste clculo, e
assumindo a distribuio gaussiana para o seu resultado, foi
possvel identificar os participantes que esto nas
extremidades da curva gaussiana, ou seja, quem fala em
poucos turnos estar muitos desvios-padro acima da mdia
e quem fala em muitos turnos estar muitos desvios-padro
abaixo da mdia. A curva gaussiana foi utilizada como
padro de comparao (baseline).
O grupo na condio Face-a-Face` Ioi o grupo com a
menor mdia de participao, pelo fato de ser o grupo que
utilizou mais turnos de conversa (total de 1222 turnos),
fazendo com que a mdia por turnos casse muito. Porm,
isto j era esperado, tendo em vista, que as mdias
udio/visuais so mais dinmicas, so transmitidas mais
rapidamente e em muitos turnos [40].
O grupo na condio SL com o SLMeetingRoom` o
grupo com reunies mais distante da curva do grupo Face-a-
Face`, ou seja, apresentou grau de participao na
extremidade da curva do grupo na condio Face-a-Face`
(acima de dois desvios). Acreditamos que isso ocorreu pelo
fato do grupo ter escolhido o canal de comunicao via texto,
ou seja, os turnos de conversa so maiores devido ao tempo
despendido na leitura, formulao e digitao do contedo.
Os grupos VideoconIerncia` e SL sem o
SLMeetingRoom` atuaram mais proximos a mdia da curva
do grupo na condio Face-a-Face`, em todas as reunies.
A partir dos questionrios de ps-reunio, foi possvel
verificar os reais sentimentos dos participantes em relao
sua participao durante as reunies. O grupo SL sem o
SLMeetingRoom` Ioi o que se sentiu mais participativo,
seguido pelos grupos Face-a-Face`, SL sem o
SLMeetingRoom`, e, Iinalmente, pelo grupo
VideoconIerncia`.
3) Esforo Cognitivo
Verificamos que o grupo Face-a-Face` Ioi o grupo que
realizou as reunies com menor esforo cognitivo. Isso
devido facilidade e naturalidade das interaes presenciais
[44]. Para este critrio de avaliao, espervamos que a
condio de udio e vdeo, proporcionada pela
VideoconIerncia`, Iizesse com que os dados se
aproximassem do grupo Face-a-Face`. Porm, o que
podemos verificar que os dados do grupo
VideoconIerncia` apresentam-se, estatisticamente,
diIerentes dos dados do grupo Face-a-Face`, ou seja, os
participantes do grupo VideoconIerncia` relataram que
tiveram dificuldades em realizar as reunies.
A transcrio das conversas do grupo VideoconIerncia`
mostrou que os participantes tiveram muitos problemas com
o alto consumo de banda de Internet, pois a conexo no era
um-para-um, mas sim muitos-para-muitos. Acreditamos que
esses problemas de conexo e banda de Internet foram os
fatores que aumentaram o esforo cognitivo para a realizao
das reunies.
4) Senso de Presena
As medidas objetivas de senso de presena esto
baseadas em [19], que props um mtodo de medio do
senso de presena com base nas caractersticas lingusticas
do dilogo, ou seja, se a pessoa fala de um espao remoto da
mesma maneira que ela fala sobre o espao local, podemos
inferir que ela se sente presente no espao remoto. O autor
em [19] realizou a anlise com pares (ajudante e trabalhador)
utilizando diferentes meios de comunicao. Para esta
pesquisa, a anlise lingstica ser aplicada para grupos
atuando em reunies em diferentes meios de comunicao, e,
posteriormente, ser realizada a comparao com os
resultados de [19].
Na tentativa de encontrar fatores que expliquem a
varincia dos resultados, as perguntas relacionadas ao senso
de presena do questionrio de ps-reunio foram
submetidas a uma Anlise Fatorial com Rotao Varimax. A
soluo revelou trs fatores que explicam 76% da varincia
dos dados. O Fator 1, denominado Objetos`, o qual indica
como os participantes se referiam aos objetos no espao de
trabalho, conseguiu explicar 31% da variabilidade dos dados;
o Fator 2, denominado Ambiente`, o qual informou sobre
como os participantes se referiam ao espao de trabalho,
conseguiu explicar 25% da variabilidade dos dados; e o Fator
3, denominado Grupo`, o qual informou como o participante
se sente em relao aos parceiros de trabalho, conseguiu
explicar 20% da variabilidade dos dados. Assim, o que os
participantes falam dos objetos, do ambiente e dos outros
participantes explica a diferena entre as respostas para cada
fator. A anlise fatorial varimax testa uma hiptese para
verificar se os trs fatores so suficientes para entender a
variao dos dados. O p-valor encontrado de 0,018, desta
forma, o modelo significativo (p < 0,05).
Para investigar a viabilidade da utilizao de variveis
lingusticas como um preditor da presena realizamos uma
regresso para prever presena com base das variveis
lingusticas. A regresso para o Fator 1 (objetos) explica
16% dos escores de presena (R2 = 0,1677; F[7,40] = 1,151;
p-valor = 0,352). A regresso para o Fator 2 (ambiente)
apresentou-se como um modelo significativo, representando
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 58 -
27% da varincia nos escores de presena (R2 = 0,2751;
F[7,40] = 2,169; p-valor = 0,058). E finalmente, para o Fator
3 (grupo) explica 9% dos escores de presena (R2 = 0,0976;
F[7,40] = 0,618; p-valor = 0,737).
Ao final, mensuramos a correlao entre as variveis
lingusticas e os escores de presena para cada fator
encontrado. Os escores de presena foram positivamente
correlacionados com o uso de pronomes nos` e
negativamente correlacionados com o uso do pronome
voc` e eu`. Isto consistente com a teoria de que uma
maior presena faz com que os participantes remotos sintam-
se como se estivessem juntos em um mesmo ambiente [19].
Os escores de presena tambm foram altamente
correlacionados com o uso da dixis locais e remotas,
sugerindo que quando os participantes se sentem presentes
em um ambiente remoto, eles falam sobre isso da mesma
maneira que eles falam sobre o ambiente fsico.
A correlao realizada entre as variveis lingusticas e os
escores de presena mostrou que os fatores se
complementam; o que no foi detectado por um fator foi
identificado por outro. Apesar das correlaes encontradas
no serem significativas, ressaltamos novamente que Kramer
[19] em sua anlise possua uma amostra de N=148.
B. Experimento
1) Completude das Tarefas
Assim como no estudo piloto, foi possvel observar um
alto grau de completude das tarefas em todos os grupos.
Todos os grupos conseguiram realizar a tarefa proposta. Fato
este que confirma os achados de Niederman e Volkema [22],
que afirmam que a utilizao de agendas de reunio altera a
qualidade dos resultados, a satisfao, e principalmente, o
desperdicio de tempo. Apenas o grupo SL sem o
SLMeetingRoom` ultrapassou o tempo estipulado de reunio
de uma hora, comprometendo a realizao das tarefas da
agenda em duas reunies.
2) Grau de Participao
O grau de participao foi calculado da mesma forma
como no estudo piloto, ou seja, pela razo entre o tempo de
fala de cada participante (DTC
i
) e o nmero de turnos de
conversa (NTC
i
). As curvas gaussianas tericas baseadas na
mdia e desvio-padro de cada reunio foram construdas e
utilizadas como ferramentas para o entendimento das
diferenas entre as reunies e grupos.
O grupo com maior grau de participao foi o grupo 3 na
condio SL com o SLMeetingRoom`, porm Ioi o grupo
com maior desvio padro. Seguido pelo grupo 2, na condio
SL sem o SLMeetingRoom`, com o menor desvio padro e,
finalmente, pelo grupo 1 na condio SL com o
SLMeetingRoom`.
Atravs das medidas subjetivas, aferidas pelo
questionrio de ps-reunio, foi possvel verificar os
sentimentos dos participantes em relao a sua participao
durante as reunies. Verificamos que os dois grupos na
condio SL com o SLMeetingRoom` Ioram os que se
sentiram mais participativos e o grupo SL sem o
SLMeetingRoom` Ioi o que se sentiu menos participativo.
A mtrica de grau de participao, baseada na
participao mdia, pode no ser boa, pois, de certa forma,
pode esconder participaes valiosas, no conseguindo
refletir, por exemplo, quando um participante fala pouco (em
momentos especficos da reunio), mas tem uma
participao decisiva durante o processo de discusso.
3) Esforo Cognitivo
Verificamos, atravs dos questionrios, os grupos que
utilizaram o modelo SLMeetingRoom apresentam menor
esforo cognitivo para realizar as reunies. Isso refora nossa
hiptese de pesquisa de que os grupos que utilizassem o
Second Life aliado ao modelo SLMeetingRoom
apresentariam menor esforo cognitivo para realizar as
reunies.
4) Senso de Presena
Como no estudo piloto, as perguntas relacionadas ao
senso de presena do questionrio de ps-reunio tambm
foram submetidas a uma anlise fatorial com rotao
varimax. Foi encontrado apenas um fator que explica 45% da
variabilidade dos dados. Aps utilizar a anlise fatorial com
rotao varimax, testamos a hiptese de que apenas um fator
suficiente para explicar a variao dos dados. O p-valor
encontrado de 2,63e-06, desta forma, o modelo
significativo (p < 0,05).
Assim como no estudo piloto, com o intuito de investigar
a viabilidade da utilizao de variveis lingusticas como um
preditor da presena, realizamos uma regresso para prever
presena com base das variveis lingusticas. O modelo de
regresso para o fator foi significativo (p-valor < 0,05),
explicando 30% da variabilidade dos escores de presena
(R2 = 0,307; F[7,47] = 2,986; p-valor = 0,011).
Ao compararmos nossos resultados aos resultados do
estudo piloto e aos resultados obtidos por Kramer [19],
verificamos que nossos resultados so promissores.
Conseguimos explicar 30% da variabilidade dos escores de
presena com um N=55, ou seja, aumentamos o tamanho da
nossa amostra e obtivemos um resultado 3% maior. Em
resumo, nossos resultados se aproximaram dos resultados
obtidos por Kramer [19], que possua uma amostra de N =
148 e conseguiu representar 33% da varincia dos escores de
presena.
Finalmente, mensuramos a correlao entre as variveis
lingusticas e os escores de presena para o fator encontrado.
Os escores de presena foram positivamente correlacionados,
com o uso de pronomes nos` e, negativamente
correlacionados, com o uso do pronome voc` e eu`. Isto ,
consistente com a teoria de que uma maior presena faz com
que os participantes remotos sintam como se estivessem
juntos em um nico ambiente [19]. Os escores de presena
tambm foram altamente correlacionados com o uso da
dixis locais e remotas, sugerindo que, quando os
participantes se sentem presentes em um ambiente remoto,
eles falam sobre ele da mesma maneira que eles falam sobre
o seu ambiente fsico.
As correlaes no foram significativas em nenhum dos
experimentos, acreditamos isso pode ter ocorrido devido aos
vcios de linguagem, como por exemplo, momentos onde o
participante usa o pronome 'voc e na verdade deveria usar
o pronome 'nos.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 59 -
C. Teste de Hipteses
O teste de hipteses foi utilizado como mecanismo para
encontrar evidncia estatstica de diferenas entre os grupos.
Para comparao entre os grupos, foi utilizado o teste de
Jonckheere-Terpstra [11]. O teste utilizado para problemas
com mais de duas amostras, a hiptese alternativa pode ser
expressa como:
1
_
2
_ ... _
n,
ou
1
_
2
_ ... _
n,
, com,
pelo menos, uma das desigualdades, onde
i
denota o efeito
do i-simo tratamento (grupo experimental). Como critrio
de deciso, foi adotado o nvel de significncia de 5%.
Aps a aplicao do teste de Jonckheere-Terpstra
obtivemos um p-valor para cada critrio de avaliao.
Posteriormente verificamos se a significncia do resultado
obtido por p-valor est abaixo ou acima de 5%. Se o p-valor
estiver abaixo de 0,05 no h evidncias a favor de H
1
, ou
seja, aceitamos H
0
. Caso contrrio, rejeitamos H
0
.
Para o critrio de completude das tarefas, os resultados
no apresentaram variao, no sendo necessrio realizar o
teste de hipteses para essa varivel.
1) Estudo Piloto
Cada grupo realizou as reunies do projeto considerando
uma das quatro condies de trabalho (SL com o
SLMeetingRoom`, SL sem o SLMeetingRoom`,
VideoconIerncia` e Face-a-Face`). Para facilitar os
procedimentos de comparao, nos referimos aos grupos por
G1, G2, G3 e G4, respectivamente. Os resultados do Teste
de Hipteses podem ser visto na Tabela 2.
TABELA 2: TESTE DE HIPTESES COM OS DADOS DO ESTUDO PILOTO.
ESTUDO PILOTO
Critrio de
Avaliao
H1 JT: p-valor Deciso
Grau de
Participao
G2 _ G3 _ G1 _ G4, ou
G3 _ G2 _ G1 _ G4
0,870
Aceitamos
H0
Esforo
Cognitivo
G2 _ G3 _ G1 _ G4, ou
G3 _ G2 _ G1 _ G4
0,007
Rejeitamos
H0
Senso de
Presena
G2 _ G3 _ G1 _ G4, ou
G3 _ G2 _ G1 _ G4
Fator1 = 1,68E-06
Rejeitamos
H0
Fator2 = 0,012
Fator3 = 0,025
2) Experimento
Cada grupo realizou as reunies do projeto considerando
uma das duas condies de trabalho (com e sem o
SLMeetingRoom). Para facilitar os procedimentos de
comparao, nos referimos aos grupos por G1 e G3 (SL
com o SLMeetingRoom), e G2 (SL sem o
SLMeetingRoom). Os resultados do Teste de Hipteses
podem ser visto na Tabela 3.
TABELA 3: TESTE DE HIPTESES COM OS DADOS DO EXPERIMENTO.
EXPERIMENTO
Critrio de
Avaliao
H1 JT: p-valor Deciso
Grau de
Participao
G2 _ G3 _ G1, ou
G2 _ G1 _ G3
0,794 Aceitamos H0
Esforo
Cognitivo
G2 _ G3 _ G1, ou
G2 _ G1 _ G3
0,017 Rejeitamos H0
Senso de
Presena
G2 _ G3 _ G1, ou
G2 _ G1 _ G3
0,015 Rejeitamos H0
VI. CONCLUSO
Este trabalho aborda o problema da utilizao do Second
Life como ambiente para a realizao de reunies, tendo em
vista que o Second Life no foi criado com caractersticas de
EMS. A fim de resolver nosso problema de pesquisa,
propomos a criao de um modelo de ambiente para suporte
a atividades bsicas de reunies de trabalho, o modelo
SLMeetingRoom, que composto por dez componentes
essenciais que apoiam atividades como comunicao,
coordenao, cooperao e percepo.
Levantamos a hiptese de que a utilizao do
SLMeetingRoom para suporte a reunies de trabalho
possibilita resultados mais prximos das interaes face-a-
face. Dessa forma, realizamos um estudo experimental
comparativo (estudo piloto e experimento) e atravs da
anlise dos dados coletados, conclumos que o modelo
SLMeetingRoom promissor para os critrios de esforo
cognitivo e senso de presena.
Em resumo, esta pesquisa fornece bons indicativos para a
utilizao do ambiente Second Life como uma ferramenta
EMS, que auxilia os grupos no estabelecimento de acordos e
metas, tornando as reunies colaborativas mais eficientes.
O SL possui caractersticas peculiares dos ambientes
virtuais 3D, que oferecem vantagem em relao a outras
plataformas, como alta imerso, alto senso de presena no
grupo e ambiente, facilidade de contextualizar um ambiente
de reunio com os participantes sentados mesa, facilidade
na comunicao sncrona (textual, oral e gestual), alta
percepo das atividades dos participantes de um grupo,
entre outras. Conclumos, ento, que o SL uma boa
ferramenta para a realizao de reunies remotas sncronas e
coexiste com a videoconferncia, EMS, audioconferncia e
compartilhamento de telas.
REFERNCIAS
[1] Olson, J., Olson, G., Storrsten, M., and Carter, M. Groupwork close
up: a comparison of the group design process with and without a
simple group editor. ACM Trans. Inf. Syst. 11, 4 (Oct. 1993).
[2] De Lucia, A., Francese, R., Passero, I. and Tortora, G. SLMeeting:
supporting collaborative work in Second Life. In Proceedings of the
Working Conference on Advanced Visual interfaces (Napoli, Italy,
May 28 - 30, 2008). AVI '08. ACM, NY, 301-304.
[3] Nunamaker, J. Dennis, A., Valacich, J., Vogel, D. and George, J.
Eletronic Meeting System to Support Group Work. Comunications of
the ACM. Jul, 1991, 34(7), pp 40-61.
[4] Olivier, H. and Pinkwart, N. (2007). Computer Supported
Cooperative Work In The Second Life? Position paper presented at
the Track on Business in Second Life at the 3rd International Second
Life Community Convention. Chicago (IL).
[5] Harry, D. and Donath, J. 2008. Information spaces -- building
meeting rooms in virtual environments. In CHI '08 Extended
Abstracts on Human Factors in Computing Systems (Florence, Italy,
April 05 - 10, 2008). CHI '08. ACM, NY, 3741-3746.
[6] Second Life. Disponvel em <www.secondlife.com>. Acessado em:
Julho de 2010.
[7] Santoro, F., Borges, M. e Santos, N. Um Framework para Estudo de
Ambientes de Suporte Aprendizagem Cooperativa. Revista
Brasileira de Informtica na Educao Nmero 4 1999.
[8] Rovere, A. e Zago, G. Uma Proposta do Uso do Second Life como
Ferramenta Educacional. Intercom Sociedade Brasileira de Estudos
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 60 -
Interdisciplinares da Comunicao XXX Congresso Brasileiro de
Cincias da Comunicao, Santos. 29/agosto a 2/setembro de 2007.
[9] Bessire, K., Ellis, J. B., and Kellogg, W. A. 2009. Acquiring a
professional "second life": problems and prospects for the use of
virtual worlds in business. In Proceedings of the 27th international
Conference Extended Abstracts on Human Factors in Computing
Systems (Boston, MA, USA, April 04 - 09, 2009). CHI EA '09.
ACM, New York, NY, 2883-2898.
[10] Marczyk, G., DeMatteo, D., & Festinger, D. (2005). Essentials of
research design and methodology. NY: John Wiley & Sons.
[11] Hollander, M. and Wolfe, D. A. (1973). Nonparametric Statistical
Methods. Wiley, New York.
[12] Ellis, C. A.; Gibbs, S. J.; Rein, G. L. Groupware: some issues and
experiences. Comunications of the ACM. 34(1). Vo1.34, No.1.
January, 1991.
[13] Dumas, J.S. and J.C. Redish (1999) A Practical Guide to Usability
Testing. Exeter, UK: Intellect Books .
[14] http://www.proac.uff.br/cep
[15] http://www.unigranrio.br/comite_etica
[16] Basta-Forte, M. and Yen, C. 2007. Encouraging contribution to
shared sketches in brainstorming meetings. In CHI '07 extended
abstracts on Human factors in computing systems (CHI '07). ACM,
NY, USA, 2267-2272.
[17] DiMicco, J., Pandolfo, A. and Bender, W. 2004. Influencing group
participation with a shared display. In Proceedings of the 2004 ACM
conference on Computer supported cooperative work (CSCW '04).
ACM, New York, NY, USA, 614-623.
[18] NASA-TLX MANUAL. NASA Ames Research, Califrnia, EUA,
1986.
[19] Kramer, A. D., Oh, L. M., and Fussell, S. R. 2006. Using linguistic
features to measure presence in computer-mediated communication.
In Proceedings of the SIGCHI Conference on Human Factors in
Computing Systems (Montral, Qubec, Canada, April 22 - 27,
2006). R. Grinter, T. Rodden, P. Aoki, E. Cutrell, R. Jeffries, and G.
Olson, Eds. CHI '06. ACM, New York, NY, 913-916.
[20] Usoh, M., Catena, E., Arman, S., & Slater, M. (2000). Using presence
questionnaires in reality. Presence: Teleoperators and Virtual
Environments, 9(5), 497-503.
[21] Witmer, B. G., & Singer, M. J. (1998). Measuring presence in virtual
environments: A presence questionnaire. Presence: Teleoperators and
Virtual Environments, 7(3), 225240.
[22] Niederman, F. and Volkema, R. 1996. Influence of agenda creation
and use on meeting activities and outcomes: report on initial results.
In Proceedings of the 1996 ACM SIGCPR/SIGMIS Conference on
Computer Personnel Research (Denver, Colorado, United States,
April 11 - 13, 1996). SIGCPR '96. ACM, New York, NY, 192-205.
[23] George, J., Valacich, J. and Nunamaker, J. 1990. The organizational
implementation of an electronic meeting system: an analysis of the
innovation process. In Proceedings of the SIGCHI conference on
Human factors in computing systems: Empowering people (CHI '90),
ACM, New York, NY, USA, 361-368.
[24] Beaudouin-Lafon, M. Computer Supported Co-operative Work.
England : John Wiley and Sons (1999).
[25] Olson, J. S., Covi, L., Rocco, E., Miller, W. J., and Allie, P. 1998. A
room of your own: what would it take to help remote groups work as
well as collocated groups? In CHI 98 Conference Summary on
Human Factors in Computing Systems (Los Angeles, California,
United States, April, 1998). CHI '98. ACM, New York, NY, 279-280.
[26] Dickey-Kurdziolek, M., Schaefer, M., Tatar, D., and Renga, I. P.
2010. Lessons from thoughtswap-ing: increasing participants'
coordinative agency in facilitated discussions. In Proceedings of the
2010 ACM Conference on Computer Supported Cooperative Work
(Savannah, Georgia, USA, February 06-10, 2010). CSCW '10. ACM,
New York, NY, 81-90.
[27] Bly, S., Harrison, S. and Irwin, S. Media spaces: bringing people
together in a video, audio, and computing 185 environment.
Communications of the ACM, 36(1), (1993), 28-46.
[28] Nguyen, D. T. and Canny, J. 2007. Multiview: improving trust in
group video conferencing through spatial faithfulness. In Proceedings
of the SIGCHI Conference on Human Factors in Computing Systems
(San Jose, California, USA, April 28 - May 03, 2007). CHI '07.
ACM, New York, NY, 1465-1474.
[29] Yamashita, N., Hirata, K., Aoyagi, S., Kuzuoka, H., and Harada, Y.
2008. Impact of seating positions on group video communication. In
Proceedings of the 2008 ACM Conference on Computer Supported
Cooperative Work (San Diego, CA, USA, November 08 - 12, 2008).
CSCW '08. ACM, NY, 177-186.
[30] Bietz, M. J. 2008. Effects of communication media on the
interpretation of critical feedback. In Proceedings of the 2008 ACM
Conference on Computer Supported Cooperative Work (San Diego,
CA, USA, November 08 - 12, 2008). CSCW '08. ACM, NY, 467-476.
[31] Cherubini, M., Nussli, M., and Dillenbourg, P. 2008. Dixis and gaze
in collaborative work at a distance (over a shared map): a
computational model to detect misunderstandings. In Proceedings of
the 2008 Symposium on Eye Tracking Research & Applications
(Savannah, Georgia, March 26-28, 2008). ETRA '08. ACM, New
York, NY, 173-180.
[32] Townsend, A. M., DeMarie, S. M. & Hendrickson, A. R. 1996. Are
you ready for virtual teams? HR Magazine, 41 (9): 122-126; Pape, W.
R. 1997. Group insurance: Virtual teams can quickly gather the
knowledge of even far-flung staff. Inc. June 15: 29-30.
[33] Noll, A.M. (1976). Teleconferencing Communications Activities.
IEEE Communications Society, November, pp.8 14.
[34] Tyson, J. (1987). Video teleconferencing is cutting costa while
increasing the productivity of many companies. Communication8
New8 24(g).
[35] Pervan, G., Lewis, L. F., & Bajwa, D. S. (2004). Adoption and use of
electronic meeting systems in large Australian and New Zealand
organizations. Group Decision and Negotiation: on GDN 2002 Papers
(Guest Editors: Mohammed Quaddus and Des, 13(5), 403-414.
[36] Brown, B. and Bell, M. 2004. CSCW at play: 'there' as a collaborative
virtual environment. In Proceedings of the 2004 ACM Conference on
Computer Supported Cooperative Work (Chicago, Illinois, USA,
November 06 - 10, 2004). CSCW '04. ACM, New York, 350-359.
[37] Active World. Disponvel em <www.activeworlds.com>. Acessado
em: Outubro de 2009.
[38] Second Life. Disponvel em <www.secondlife.com>. Acessado em:
Julho de 2010.
[39] Rymaszewski, W., Au, W., Wallace, M., Winters, C., Ondrejka, C.,
Batstone-Cunningham, B. Second Life O Guia Oficial. Traduo de
Abner Dmitruk. Rio de Janeiro. Editora Ediouro, 2007.
[40] Kirk, D., Rodden, T. and Fraser, D. 2007. Turn it this way: grounding
collaborative action with remote gestures. In Proceedings of the
SIGCHI conference on Human factors in computing systems (CHI
'07). ACM, New York, NY, USA, 1039-1048.
[41] T. Kim, A. Chang, L. Holland, and A. Pentland. Meeting mediator:
enhancing group collaboration with sociometric feedback. In Proc.
ACM `08: ConIerence on CSCW, pages 457466, 2008.
[42] Sellen, A. J. (1995). Remote conversations: the effects of mediating
talk with technology. Human-Computer Interaction, 10. 401-444.
[43] Grudin, J. Computer-Supported Cooperative Work: History and
focus. IEEE Computer, 27(5) pp.19-26, 1994.
[44] Qiu, L., Tay, W. and Wu, J. 2009. The impact of virtual teamwork on
real-world collaboration. In Proceedings of the International
Conference on Advances in Computer Enterntainment Technology
(ACE '09). ACM, New York, NY, USA, 44-51.
[45] Aurlio Buarque de Holanda Ferreira, Dicionrio Aurlio Eletrnico.
Sculo XXI, 1999.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 61 -
xAgent: Arquitetura para a Colaborao em Ambientes
Cross-Reality
Dbora Cardador
PUC-Rio
Rua Marqus de So Vicente, 225, Gvea
Rio de Janeiro, RJ - Brasil
(5521) 35251500 ext 4553, 22451-900
dcosta@ inf.puc-rio.br
Hugo Fuks
PUC-Rio
Rua Marqus de So Vicente, 225, Gvea
Rio de Janeiro, RJ - Brasil
(5521) 35251500 ext 4304, 22451-900
hugo@ inf.puc-rio.br
Katia Vega
PUC-Rio
Rua Marqus de So Vicente, 225, Gvea
Rio de Janeiro, RJ - Brasil
(5521) 35251500 ext 4553, 22451-900
kvega@ inf.puc-rio.br
Carlos Lucena
PUC-Rio
Rua Marqus de So Vicente, 225, Gvea
Rio de Janeiro, RJ - Brasil
(5521) 2540-6915 ext 103, 22451-900
lucena@ inf.puc-rio.br

ABSTRACT
This paper introduces xAgent, an architecture for developing
collaborative cross-reality environments. xAgent was
developed based on multi-agent systems in which agents
enable the message exchange between virtual and real worlds.
xGroupware and Ubilife are cross-reality prototypes that
illustrates how the xAgent architecture was implemented.
RESUMO
Este artigo apresentada a arquitetura xAgent, cuja finalidade
o desenvolvimento de ambientes cross-reality colaborativos.
xAgent se baseia em um sistema multiagentes no qual a
comunicao entre os agentes se restringe a ocorrncia de
eventos no mundo real e virtual. So apresentados dois
prottipos de aplicaes, xGroupware e Ubilife, que ilustram
a implementao da arquitetura proposta.
Palavras chave
Colaboracao, Cross-Reality, Sistema Multiagentes.

1. INTRODUCTION
Mundos virtuais so ambientes predominantemente sociais,
amplamente utilizados para interao entre seus usurios. Sua
natureza imersiva motiva a participao e o senso de
responsabilidade conjunto [1], e por propiciarem a troca de
informaes e idias e a soluo de problemas em grupo, so
utilizados como espaos colaborativos em diferentes
contextos como educacional, trabalho em equipe, comercial e
jogos.
A combinao do mundo real e virtual enriquece ambos os
mundos, tendo em vista a capacidade que tm de se refletirem,
influenciarem e fundirem mutuamente [2]. Uma forma de se
obter esta combinao a criao de ambientes cross-reality
[3], que usam redes de sensores e atuadores. Estes ambientes
possibilitam a comunicao bidirecional entre o mundo fsico
e o virtual, criando um ambiente sensvel a ambos os
contextos e capaz de reagir a eventos e atuar de forma pr-
ativa. O ambiente resultante rico em possibilidades de
interao e, consequentemente, propcio colaborao, pois
aos recursos inerentes a cada mundo so agregados aqueles
resultantes de sua combinao, como a manipulao
simultnea de objetos reais e virtuais e a comunicao entre
indivduos no ambiente fsico com avatares do mundo virtual.
Este artigo apresenta a arquitetura xAgent, que visa
implementao de aplicaes que envolvam a colaborao em
ambientes cross-reality. No ambiente fsico, interfaces
tangveis e wearable computers, que contm sensores,
identificam eventos significativos e os propagam em tempo
real pelo sistema por meio de uma infraestrutura de
transmisso de mensagens que integra diferentes tecnologias.
Da mesma forma, eventos detectados por objetos do mundo
virtual so propagados para o mundo real. xAgent prev a
integrao com sistemas externos de modo a possibilitar o
acrscimo de recursos ao ambiente cross-reality, como, por
exemplo, servios web e mecanismos de inteligncia artificial.
Tendo em vista que se deseja criar um ambiente cross-reality
que possibilita a comunicao entre os mundos real e virtual e
capaz de reagir a eventos e atuar de forma pr-ativa, optou-
se por uma arquitetura baseada em um Sistema Multiagentes
(SMA). Agentes so entidades de hardware ou software
caracterizadas pelos atributos de: (a) reatividade - percebe o
ambiente e responde s mudanas de maneira oportuna; (b)
autonomia - opera sem interveno externa e tem controle
sobre suas aes e estado interno; (c) habilidade social -
interage com outros agentes via algum tipo de linguagem de
comunicao; e (d) pr-atividade - toma a iniciativa e exibe
comportamentos baseados em objetivos [4] Na arquitetura
proposta, cada um dos elementos do sistema um agente com
objetivos e responsabilidades bem definidos, que se comunica
com outros agentes sobre os eventos ocorridos no sistema.
Na prxima seo, so comentados os trabalhos relacionados.
A Seo III descreve a arquitetura de xAgent. A
implementao de dois prottipos baseados em xAgent so
detalhados na Seo IV. Concluso e trabalhos futuros so
apresentados na Seo V.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 62 -
2. TRABALHOS RELACIONADOS
Aplicaes baseadas em agentes que integram os mundos real
e virtual so categorizadas de diversas formas. O conceito de
Mixed Reality Agents (MiRA) [4], introduzido por Holz, visa
a criao de uma taxonomia para projetos desenvolvidos neste
escopo e apresenta o estado da arte neste tipo de pesquisa.
Holz apresenta cerca de 25 projetos, classificados usando os
eixos agncia (fraca vs forte), presena corporal (fsica vs
virtual) e capacidade de interao (fsica vs virtual). Por
exemplo, os projetos Virtual Anatomy Assistant e Virtual
Gunslinger, que tem objetivos diferentes (ensinar a
localizao dos orgos e storytelling, respectivamente) so
classificados como de representao virtualmente forte. Os
projetos tambm so desenvolvidos com estratgias de
implementao diferentes, como o caso do Chameleons [6],
um dos pioneiros em desenvolver agentes que migram entre o
mundo virtual e real.
Com o objetivo de desenvolver diferentes aplicaes com
agentes em projetos que misturam o real e o virtual, foram
desenvolvidas arquiteturas para a gerao de ambientes
especficos. Tal o caso de UbiAgent [7], um framework de
agentes Belief-Desire-Intentions (BDI) representados em
objetos reais e virtuais e operados por interfaces de realidade
aumentada. A Figura 1 mostra o Virtual Tour Guide, uma
aplicao desenvolvida com o framework UbiAgent, onde um
agente virtual serve como guia para visitas em um prdio. No
caso de UbiAgent, cada representao virtual encapsulada
em s um agente. Outra proposta de framework com sistemas
multiagentes BDI o NeXuS [8], que faz uso de agentes para
controlar todos os aspetos do ambiente.


Figura 1. Usurio utilizando o Virtual Tour Guide [7].

Arquiteturas para desenvolvimento de ambientes cross-reality
no foram desenvolvidas unicamente usando agentes.
Twinspace [9] uma infraestrutura para a prototipao de
ambientes cross-reality de trabalho em grupo. Esta
infraestrutura utiliza uma ontologia, baseada em SOUPA [10],
para mapear as entidades reais e virtuais. Alm desta
ontologia, Twinspace utiliza um Context/Mapping Engine
para a configurao do ambiente e das regras de mapeamento.
O inSpace para brainstorming e apresentaes, e o jogo
colaborativo Or de l`Acadie foram protipados usando a
arquitetura Twinspace. DejaVu [11] outra arquitetura para o
desenvolvimento de ambientes cross-reality. Esta arquitetura
emprega sistemas de processamento de eventos complexos,
estendendo as funcionalidades do sistema gerenciador da base
de dados relacional de modo a detectar eventos com alto grau
de valor semntico para a aplicao, como um incndio no
prdio ou a entrada de um ladro na biblioteca. SmartRFLib
(desenvolvida usando DejaVu) uma aplicao de
gerenciamento de emprstimo de livros de uma biblioteca real
que possibilita a transmisso de dados para uma biblioteca
virtual usando um leitor RFID. A Figura 2 mostra a
arquitetura em trs camadas de SmartRFLib.

3. XAGENT
xAgent uma arquitetura que possibilita o desenvolvimento
de distintas aplicaes em ambientes cross-reality, se
adequando a diferentes contextos que envolvem a colaborao
entre o mundo real e o virtual. Nesta arquitetura, a interao
dos objetos (agentes) no necessariamente representam um
reflexo de um objeto de um mundo frente outro. Esta
interao realizada diretamente com os usurios e objetos do
mundo em que se encontram e alm disso, enviam e recebem
informaes sobre os eventos que ocorrem com objetos do
outro mundo.
No mundo real, uma rede de sensores e atuadores detecta
eventos e reage por meio de objetos fsicos, como interfaces
tangveis, para representao e controle das informaes
digitais, e dispositivos wearable, que possibilitam a
colaborao nos limites do espao pessoal do usurio. No
mundo virtual por sua vez, objetos 3D (que tambm so
agentes) so modelados e seus comportamentos
implementados. Opcionalmente, sistemas externos so
acoplados, adicionando-se recursos e funcionalidades
aplicao.
xAgent usa um SMA como modelagem computacional. Nesta
abordagem, uma arquitetura modelada como uma coleo de
entidades, denominadas agentes. Dado que um dos atributos
fundamentais dos agentes a habilidade social, a
comunicao e interao entre eles realizada por meio da
troca de mensagens, foco principal da arquitetura proposta. A
Figura 3 apresenta um resumo da arquitetura xAgent em
termos de seus agentes.


Figura 2. SmartRFLib - Arquitetura baseada em DejaVu
para ambientes cross-reality [11].


VIII Simpsio Brasileiro de Sistemas Colaborativos
- 63 -
O suporte interao que ocorre entre o mundo real e o virtual
realizado entre o Mensageiro e os Comunicadores que, ao trocarem
mensagens entre si, difundem a ocorrncia dos eventos no sistema.
O Mensageiro recebe mensagens de diferentes origens, registra os
eventos correspondentes na base de dados do sistema e redistribui
as mensagens aos agentes a que se destinam, de acordo com o tipo
de evento. Para isto, utiliza os Comunicadores, tambm agentes,
que atuam como pontes entre o Mensageiro e os agentes contidos
nos objetos do mundo real e virtual. A troca de mensagens pelos
agentes segue uma mesma estrutura de modo que eles possam
interpretar a mensagem independentemente da plataforma usada ou
do mundo em que se encontram.

4. AMBIENTES COLABORATIVOS
USANDO XAGENT
A seguir, so apresentadas dois ambientes colaborativos que
implementam a arquitura xAgent: xGroupware [12] que visa dar
suporte ao planejamento e realizao de reunies no contexto de
trabalho em grupo a distncia, e Ubilife, que tem por finalidade
auxiliar no cuidado de idosos.
Nas aplicaes apresentadas, o Mensageiro foi implementado no
framework Spring com a linguagem Java. , usando sockets para a
interao com os Comunicadores do Mundo Real, tambm
implementados em Java. Alm da troca de mensagens com o
Mensageiro, os Comunicadores do Mundo Real se comunicam
com objetos do mundo real por meio de uma rede wireless que
utiliza mdulos XBees [13] para enviar e receber mensagens. Os
objetos do mundo real foram implementados usando tecnologia
Arduino [14].
Os Comunicadores e demais objetos do Mundo Virtual foram
implementados na plataforma Second Life usando a linguagem de
programao Linden Script Language (LSL). A troca de
mensagens entre os objetos virtuais realizada via os canais de
comunicao do LSL. A troca de mensagens com objetos externos
s possvel com o uso do protocolo HTTP, motivo pelo qual um
servidor web foi implementado no Mensageiro.
4.1. xGroupware
Ambientes colaborativos 3D so utilizados como ferramenta
meetingware para grupos de trabalho a distncia, dentre outros
motivos, por promover uma forte sensao de presena e
engajamento de seus participantes [15]. Estes ambientes propiciam
a comunicao por meio de texto, voz, gestos e expresses faciais,
e tambm o uso de outros meios virtuais, como o correio
eletrnico. No entanto, no h comunicao com o mundo real
[16].
xGroupware um ambiente cross-reality que possibilita a
comunicao entre os mundos real e virtual por meio da troca de
mensagens entre os agentes do sistema, que informam sobre a
ocorrncia de eventos tais como entrada e sada de usurios,
convites, solicitao de confirmao de presena e cancelamento
de reunio. Esta comunicao ocorre por meio de um bracelete
utilizado pelo participante no mundo real, que contm sensores e
atuadores. No ambiente 3D so utilizados para comunicao
objetos virtuais como painis e Head-up Displays (HUDs), como
ilustrado na Figura 4.

Figura 4. O Bracelete, o Painel de Reunies e o HUD utilizados
para comunicao entre o mundo real e virtual.

Figura 3. xAgent: arquitetura geral.
Mundo Real Mundo Virtual
...
.
.
.
.
.
.
.
.
.
.
.
.
Mensageiro
Comunicador
Comunicador
Comunicador
Comunicador
Objeto Real
Objeto Real
.
.
.
Objeto Real
Objeto Real
Comunicador Comunicador
Objeto Virtual
Objeto Virtual
.
.
.
Objeto Virtual
Objeto Virtual
Sistema
Externo
Sistema
Externo
Base de Dados
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 64 -
As reunies ocorrem na Sala de Reunies virtual, no
ambiente compartilhado, e so agendadas e confirmadas pelo
Coordenador de Reunies, um dos agentes do sistema, com base
nas disponibilidades das agendas individuais dos participantes. O
Coordenador de Reunies solicita a confirmao de presena aos
participantes por meio do bracelete e do HUD e com base no
retorno dado pelos participantes, confirma ou cancela sua
realizao. No caso de cancelamento, o Coordenador reagenda a
reunio e divulga a nova data e horrio para todos os participantes.
O Coordenador de Reunies um agente implementado na
plataforma Jade. Nesta aplicao, o comunicador que atua entre o
Mensageiro e o Coordenador de Reunies foi implementado
tambm em Jade, utilizando o padro FIPA para comunicao em
SMAs [17]. A Figura5 apresenta os agentes envolvidos na
aplicao xGroupware, baseada na arquitetura xAgent.
4.2. Ubilife
Ambient Assisted Living (ALL) [18] utiliza tecnologias diversas
com o intuito de integrar ao dia-a-dia do usurio servios que
propriciem a melhoria de sua qualidade de vida. Em particular,
ALLs auxiliam na manuteno da sade e na segurana de
pacientes em recuperao, doentes crnicos e idosos, provendo
servios como monitoramento continuado e deteco de situaes
de emergncia [19].
Ubilife um ALL colaborativo que visa auxiliar parentes, amigos
ou profissionais da rea mdica responsveis pela assitcia a
idosos que vivem sozinhos em suas residncias, por meio do
monitoramento constante do idoso e de servios como lembretes e
alarmes. Com a utilizao de sensores, o sistema possibilita a
coleta de dados sobre o usurio e o ambiente, e a obteno de
informaes sobre a correlao entre eles, como a localizao do
usurio e os objetos com que interage. Alm do uso de sensores e
atuadores, possvel incluir nas vestimentas, nos objetos e no
prprio espao fsico recursos de processamento e comunicao
que tornam o ambiente mais responsivo e capaz de prover servios
de forma autnoma e pr-ativa.
O espao fsico monitorado reproduzido no ambiente 3D,
contendo objetos virtuais que representam objetos do mundo real.
Para representar os indivduos monitorados, so utilizados Non-
Player Characters (NPCs), que, diferentemente de um avatar
controlado por um usurio, apresentam comportamentos pr-
definidos em scripts (Figura 6). Desta forma, criado um
'espelho que simula eventos especiIicos que ocorrem ou
ocorreram no mundo real, como a movimentao do idoso pela
residncia, sua interao com alguns objetos e atividades
especficas em que esteja envolvido. Este espao virtual possibilita
o acompanhamento do idoso nas atividades de interesse de uma
forma no invasiva, preservando a privacidade do indivduo
monitorado.

Figura 6. NPC representando o indivduo monitorado no
ambiente 3D.

Figura 5. xGroupware em funo de seus agentes.
Mundo Real
Mundo Virtual
Dispositivos
Wearable
Computador
Porttil
SecondLife
Mensageiro
Base de
Dados
Comunicador
FIPA
Coordenador de
5HXQL}HV
Comunicador da
6DODGH5HXQL}HV
Virtual
Sensor de
SUHVHQoD
HUD 1
HUD 2
HUD 3
Painel de
5HXQL}HV
Comunicador
Ultra
Bracelete 1
Bracelete 2
Bracelete 3
Servidor
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 65 -
Uma das funcionalidades do Ubilife o monitoramento da auto-
administrao de medicamentos em forma de comprimido pelo
idoso atravs do agente Porta Comprimidos, que monitora os
horrios de medicao e informa ao usurio que comprimido deve
ser tomado num determinado momento atravs de mensagens pr-
gravadas e avisos luminosos. Por meio de sensores este agente
identifica se o usurio tomou o remdio no horrio indicado.
Seno, novamente utilizada uma mensagem pr-gravada para
orient-lo sobre a administrao do medicamento. Aps alguns
minutos, caso o idoso no tenha ainda tomado o medicamento,
propagada pelo sistema uma mensagem de alerta, que recebida
na residncia do responsvel pelo acompanhamento do idoso. O
agente Sentinela, que emite avisos luminosos, indica ao
responsvel que h uma situao que requer sua interveno. O
responsvel acessa o ambiente 3D de monitoramento para obter
mais informaes sobre a situao do idoso por meio do Painel de
Monitoramento e observando o objeto virtual Porta Comprimidos,
que espelha o objeto real, para decidir que ao tomar. Na Figura7
observa-se como o evento de alerta, transmitido pelo agente Porta-
comprimidos no mundo real, propagado pelo sistema.

5. CONCLUSES E TRABALHOS
FUTUROS
Neste artigo foi apresentada a arquitetura xAgent que prope uma
base para desenvolvimento de ambientes colaborativas em cross-
reality. xGroupware e Ubilife so duas aplicaes que ilustram a
sua implementao.
xAgent tem a capacidade de se adequar a diferentes contextos
envolvendo a interao entre os mundos real e virtual como so os
casos do meetingware xGroupware e o ALL Ubilife. xAgent
tambm possibilita a comunicao com sistemas externos por meio
da troca de mensagens entre os Comunicadores e o Mensageiro
como no caso do agente Coordenador de Reunies do
xGroupware. Outra possibilidade que esta arquitetura oferece a
integrao de diversas tecnologias e plataformas de
desenvolvimento, como observado nas aplicaes citadas, que
usaram Arduino, LSL, Java e Jade nas implementaes.
Como modelagem computacional, optou-se pelos sistemas
multiagentes, dado que os atributos de agentes (autonomia,
habilidade social, reactividade e proactividade) so tambm
atributos dos objetos fsicos e virtuais. Principalmente pelo atributo
de habilidade social, que possibilita a interao entre os agentes e
por conseguinte, a colaborao entre os mundos.
Nos trabalhos futuros, pretende-se aprimorar a arquitetura para
suportar a noo forte de agentes utilizando-se BDI. Tambm se
deseja examinar a aplicao do Modelo 3C de Colaborao em
ambientes cross-reality baseadas na arquitetura xAgent. Alm
disso, se sugere a implementao de um processo para o
desenvolvimento deste tipo de aplicaes.

6. AGRADECIMENTOS
Katia Vega e Dbora Cardador recebem bolsas de doutorado do
CNPq n 140859/2010-1 e n 141520/2010-8 respectivamente.
Hugo Fuks recebe bolsas de Produtividade de Pesquisa do CNPq
n 302230/2008-4 e Cientista do Nosso Estado da FAPERJ. Carlos
Lucena recebe bolsas de Produtividade de Pesquisa do CNPq n
304810/2009-6 e Cientista do Nosso Estado da FAPERJ.


Figura 7. Ubilife em funo de seus agentes.
Mundo Real Mundo Virtual
Servidor
Dispositivos Computador
Porttil
Second Life
Mensageiro Comunicador
GDUHVLGrQFLD
do idoso
Comunicador do
UHVSRQViYHO
Localizador
Porta
Comprimidos
Controle do
ambiente
Sentinela
Comunicador
do ambiente
virtual
Painel de
monitoramento
Porta
Comprimidos
NPC
Controle do
ambiente
Base de Dados
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 66 -
7. REFERNCIAS

[1] A. Pereira, K. Vega., D. Filippo, V. David, A. Raposo, and H.
Fuks. 2009. Enacting Collaboration via Storytelling in
Second Life 15th Collaboration Researchers` International
Workshop on Groupware (CRIWG 2009), Lecture Notes on
Computer Science LNCS 5784, Springer-Verlag, September
2009, pp. 319-327, ISSN 0302-9743.
[2] J. Lifton and J.A. Paradiso. 2009. Dual Reality: Merging the
Real and Virtual. In Proceedings of the First International
ICST Conference on Facets of Virtual Environments (FaVE),
July 2009, p. 12-28.
[3] J. Paradiso and J. Landay. 2009 Cross-Reality Environments.
In IEEE Pervasive Computing, vol.8, n.3, July 2009, p. 14-15
doi:10.1109/MPRV.2009.47, ISSN 1536-1268.
[4] M. Wooldridge and N.R. Jennings. 1995. Intelligent Agents:
Theory and Practice. In Knowledge Engineering Review
vol.10, n.2, 1995, p. 115-152.
[5] T. Holz, A. Campbella, G. O`Harea, J. StaIIordb, A. Martinb,
and M. Dragonea. 2011. MiRAMixed Reality Agents. In
International Journal of Human-Computer Studies, vol.69,
n.4, April 2011, p.251-268.
[6] B.R. Duffy, B.R., G.M.P.O`Hare, A. Martin, J.F. Bradley, and
B. Schn. 2003.. Agent Chameleons: Agent Minds and
Bodies. 16th International Conference on Computer
Animation and Social Agents (CASA), Rutgers University,
New-Brunswick, New Jersey, USA, May 2003, p.7-9.
[7] I. Barakonyi and D. Schmalstieg. 2006.. Ubiquitous Animated
Agents for Augmented Reality. In Proceedings of the 5th IEEE
and ACM International Symposium on Mixed and
Augmented Reality (ISMAR), October 2006, p.145-154.
doi:10.1109/ISMAR.2006.297806.
[8] G.M.P. O`Hare, A.G. Campbell, and J.W. Stafford. 2005.
NeXuS: Delivering Behavioural Realism through Intentional
Agents. In Proceedings of the 2005 International Conference
on Active Media Technology (AMT), May 2005, p.481-486.
doi:10.1109/AMT.2005.1505402.
[9] D.F. Reilly, H. Rouzati, A. Wu, J.Y. Hwang, J. Brudvik, and
W.K. Edwards. 2010. TwinSpace: An Infrastructure for
Cross-Reality Team Spaces. In Proceedings of the 23rd ACM
Symposium on User Interface Software and Technology
(UIST), October 2010, pp. 119-128.
doi:10.1145/1866029.186605.
[10] H. Chen, T. Finin, and A. Joshi. 2004. The SOUPA Ontology
for Pervasive Computing. In Ontologies for agents: Theory
and experiences, Birkhauser Publishing Ltd., 2004 pp. 233--
258
[11] N. Dindar, C. Balkesen, K. Kromwijk, and N. Tatbul. 2009.
Event Processing Support for Cross-Reality Environments.
IEEE Pervasive Computing Magazine, vol.8, n.3, Special
Issue on Cross-Reality Environments, July 2009, p.34-41.
doi:10.1109/MPRV.2009.43.
[12] K. Vega, D. Cardador, H. Fuks, and C.J.P. Lucena. 2011.
xAgent: Colaborao em Ambientes Cross-Reality com
Agentes. SVR 2011, XIII Symposium on Virtual and
Augmented Reality, Uberlndia, Minas Gerais, Brazil, May
2011,. ISSN 2177-6768.
[13] R. Faludi. 2008. XBee Lilypad. [Online]. Available:
http://www.faludi.com/2008/06/15/xbee-lilypad.
[14] (2010) Arduino Website. [Online]. Available:
http://arduino.cc/en/.
[15] W. A. Kellogg, T. Erickson, N.S. Shami, and D. Levine.
2010. Telepresence in Virtual Conferences: An empirical
comparison of distance collaboration technologies. New
Frontiers in Telepresence Workshop. CSCW 2010, Savannah,
GA, USA, February 2010 .
[16] M. Billinghurst and H. Kato. 1999. Collaborative Mixed
Reality. First International Symposium on Mixed Reality
(ISMR `99), Springer-Verlag, 1999, pp. 261-284.
[17] (2010) FIPA website. [Online]. Available:
http://www.fipa.org.
[18] M. Wojciechowski, H. Ristok, W. Brandes, B. Lange, and G.
Baumgarten. 2011. $UFKLWHFWXUHRIWKH'DLO\FDUH-RXQDOIRU
the Support of Health Care Networks. In Ambient Assisted
Living, 1st ed., R. Wichert and B. Eberhardt (Eds.), Ed.
Berlin: Springer, 2011, pp.3-16.
[19] Doukas, C., Maglogiannis, I., Rouskas A., and Pneumatikakis.
2009. A. Emergency incidents detection in assisted living
environments utilizing sound and visual perceptual
components. In ACM Proceedings of the 2nd International
Conference on Pervasive Technologies Related to Assistive
Environments, Springer-Verlag, June 2009, p.1-7.

VIII Simpsio Brasileiro de Sistemas Colaborativos
- 67 -
Ampliando o suporte interoperabilidade em uma
arquitetura orientada a servios de middleware para
sistemas colaborativos
Rita Suzana P. Maciel
Universidade Federal da Bahia
(UFBA)
Salvador, BA
ritasuzana@dcc.ufba.br
Jos Maria N. David
Universidade Federal de Juiz de Fora
(UFJF)
Juiz de Fora, MG
jose.david@ufjf.edu.br
Thiago R. de Almeida
Universidade Salvador
(UNIFACS)
Salvador, BA
thiago.almeida@unifacs.edu.br
ABSTRACT
Interoperability between collaborative systems is a complex
requirement to be considered separately from other non functional
requirements. WGWSOA (Web-based Groupware Service-
Oriented Architecture) was designed to support interoperable
collaborative systems development. The initial focus of the project
was to explore interoperability requirement and its relationship
with other non functional requirements, such as: reuse, portability,
loose coupling, stateless and composability. However, the
obtained results have indicated that other interoperability types
need to be investigated. This paper presents the results of
WGWSOA project in order to support both the construction and
execution of collaborative systems focusing in interoperability
issues. Moreover, it analyzes the forms that different types of
interoperability can be supported by WGWSOA.
Categories and Subject Descriptors
D.2.12 [Software Engineering]: Interoperability data mapping.
General Terms
Design.
Keywords
Interoperability, Middleware Services, SOA, Collaborative
Systems.
RESUMO
A interoperabilidade entre sistemas colaborativos um requisito
complexo para ser tratado isoladamente de outros requisitos no
funcionais. A WGWSOA (Web-based Groupware Service-
Oriented Architecture) foi projetada para apoiar o
desenvolvimento de sistemas colaborativos interoperveis.
Inicialmente, buscou-se explorar a interoperabilidade e o
relacionamento deste requisito com outros, tais como:
reutilizao, portabilidade, baixo acoplamento, ausncia de estado
e capacidade para composio. Entretanto, os resultados obtidos
indicam que o suporte para outros tipos de interoperabilidade
precisam ser investigados. Este artigo apresenta os resultados
obtidos no projeto WGWSOA para o suporte construo e
execuo de sistemas colaborativos, principalmente no que diz
respeito interoperabilidade. Alm disso, analisa as formas pelas
quais os diferentes tipos de interoperabilidade podem ser tratados
pela WGWSOA.
Palavras-Chave
Interoperabilidade, Servios de Middleware, SOA, Sistemas
Colaborativos.
1. INTRODUO
A interoperabilidade pode ser definida como a capacidade de
aplicaes heterogneas compartilharem procedimentos e dados
mesmo estando em equipamentos e plataformas distintas [1]. Est
relacionada capacidade dos sistemas se comunicarem de tal
forma que diferentes partes possam colaborar independentemente
das tecnologias utilizadas (metodologias, linguagens e ambientes
de programao) [2].
Ela um requisito fundamental para a implementao de
mecanismos que apoiem de forma eficiente e eficaz a realizao
das tarefas colaborativas em ambientes heterogneos. A ausncia
de um suporte adequado interoperabilidade um problema para
os desenvolvedores e usurios de sistemas colaborativos devido
imposio da utilizao de um nico ambiente ou tratamento no
automatizado quando ferramentas distintas so adotadas. Ao
considerarmos um nico ambiente, aspectos relacionados
interoperabilidade frequentemente so implicitamente tratados na
prpria aplicao, gerando sistemas fortemente acoplados.
O suporte interoperabilidade tem sido objeto de estudo em
diferentes contextos. Inicialmente, para prover interoperabilidade
entre aplicaes distintas, mecanismos que utilizavam estratgias
de mapeamentos especficos foram desenvolvidos para
plataformas distintas [3]. Como resultado, aplicaes
desenvolvidas entre duas plataformas distintas se tornavam
interoperavis adotando estas estratgias. Posteriormente,
principalmente impulsionadas pelo advento das aplicaes Web,
solues baseadas em padres pblicos e abertos foram propostos,
por exemplo: SOAP (Simple Object Access Protocol), WSDL
(Web Service Definition Language), XMI (XML Metadata
Interchange), e outros. Porm para se alcanar nveis mais amplos
de interoperabilidade entre aplicaes diferentes faz-se necessrio
ir alm da utilizao de padres.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 68 -
Neste contexto, uma arquitetura orientada a servios de
middleware, denominada WGWSOA (Web-based Groupware
Service-Oriented Architecture) [4], foi projetada para apoiar o
desenvolvimento e a execuo de sistemas colaborativos. Dentre
os servios dessa arquitetura incluem os servios de coordenao,
cooperao, comunicao, percepo. Alm disso, ela foi
idealizada tendo como foco o suporte interoperabilidade e, para
tanto, foi projetada de acordo com os conceitos e princpios da
orientao a servios.
Em um primeiro estgio do projeto da WGWSOA buscou-se tratar
a interoperabilidade em relao aos aspectos tcnicos.
Interoperabilidade sinttica (ou tcnica) est associada ao suporte
para que mensagens possam ser trocadas entre diferentes partes
que colaboram para a realizao de uma tarefa. Posteriormente,
foram iniciadas atividades no contexto da WGWSOA para apoiar
a interoperabilidade semntica. Estas atividades fazem parte de
um projeto que busca investigar as diferentes formas propostas na
literatura para acrescentar significado s mensagens, para que elas
possam ser compreendidas entre os sistemas que colaboram [5].
Os resultados preliminares obtidos apontam que outros tipos de
interoperabilidade precisam ser tratados no desenvolvimento e na
execuo de sistemas colaborativos com o suporte de uma
infraestrutura de middleware, por exemplo, a interoperabilidade
pragmtica.
A interoperabilidade pragmtica amplia aspectos no cobertos
pela sinttica e semntica. Ela est relacionada capacidade dos
sistemas, que colaboram, de capturarem os desejos por aes entre
aqueles que solicitam e enviam os resultados [6]. Quando este
suporte no oferecido o efeito real de uma mensagem enviada
difere daquele que foi pretendido pela aplicao.
O objetivo deste artigo apresentar os resultados obtidos em
relao ao suporte aos diferentes tipos de interoperabilidade em
uma arquitetura orientada a servios de middleware para apoiar o
desenvolvimento e a execuo de sistemas colaborativos
distribudos. Adicionalmente, so apresentados os prximos
passos do projeto no intuito de oferecer uma cobertura mais ampla
ao requisito no funcional interoperabilidade e, consequentemente
potencializar o desenvolvimento de sistemas colaborativos.
Este artigo est organizado da seguinte forma. A Seo 2
apresenta alguns trabalhos que procuram apoiar a
interoperabilidade no desenvolvimento de sistemas. A Seo 3
apresenta a infraestrutura de middleware (WGWSOA) projetada
para apoiar a interoperabilidade de sistemas colaborativos. A
Seo 4 apresenta os diferentes tipos de interoperabilidade no
contexto desta infraestrutura. A Seo 5 apresenta as solues
para a interoperabilidade implementadas na WGWSOA, bem
como os resultados obtidos. Finalizando o texto, a Seo 6
apresenta as direes futuras para esta pesquisa no sentido de
oferecer suporte para a interoperabilidade de sistemas
colaborativos.
2. TRABALHOS RELACIONADOS
A interoperabilidade entre sistemas colaborativos um tpico
bastante investigado na literatura. Inicialmente, para permitir
algum nvel de interoperabilidade com outras ferramentas, alguns
sistemas colaborativos disponibilizaram mecanismos diversos.
Estes mecanismos permitem tanto o compartilhamento de um
espao de trabalho e informaes gerenciais do projeto, como
tambm procedimentos para edio, reviso, formatao e
converso entre formatos distintos de documentos. A maioria das
propostas so frameworks, por exemplo, Dyce [7], Disciple [8],
Evolve [9]. De uma forma geral, um sistema instanciado a partir
de um framework, no prontamente interopervel com outro
sistema instanciado a partir de um framework distinto (por
exemplo: Dyce-Evolve, Evolve-Disciple).
Dewan e Sharma [10] investigaram o problema da
interoperabilidade entre sistemas colaborativos nas dimenses da
arquitetura (polticas de controle de concorrncia, replicao de
objetos, etc.). Para prover a interoperabilidade neste contexto,
uma ponte realiza a converso entre os protocolos distintos
utilizados nas arquiteturas. Na maioria dos casos, ser necessrio
conhecer os protocolos empregados pelas aplicaes para
convert-los em um protocolo abstrato utilizado pela camada que
prover interoperabilidade [11].
Mangan, Borges e Werner [12] propem a utilizao de um
middleware para tratar a percepo entre ferramentas de
desenvolvimento de software. Especificamente, a soluo
proposta envolve o tratamento de eventos gerados por essas
ferramentas. Para tal, necessrio implementar uma extenso para
diferentes ferramentas CASE tanto para monitorar os eventos
quanto para visualiz-los. Isso significa possuir um conhecimento
mais especfico sobre detalhes de implementao. O suporte
interoperabilidade pode ser realizado atravs de funes de um
middleware e do conhecimento das estruturas implementadas nas
aplicaes.
Para apoiar o desenvolvimento de sistemas colaborativos Fonseca
e Carrapatoso [13] propem uma arquitetura, denominada SAGA,
baseada na utilizao de web services. Como resultado, aplicaes
desenvolvidas a partir da soluo proposta se beneficiam das
vantagens oferecidas pela tecnologia de web services para apoiar a
interoperabilidade entre sistemas colaborativos. A utilizao
apenas de padres como WSDL e UDDI, limita o suporte para a
interoperabilidade. Com o objetivo de tratar os limites impostos
pela tecnologia de web services, o projeto METEOR-S [14]
prope a utilizao de um framework para acrescentar mais
semntica s descries WSDL. Atravs desse framework
anotaes so associadas de forma semiautomticas s descries
dos servios com ontologias. Apesar de ampliar a
interoperabilidade entre servios, percebe-se a necessidade de um
esforo adicional para apoiar a interoperabilidade entre sistemas
desenvolvidos em plataformas distintas e tecnologias
heterogneas.
3. WGWSOA UMA INFRAESTRUTURA
DE SERVIOS DE MIDDLEWARE
WGWSOA uma infraestrutura baseada em servios de
middleware cujo principal objetivo apoiar o desenvolvimento e
a execuo de sistemas colaborativos. Para tanto, um dos
objetivos especficos da infraestrutura apoiar a
interoperabilidade entre aplicaes distribudas construdas em
uma mesma plataforma de middleware ou com o apoio de
plataformas distintas. Alm disso, atravs de uma arquitetura
orientada a servios esta infraestrutura busca tratar alguns
requisitos frequentemente necessrios para as aplicaes no
domnio de sistemas colaborativos. So eles: flexibilidade para
que os servios evoluam de acordo com a dinmica dos requisitos
das aplicaes neste domnio, portabilidade, escalabilidade,
capacidade de reutilizao e composio dos servios.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 69 -
De acordo com a Figura 1 a arquitetura da WGWSOA composta
de trs camadas nas quais podemos encontrar (i) descries dos
servios armazenadas em repositrios. Essas descries apoiam a
localizao de servios (Camada de Persistncia), (ii) servios
comuns e especficos (Camada de Middleware) e (iii) aplicaes
de groupware (Camada de Aplicao). Servios comuns
implementam funcionalidades que so necessrias para muitas
aplicaes distribudas, tais como: controle de concorrncia,
gerenciamento de transaes, nomeao e localizao de servios.
J os servios especficos esto relacionados s funcionalidades
das aplicaes de um determinado domnio, no caso o domnio de
sistemas colaborativos. Por exemplo, funcionalidades para apoiar
a comunicao, a cooperao, a coordenao, a percepo e
elementos de interoperabilidade que so especficos para os
sistemas colaborativos. Atravs desta ltima funcionalidade a
arquitetura inclui o suporte aos tipos de interoperabilidade
necessrios para o desenvolvimento de sistemas colaborativos [4].
O projeto do servio de interoperabilidade inclui o suporte para a
interoperabilidade sinttica, semntica e pragmtica, ao mesmo
tempo em que interage com os outros servios especficos para
que eles interoperem atravs de instncias da WGWSOA.
4. TIPOS DE INTEROPERABILIDADE
No contexto de uma SOA a interoperabilidade pode ser redefinida
como a capacidade de sistemas diversos, autnomos e
heterogneos utilizarem seus servios de forma efetiva. A
ausncia de interoperabilidade entre servios pode ser considerada
um dos obstculos na realizao dos objetivos em uma SOA para
apoiar o desenvolvimento de sistemas colaborativos.
4.1 Interoperabilidade Sinttica (ou Tcnica)
Interoperabilidade sinttica (ou tcnica) est relacionada
capacidade de entidades distintas trocarem mensagens com
estruturas de dados compatveis. Esta troca frequentemente
realizada atravs de um processo de codificao/decodificao de
acordo com os protocolos utilizados. Por exemplo, para a
tecnologia de web services a interoperabilidade sinttica tratada
atravs dos padres oferecidos para a descrio, troca de
mensagens, busca e localizao de servios. No projeto da
WGWSOA, a possibilidade de utilizao de diferentes
plataformas para o desenvolvimento de servios restringe o
suporte interoperabilidade sinttica s diferentes tecnologias
utilizadas pelas plataformas. Como resultado, um esforo
adicional do desenvolvedor necessrio para oferecer este
suporte.
4.2 Interoperabilidade Semntica
No contexto da WGWSOA a interoperabilidade semntica est
sendo tratada conforme o conceito proposto por Pollock e
Hodgson [15]. Ao apoiar a interoperabilidade sistemas
colaborativos devem ser capazes de (i) relacionar conceitos caso
eles possuam o mesmo significado, e (ii) interpretar e classificar
significados. Este conceito est relacionado capacidade de
entidades distintas (emissor e receptor) compreenderem o
contedo de uma mensagem [6]. Portanto, ela est associada ao
contexto no qual a informao transmitida.
Inicialmente, a interoperabilidade semntica est sendo tratada
atravs do compartilhamento e alinhamento de ontologias. A
deciso por esta abordagem se deve ao fato de oferecer servios
fracamente acoplados ao mesmo tempo em que a semntica
associada s operaes dos servios para promover a
interoperabilidade [5].
4.3 Interoperabilidade Pragmtica
Ao trocarem mensagens, as partes que colaboram nem sempre
utilizam o mesmo modelo para se comunicarem. O suporte
interoperabilidade pragmtica tem como objetivo tratar de
situaes no apoiadas pelas solues propostas para a
interoperabilidade semntica. Mesmo que o significado da
mensagem seja compreendido, o efeito por ela produzido pode
diferir daquele que foi planejado. Por exemplo, uma das partes
trata o termo professor em um contexto de ensino presencial,
enquanto a outra parte, que colabora, considera o contexto de
ensino a distncia.
Em termos de uma infraestrutura de middleware, o suporte
interoperabilidade pragmtica est situado tanto na camada de
servios como em um nvel acima dessa camada. Este nvel, que
Figura 1. Viso geral da arquitetura da WGWSOA (adaptada de [4]).
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 70 -
ainda no foi projetado para a WGWSOA, relaciona-se aos
processos de negcios de uma organizao. Ao definir e executar
um processo, as partes que colaboram devem estar de acordo com
as polticas e regras estabelecidas. Desta forma, os servios que
participam deste processo concordam que as mensagens enviadas
e recebidas compartilham do mesmo significado [16].
Consequentemente, elementos de contexto devem ser levados em
considerao ao tratarmos do suporte a este tipo de
interoperabilidade.
5. INTEROPERABILIDADE NA WGWSOA
Apesar de manipularem objetos (documentos, aplicaes de
suporte a reunies, agenda, lista de discusso, etc.) com mesma
semntica, no possvel para a maioria dos sistemas
colaborativos distribudos acessarem objetos e dados de outra
aplicao, mesmo que tais aplicaes tenham sido construdas em
uma mesma plataforma de middleware. A complexidade deste
cenrio torna-se maior ao idealizarmos a interoperabilidade e a
reutilizao de servios de sistemas colaborativos construdos
com o suporte de middlewares distintos [1].
Diante deste cenrio, o suporte interoperabilidade entre sistemas
colaborativos tem sido investigado no contexto da WGWSOA.
Diferentes solues, propostas na literatura tm sido investigadas.
Inicialmente, aquelas que esto relacionadas diretamente
interoperabilidade sinttica, foram implementadas e avaliadas
considerando-se os princpios da arquitetura orientada a servios.
Estes resultados esto descritos em [4]. Outras solues so
descritas a seguir e se relacionam tambm ao suporte
interoperabilidade semntica e interoperabilidade entre modelos
de desenvolvimento.
5.1 Wrapper
O servio de wrapper na WGWSOA (WGWSOAWrapper) tem
como objetivo apoiar a comunicao entre instncias distintas da
infraestrutura. Quando uma aplicao em uma instncia necessita
executar um servio em outra instncia necessrio enviar uma
mensagem de solicitao contendo o nome da instncia de
destino. A partir desse momento, se inicia um processo de
resoluo de nomes utilizando-se uma tabela da WGWSOA. Essa
tabela contm os seguintes campos: o nome identificador e o
nmero IP da instncia. A partir do nome da instncia retornado
o nmero IP do servio da instncia remota [17].
Para que a interao entre as instncias da WGWSOA ocorra
necessria converso da mensagem para um protocolo de
interoperabilidade. Esse protocolo define um conjunto de regras
para o empacotamento/desempacotamento das informaes
necessrias para a comunicao. Para o incio da interao entre
servios especficos da WGWSOA informado o nome do
servio, o nome da funo e a identificao dos seus parmetros
(nome, tipo e valor). A instncia que recebe a mensagem a
desempacota e executa o servio localmente. Aps a execuo,
uma mensagem retornada contendo as informaes do resultado
da operao [4].
Para a avaliao do servio de wrapper na WGWSOA, servios
de coordenao e de percepo foram desenvolvidos
considerando, principalmente, os aspectos relacionados
interoperabilidade sinttica. Para os servios de coordenao e de
percepo mensagens foram trocadas de acordo com as descries
das interfaces dos servios. Esses servios permitiram avaliar a
flexibilidade do servio de wrapper para apoiar a
interoperabilidade na WGWSOA. Para tanto, alguns ajustes foram
necessrios aos servios existentes para a adequao ao projeto do
(WGWSOAWrapper).
Os resultados da avaliao indicaram que extenses so
necessrias para apoiar a comunicao entre aplicaes que no
foram desenvolvidas utilizando-se a plataforma Java. A incluso
deste servio na WGWSOA promoveu a interoperabilidade
sinttica na infraestrutura, e permitiu que avaliaes pudessem ser
realizadas, medida que estudos de casos foram realizados
envolvendo diferentes instncias da infraestrutura e os servios
por ela oferecidos [4]. Usurios de aplicaes distintas puderam
realizar tarefas de forma colaborativa, informaes e
procedimentos comuns foram compartilhados. Porm, foi
observado um esforo adicional, atravs de troca de mensagens,
para organizar detalhes relativos realizao das atividades
colaborativas, por exemplo, de coordenao. Considerando
cenrios de maior escala e geograficamente mais dispersos, este
esforo tende a aumentar consideravelmente.
Atravs dos estudos de caso que foram conduzidos, ficou evidente
a necessidade de ir alm do suporte interoperabilidade sinttica
para apoiar as atividades de desenvolvimento e execuo de
sistemas colaborativos. O servio de wrapper permite que
usurios compartilhem dados e procedimentos. Apesar de uma
instncia da WGWSOA poder solicitar a execuo de um
determinado servio em instncias distintas, no possvel prever
os efeitos dessa execuo na instncia destino. Desta forma, a
interoperabilidade pragmtica precisa ser tratada neste contexto,
bem como a interoperabilidade semntica.
5.2 Mediadores
Em sistemas colaborativos distribudos a semntica dos dados est
relacionada ao contexto em que eles sero utilizados.
Considerando que o contexto no qual as aplicaes esto inseridas
dinmico, um suporte adequado representao do contexto
deve ser investigado no sentido de oferecer um suporte mais
amplo interoperabilidade semntica. medida que o contexto
evolui, as divergncias dos significados dos dados tendem a
aumentar. Essas divergncias esto relacionadas, por exemplo, aos
aspectos de nomenclatura, escalas e unidades, culturas envolvidas,
conhecimento do domnio das aplicaes, e integridade dos dados
[15].
No atual estgio da pesquisa, o suporte interoperabilidade
semntica na WGWSOA est sendo oferecido atravs da
utilizao de mediadores. A escolha pela utilizao de mediadores
se deve ao fato deles apoiarem a escalabilidade e a flexibilidade
dos servios em domnios nos quais a dinmica dos contextos
envolvidos uma caracterstica que predomina. Para tanto, uma
ontologia foi inicialmente desenvolvida, bem como um servio
mediador que apoia o alinhamento das ontologias associadas aos
servios que interoperam [5].
A figura 2 ilustra duas instncias da WGWSOA nas quais duas
ontologias foram associadas a dois servios especficos: um
servio de comunicao e um servio de coordenao. Os servios
de interoperabilidade da WGWSOA implementam servios de
mediao que so responsveis pelo alinhamento das ontologias
de cada servio especfico.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 71 -
Figura 2. Interao entre os servios de interoperablidade
semntica e outros servios especficos da WGWSOA [5].
No sentido de proporcionar interoperabilidade para os sistemas
colaborativos, os servios de Interoperabilidade Semntica foram
divididos em trs outros servios: (i) manipulao de ontologia,
responsvel por analisar a ontologia recebida e obter os conceitos
(classes, subclasses, propriedades, etc); (ii) manipulao de
conceitos, busca avaliar os conceitos obtidos pelo servio de
manipulao de ontologia comparando-os com os que foram
informados pelo servio mediador, e indicando se estes so ou
no passveis de interoperar, bem como a converso necessria;
(iii) mediador, repassa as ontologias das aplicaes a interoperar e
o conceito a ser avaliado para os respectivos servios. Conforme
as respostas, ele executa a converso dos dados ou notifica sobre a
impossibilidade de interoperar. O mdulo WordNet refere-se
aplicao que apoia a deciso do servio manipulador de
conceitos, provendo para este informaes sobre sinnimos e
hipernimos do conceito a interoperar. Alm destes as aplicaes
podem utilizar outros servios especficos de middleware (Figura
3).
Servio de Manipulao
de Ontologia
Wordnet
Servio de Manipulao
de Conceitos
Servio Mediador
Servio de Interoperabilidade
Semntica
Servio de
Comunicao
Servios Especficos de
Middleware
Aplicao de
Groupware
Figura 3. Viso geral da arquitetura do mediador da
WGWSOA.
A figura 4 apresenta o Diagrama de Componentes com as
interaes entre os servios que compem o Servio de
Interoperabilidade Semntica. importante notar que a
comunicao deste servio com o sistema colaborativo
estabelecida por meio de uma porta que encapsula os demais
servios.
De acordo com a figura 4, o OntologyHandler responsvel pelo
tratamento da ontologia, isto , o reconhecimento dos conceitos
de classe. Por sua vez, ConceptHandler avalia tanto os termos
obtidos com o tratamento da ontologia, como a possibilidade de
interoperar. SemanticMediator recebe as ontologias dos servios
a interoperar e as repassa para OntologyHandler e
ConceptHandler, dependendo das respostas obtidas ele retorna o
resultado da conversao dos dados.
Figura 4. Diagrama de componentes do servio de
interoperabilidade semntica.
Avaliaes foram realizadas no sentido de verificar e extenso na
qual um servio mediador baseado em ontologias pode alinhar os
conceitos de servios especficos que necessitam interoperar. Para
a construo dos sistemas colaborativos com o suporte da
WGWSOA foi necessrio lanar mo do suporte
interoperabilidade sinttica fornecida pela infraestrutura atravs
dos seus servios. Os resultados obtidos revelaram que, no
contexto da arquitetura proposta, a utilizao de mediadores
baseados em modelos ricamente semnticos (ontologias) pode
potencializar o suporte interoperabilidade entre sistemas
colaborativos [5]. Entretanto, outras formas de mediao precisam
ser avaliadas como, por exemplo, a utilizao de mediadores
baseados em mapeamentos de modelos (UML, e outros).
Apesar dos resultados obtidos em relao ao suporte
interoperabilidade semntica, ficou evidente nas avaliaes que
outros tipos de interoperabilidade precisam ser apoiados para a
construo e a execuo de sistemas colaborativos. Neste
contexto, o suporte interoperabilidade pragmtica, por exemplo,
necessita ser investigado considerando-se que mensagens trocadas
entre servios que colaboram necessitam satisfazer restries
determinadas por eles.
5.3 Uma abordagem MDA para apoiar a
interoperabilidade
A MDA (Model Driven Architecture) uma especificao do
OMG (Object Management Group) que define um framework
conceitual para a realizao do desenvolvimento dirigido por
modelos. A MDA prope que uma determinada aplicao seja
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 72 -
construda a partir de modelos mais genricos de acordo com a
sua categoria. O ciclo de desenvolvimento de uma aplicao
comea atravs da especificao de um modelo de negcio (CIM
Computational Independent Model), um modelo de anlise e
projeto do sistema independente de plataforma (PIM Platform
Independent Model) e, posteriormente, escolhida a plataforma de
desenvolvimento para este software, um modelo especfico para
esta plataforma deve ser definido (PSM Platform Specific
Model). Um PIM pode ter associado a ele diversos PSMs, um
para cada plataforma desejada.
Um dos objetivos da WGWSOA ser uma infraestrutura
independente de plataforma. Para atender este requisito, alm de
facilitar e sistematizar a implementao dos seus servios, o
processo MDA para desenvolvimento de servios especficos foi
adotado como processo de software da arquitetura [18].
A homogeneizao de plataformas, ou o estabelecimento de
padres, no tem se mostrado como formas suficientes para apoiar
a interoperabilidade. Segundo Ruokolainen e Kutvonen [6],
ambientes normalmente requerem multiplicidade de plataformas e
os padres frequentemente so sujeitos ambiguidade de
interpretaes e, como resultado, no podem garantir a
interoperabilidade entre entidades que colaboram. Nesta direo,
experimentos realizados no contexto da WGWSOA evidenciaram
que a adoo de padres, por exemplo, aqueles estabelecidos pela
tecnologia de Web Services, foram suficientes para apoiar
aspectos da interoperabilidade tcnica (ou sinttica) e,
parcialmente, semntica.
Neste contexto, outro aspecto relevante diz respeito s
especificidades de solues frequentemente disponibilizadas por
determinadas aplicaes de groupware. A partir do momento em
que desejamos torn-las interoperveis necessrio um processo
de desenvolvimento especfico para cada par de aplicaes. Tal
processo pode se tornar invivel medida que o nmero de
aplicaes cresce. Sendo assim a ausncia de interoperabilidade
um problema no apenas para os usurios, devido imposio da
utilizao de um nico ambiente ou tratamento no automatizado
de informaes quando sistemas colaborativos distintos so
adotados, mas sobretudo para os desenvolvedores devido ao
esforo envolvido na implementao das solues frequentemente
propostas na literatura. Tal esforo se relaciona complexidade
existente para implementar solues que demandam a
interoperabilidade e a integrao entre plataformas distintas de
middleware.
Ao utilizar um modelo unificado entre as partes que colaboram a
interoperabilidade pode ser potencializada. Esse modelo poderia
utilizar uma linguagem com uma notao independente de
plataforma. Ainda, segundo Ruokolainen e Kutvonen [6], a
abordagem MDA pode apoiar a interoperabilidade no momento
em que consideramos a possibilidade de gerar componentes a
partir de transformaes aplicadas em um mesmo modelo
independente de plataforma. Como resultado, ferramentas de
diferentes fabricantes podem gerar componentes capazes de
interoperar.
A interoperabilidade entre modelos promovida medida que o
processo de construo de uma aplicao pode ser visto como um
conjunto de transformaes que levam ao sistema final. Uma
transformao de modelo o processo de converter um modelo
origem em outro modelo destino. Para que modelos abstratos, ao
longo do ciclo de desenvolvimento, evoluam e deem origem a
cdigo necessria a realizao de transformaes [19].
O processo MDA aplicado a WGWSOA destina-se a desenvolver
servios em vrias plataformas distintas da infraestrutura. Desta
forma foi possvel adotar um modelo unificado de
desenvolvimento dos servios, tanto para instncias distintas da
WGWSOA quanto para as aplicaes que os utilizam. No mais
necessrio um processo de desenvolvimento distinto para cada
nova plataforma de middleware utilizada pela WGWSOA. Como
resultado, o esforo de implementao para interoperabilidade
entre ambientes que utilizam modelos de desenvolvimentos
distintos foi minimizado.
PSM => Cdigo
PIM => PSM
CIM => PIM
Modelo
Operacional
Modelo Projeto
Modelo Domnio
Regra ATL
PSM
Regra MofScript
PIM
CIM
Regra ATL
Figura 5. Viso geral do processo MDA.
A figura 5 apresenta uma viso geral do processo MDA. Neste
processo possvel, a partir da identificao de caractersticas
inerentes ao domnio, que so potencialmente requisitos
funcionais mais comuns das aplicaes, identificar os servios
especficos. Desta forma, servios so definidos a partir das
atividades dos membros do grupo. Alm disso, estes servios so
especificados de forma independente de plataforma para,
posteriormente, atravs de apoio de regras de transformao,
serem implementados em uma plataforma especfica. Aplicando
este processo na WGWSOA, o CIM corresponde ao modelo de
domnio, ao contexto em que o servio deve ser aplicado. O
escopo do servio, o vocabulrio, a informao e as suas
responsabilidades so definidos neste modelo atravs dos
requisitos funcionais inicialmente estabelecidos. Casos de usos
devem ser especificados evidenciando as tarefas que o grupo
precisa realizar nas suas atividades.
O PIM corresponde ao Modelo de Projeto. Os servios a serem
oferecidos e suas operaes so definidos neste modelo. Ele
identifica a interface de servios e componentes estabelecidos no
CIM, independente de uma plataforma de middleware em
particular.
O PSM corresponde ao Modelo Operacional que descreve o
ambiente de execuo dos servios em uma plataforma. As
caractersticas de uma plataforma de middleware em particular
(por exemplo, CORBA, RMI, JMS) so consideradas neste
modelo de modo a refletir o ambiente de execuo real.
O processo MDA possui at o momento transformaes que
permitem a especificao e a implementao de servios de
middleware para as plataformas CCM (CORBA Component
Model) e EJB (Enterprise Java Beans). As transformaes entre
os modelos (CIM-PIM e do PIM-PSM) esto implementadas na
linguagem ATL (Atlas Transformation Language) e as
transformaes do PSM para o cdigo esto implementadas na
Linguagem MOFScript. A ferramenta Transforms [20] o
engenho de transformao utilizado para automatizar estas
atividades.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 73 -
RemoveMeeting
<<Activity>>
CreateMeeting
<<Activity>>
UpdateMeeting
<<Activity>>
ListMeeting
<<Activity>>
PreMeeting_BP
<<BusinessProces s>>
ListUsers
<<Activity>>
Figura 6. Modelo computacional para o servio de pr-
reunio [18].
A figura 6 mostra o modelo computacional (PIM) para o servio
de pr-reunio da WGWSOA. Esta aplicao foi desenvolvida
com o intuito de avaliar a soluo. Neste modelo, estereotipado
com conceitos do perfil UML EDOC (Enterprise Distributed
Object Computing), o processo de negcio (<<Business
Process>>) Pre-Meeting-BP passa por duas transformaes CIM-
PIM e PIM-PSM (conforme ilustrado na figura 5) para gerar a
interface de descrio do servio Pre-MeetingServer na JavaIDL
(Java Interface Definition Language) na plataforma de
middleware EJB. A figura 7 mostra a IDL gerada a partir do
modelo apresentado na Figura 6.
Na cadeia de transformao do processo MDA, o <<Business
Process>> Pre-Meeting-BP (Figura 6) mapeado para a interface
Pre-MeetingServer (Figura 7). Da mesma forma, cada elemento
<<Activity>> mapeado para uma operao da interface do
servio Pre-MeetingServer.
Figura 7. JavaIDL do servio de pr-reunio [18].
IDLs (Interface Definition Language) foram projetadas para
serem descritores dos servios de forma independente da
plataforma de middleware, promovendo assim a
interoperabilidade sinttica. Porm, atualmente, no existe uma
IDL padro adotada por vrias plataformas. Na WGWSOA, a
descrio do servio no PIM tem como objetivo descrever a
interface do servio de forma independente de plataforma.
A abordagem de MDA foi uma tentativa de ampliar a
interoperabilidade na WGWSOA. Atravs dos experimentos
realizados, foi observado que a interoperabilidade pode ser
potencializada a partir do momento em que diferentes instncias
da WGWSOA utilizam a mesma estratgia para desenvolvimento
dos seus servios. Entretanto, um estudo mais detalhado precisa
ser desenvolvido no sentido de verificar as formas pelas quais a
soluo desenvolvida pode ser estendida para apoiar a
interoperabilidade pragmtica.
6. CONCLUSES E TRABALHOS
FUTUROS
O suporte interoperabilidade em sistemas colaborativos
demanda muitas vezes a adoo de aspectos comuns no projeto,
tais como: utilizao de tecnologias, modelo de dados, polticas
para a execuo de atividades de coordenao, e outros.
Entretanto, a uniformidade desses aspectos no frequentemente
encontrada nos ambientes organizacionais. A interoperabilidade,
portanto, um requisito com uma complexidade que necessita ser
tratado de uma forma mais abrangente.
Este artigo apresentou uma discusso sobre os diferentes tipos de
interoperabilidade e as solues adotadas, considerando-se uma
infraestrutura de middleware para apoiar o desenvolvimento e a
execuo de sistemas colaborativos. As avaliaes realizadas
revelaram a necessidade de se investigar outras solues para
apoiar a interoperabilidade no contexto dessa infraestrutura. As
questes e abordagens para a interoperabilidade no devem ser
consideradas apenas em determinados nveis de abstrao. Sempre
que necessrio, o tratamento de interoperabilidade deve ser
considerado atravs do inter-relacionamento entre diferentes
nveis da infraestrutura (camada de persistncia, de middleware e
de aplicao). Por exemplo, em um nvel mais abstrato no qual
devemos buscar o suporte execuo de processos de negcio, o
suporte combinao de diferentes tipos de interoperabilidade se
faz necessrio.
A utilizao de uma infraestrutura comum, estruturas de mediao
ou meta linguagens no so suficientes para apoiar a
interoperabilidade entre sistemas colaborativos. Mesmo atravs da
tecnologia de orientao a servios, alguns aspectos de
interoperabilidade no foram devidamente apoiados pela
WGWSOA. Por exemplo: aspectos comportamentais dos servios
que compem os sistemas colaborativos. Esses sistemas
demandam uma complexidade crescente e necessitam de um
suporte mais amplo flexibilidade para diferentes configuraes,
para evoluir no sentido de apoiar os contextos nos quais esto
inseridos, e para apoiar projetos diversificados.
Portanto, ao considerarmos o suporte interoperabilidade
pragmtica percebemos uma necessidade de um suporte mais
abrangente representao do contexto no qual os processos so
executados. Este estudo passa por uma investigao que est em
andamento no projeto da WGWSOA ao considerarmos no
apenas os modelos para representao dos requisitos da aplicao
e as suas respectivas transformaes, mas a representao de
contexto atravs de ontologias e outras formas propostas na
literatura.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 74 -
7. AGRADECIMENTOS
Agradecemos Fundao de Amparo Pesquisa do Estado da
Bahia (FAPESB), pelo apoio financeiro (No. APR0385/2008).
Thiago R. de Almeida apoiado pela Fundao de Amparo
Pesquisa do Estado da Bahia.
8. REFERNCIAS
[1] Bernstein, P. A. 1996. Middleware: A Model for Distributed
System Services. Communication of the ACM. New York. v.
39, n. 2, Feb., 86-98.
[2] Wegner, P. 1996. Interoperability. ACM Computing Surveys
(CSUR), 28(1), 285-287.
[3] Norman, R. J. 1998. CORBA and DCOM: Side by Side,
Distributed Computing (May 1998). 41-46.
[4] David, J. M. N. and Maciel, R. S. P. 2009. WGWSOA
Implementando Servios de Colaborao em uma Infra-
estrutura de Middleware, VI Simpsio Brasileiro de Sistemas
Colaborativos (SBSC), Fortaleza, CE, 193-201.
[5] Almeida, T. R., David, J. M. N. and Maciel, R. S. P. 2011.
Supporting semantic interoperability in a middleware
infrastructure for the development of collaborative services,
In: 15th International Conference on Computer Supported
Cooperative Work in Design (CSCWD), Lausanne,
Switzerland, 422-428.
[6] Ruokolaien, T. and Kutvonen, L. 2006. Interoperability in
Service-based Communities, In: Business Process
Management Workshops, Lecture Notes in Computer
Science, vol. 3812, 317-328.
[7] Tietze, D. 2001. A Framework for Developing Component
based Co-operative Applications, Ph. D. Dissertation
(Computer Science), Technischen Universitt Darmstadt,
Germany, 178 p.
[8] Krebs, A. M., Ionescu, M., Dorohonceanu, B. and Marsic, I.
2003. The Disciple System for Collaboration over the
Heterogeneous Web, In: Proceedings of the 36th Annual
Hawaii International Conference on System Sciences
(HICSS03), Computer Society Press, Big Island: Hawaii,
Jan.
[9] Stiemerling, O. and Cremers, A. 2000. The Evolve Project:
Component-Based Tailorability for CSCW Applications, AI
& Society, London, 120-141.
[10] Dewan, P. and Sharma, A. 1999. An Experiment in
Interoperating Heterogeneous Collaborative Systems, In:
Proceedings of European Conference on Computer-
Supported Cooperative Work (ECSCW99), Copenhagen,
Sept., 11-20.
[11] Chung, G. and Dewan, P. 2001. Flexible support for
application-sharing architecture, In: Proceedings of
European Conference on Computer Supported Cooperative
Work (ECSCW01), Germany, Sept., 99-118.
[12] Mangan, M. de Souza, Borges, M. R. S. and Werner, C. M.
2004. A Middleware to Increase Awareness in Distributed
Software Development Workspaces, In: The Joint
WebMedia/LA-Web Conference, Ribeiro Preto, v.1, 62-64.
[13] Fonseca, B. and Carrapatoso, E. 2006. SAGA: A Web
services Architecture for Groupware Applications, In:
Groupware: Design, Implementation and Use. Proc. of 12th
International Workshop on Groupware (CRIWG06),
Medina del Campo, Spain, Sept., 246-261.
[14] Patil, A., Oundhakar, S., Sheth, A. and Verma, K. 2004.
Meteor-S Web Service annotation framework, In:
Proceedings of the 13th International Conference on the
World Wide Web, 553-562.
[15] Pollock, J. T. and Hodgson, R. 2004. Adaptive Information:
Improving Business Through Semantic Interoperability, Grid
Computing, and Enterprise Integration, John Whiley & Sons.
[16] Pokraev, S., Quartel, D., Steen, M. W. A. and Reichert, M.
A. 2006. Method for Formal Verification of Service
Interoperability, IEEE International Conference on Web
Services (ICWS'06), 895-900.
[17] Bittencourt, L. G., Sposito, H. G., Costa, B. M. S., Maciel,
R. S. P. and David, J. M. N. 2009. Um Servio de
Comunicao para uma Arquitetura Orientada a Servios de
Middleware. In: Workshop de Trabalhos de Iniciao
Cientfica e Graduao Bahia, Alagoas e Sergipe (WTICG-
BASE), Ilhus BA, IX Escola Regional de Computao
Bahia-Alagoas-Sergipe, (CD-ROM).
[18] Bispo, C. P., Maciel, R. S. P., David, J. M. N., Ribeiro, I.
and Conceio, R. P. 2010. Applying a Model-Driven
Process for a Collaborative Service-Oriented Architecture,
In: 14th International Conference on Computer Supported
Cooperative Work in Design (CSCWD), Shanghai. v. I. 378-
383.
[19] OMG. 2003. MDA Guide. Version 1.0.1 (omg/2003-06-01).
[20] Silva, B., Magalhes, A., Maciel, R. S. P., Martins, N.,
Nogueira, L. and Queiroz, J. 2009. Transforms: Um
Ambiente de Apoio a Modelagem e Execuo de Processos
de Software Dirigido por Modelos. In: Proceedings of the
23rd Brazilian Symposium on Software Engineering (SBES)
- Tools Track, Fortaleza, Outubro 5-9.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 75 -
Uma Ferramenta de Colaborao Mvel para Auxiliar a
Interao em Palestras Presenciais
Gabriel Balestrin
Universidade do Estado de
Santa Catarina - UDESC
Departamento de Cincia da
Computao
Joinville, SC, Brasil
gabrieu3@gmail.com
Carla Diacui Medeiros
Berkenbrock
Universidade do Estado de
Santa Catarina - UDESC
Departamento de Cincia da
Computao
Joinville, SC, Brasil
diacui@joinville.udesc.br
Celso Massaki Hirata
Instituto Tecnolgico de
Aeronutica - ITA
Diviso de Cincia da
Computao
S.J.Campos, SP, Brasil
hirata@ita.br
ABSTRACT
The advancement of mobile computing as well as the con-
nectivity of mobile devices enable the development of new
tools to support groups of people engaged in a common goal.
In events such as conferences, congresses, and symposia, the
participants engage in tasks such as listening, asking the
turn to make questions, questioning in a disciplined and not
ecient form. This article presents a tool to assist classroom
lectures that occur at events such as conferences, congresses
and symposia. The tool enables the creation of questions
using mobile devices or personal computers. The results
showed that the tool helps participants to conduct and sup-
port questions satisfactorily.
Keywords
co-located environments; computer-supported cooperative
work; mobile groupware
RESUMO
O avanco e consolida cao da computa cao m ovel juntamente
com a conectividade dos dispositivos port ateis permitem o
desenvolvimento de novas ferramentas para apoiar grupos
de pessoas engajadas em um objetivo comum. Em even-
tos como conferencias, congressos e simposios, os partici-
pantes engajam em tarefas de escutar, solicitar a vez de
fazer perguntas e perguntar, de uma naneira disciplinada e
nao eciente. Este artigo apresenta uma ferramenta para
auxiliar palestras presenciais que ocorrem em eventos como
conferencias, congressos e simp osios. A ferramenta permite
a elabora cao de perguntas utilizando dispositivos moveis ou
computadores pessoais. Os resultados obtidos mostraram
que a ferramenta auxilia os participantes a realizar e apoiar
perguntas de maneira satisfatoria.
Palavras-chave
ambientes colocalizados; trabalho cooperativo apoiado por
computador; groupware movel
1. INTRODUO
A popularidade e desenvolvimento tecnologico dos dispos-
itivos moveis tornam possvel o desenvolvimento de novos
tipos de ferramentas que possibilitem o relacionamento de
pessoas. O avanco desses dispositivos tem colaborado com
a sua aceitacao e despertado interesse na fundamenta cao de
aplicacoes para auxiliar grupos em suas tarefas. Melhorias
como redu cao de tamanho, peso e consumo de energia e fa-
tores como portabilidade e a conectividade permitem que os
dispositivos moveis tenham melhor efetividade nas tarefas
do dia-a-dia. Lu e C. Heath [4] descrevem que esse avanco
em conjunto com as novas formas de conectividade permite
a integra cao de dispositivos moveis em aplicacoes coopera-
tivas.
Em palestras presenciais como aquelas que ocorrem em con-
ferencias, congressos e simposios, e desej avel que existam
intera coes entre os participantes. Nessas palestras, geral-
mente as interacoes sao caracterizadas pela apresentacao do
palestrante sobre um tema para um grupo de participantes
e pela sessao de perguntas e respostas. Os participantes ap-
resentam suas perguntas individualmente sobre topicos do
tema. As perguntas sao elaboradas em geral na ordem em
que e dada a palavra ao participante. O palestrante em geral
responde imediatamente apos a apresenta cao da pergunta.
O conte udo da resposta depende do conte udo da palestra
proferida e das respostas dadas ate aquele instante. Con-
tudo, por razoes de restri cao de tempo, personalidade ou
atitude dos participantes e diculdades de gestao, a sess ao
pode car comprometida. Perguntas de interesse particular
de alguns participantes podem ser feitas enquanto que per-
guntas de interesse maior podem deixar de ser realizadas.
Essas situacoes caracterizam uma perda de qualidade da
palestra e uma ineciencia no uso do tempo.
Conjectura-se que ambientes de palestras presenciais pos-
suem potencial para a utiliza cao de dispositivos m oveis para
melhorar a intera cao entre os participantes, de modo a au-
mentar a efetividade das reuni oes.
O desenvolvimento de sistemas colaborativos que empregam
dispositivos m oveis apresenta diculdades variadas. Roth
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 76 -
[6] descreve sete diculdades (comunicacao; arquitetura; co-
ordena cao; distribuicao de dados e consistencia; interfaces
do usu ario; seguranca e privacidade; e implementacao) para
a constru cao de um groupware movel. Berkenbrock et al
[2] apresentam e avaliam requisitos que ajudam projetistas
a identicar pontos fracos relacionados com a usabilidade
dos dispositivos. Esses trabalhos ainda apontam a falta de
padroniza cao e de diretrizes para projetar e avaliar sistemas
de groupware movel. Outro agravante e o tamanho pequeno
das telas dos dispositivos moveis, que diculta a realizacao
de tarefas b asicas como ler, navegar e selecionar operacoes.
Contudo, sistemas baseados em dispositivos moveis com in-
teracao social entre um grupo, ou groupware m ovel, tem sido
uteis para alguns estudos que envolvem o trabalho colabora-
tivo [1, 2, 3, 7]. Novos paradigmas de relacionamento entre
as pessoas estao surgindo, gracas ` a tecnologia m ovel e ao
uso de groupware para auxilia-los em seus trabalhos.
Em ambientes de conferencias, congressos e palestras, exis-
tem alguns problemas que podem ser tratados com o uso
de groupware movel. Este trabalho contextualiza uma fer-
ramenta que permite aos participantes desses ambientes re-
alizarem perguntas atraves de uma aplicacao executada em
dispositivos moveis. Os participantes tem acesso as pergun-
tas feitas pelos demais e podem dar apoio para aquelas que
s ao mais interessantes.
Este artigo tem como objetivo, apresentar uma ferramenta
de colabora cao m ovel para auxiliar participantes de reunioes.
De modo que, pretende-se auxiliar com o apoio da ferra-
menta da seguinte forma: (i ) melhorar a utilizacao do tempo,
podendo criar perguntas durante a apresenta cao; (ii ) permi-
tir outra forma de exposi cao das d uvidas, atraves do envio
de uma mensagem utilizando um dispositivo e nao necessari-
amente se expondo ao p ublico; (iii ) permitir a colabora cao
do p ublico para sele cao das perguntas que os participantes
tem um maior interesse; e (iv) garantir que todas as questoes
levantadas pelo grupo de participantes de uma conferencia
sejam registradas em um banco de dados para futuras con-
sultas. Assim, os participantes terao oportunidade de par-
ticipar e colaborar com o grupo para compreender o tema
da apresentacao.
O artigo esta organizado da seguinte forma. Na secao 2
fornece-se uma breve visao sobre os trabalhos relacionados.
Na Secao 3 apresenta-se o pr ototipo desenvolvido. Na Secao
4 apresenta-se o estudo de caso realizado. Na Se cao 5 apresenta-
se uma an alise dos primeiros resultados obtidos. Finalmente,
na Secao 6, apresentam-se as conclusoes e trabalhos futuros.
2. TRABALHOS RELACIONADOS
Alguns trabalhos apresentam ferramentas de colabora cao
m ovel para auxiliar grupos colocalizados, ou seja, onde os
participantes estao dispostos em um mesmo ambiente.
Em [7], Yu e Selker apresentam o Meeting Essence II, um
groupware movel que introduz um novo paradigma para reg-
istro de informacoes durante reuni oes face-a-face. Nesse tra-
balho, os eventos mais importantes que ocorrem durante a
reuniao s ao identicados e registrados pelos participantes
com um unico toque na tela do dispositivo movel. O princi-
pal objetivo da ferramenta e garantir que as principais ideias
geradas pelos participantes sejam armazenadas atraves de
uma gravacao de audio feita pelo pr oprio dispositivo, o qual
e controlado pela aplica cao. Isso permite que todos os mem-
bros da reuni ao que consideraram o assunto importante pos-
sam registra-lo, para futuras consultas. Quando a voz de um
participante est a sendo gravada e possvel que ele perceba
atraves do seu dispositivo se alguem considera a sua colo-
ca cao importante, dessa forma os participantes recebem um
feedback da sua contribuicao. A principal contribui cao da
ferramenta e permitir que cada participante dena o que e
mais importante para si, e colabore com o grupo para recu-
perar as principais informacoes discutidas.
Esponda [3] descreve um sistema Web de votacao eletronica
para estudantes em salas de aula. O groupware permite que
um professor durante uma aula ou previamente possa elab-
orar quest oes atraves de um dispositivo eletronico movel,
como PDA ou tablet, e disponibilize essas questoes para
serem respondidas pelos alunos, os quais tambem utilizam
dispositivos m oveis para responde-las. As respostas sao ar-
mazenadas em um servidor e podem ser disponibilizadas
gracamente como desejadas pelo professor. O principal ob-
jetivo da ferramenta e aumentar o nvel de participa cao dos
estudantes durante as aulas.
Em [2], Berkenbrock et al. desenvolveram um jogo de per-
guntas e respostas. Os jogadores se dividem em duas equipes,
onde o objetivo de cada jogador e conseguir o maior n umero
de pontos respondendo as questoes apresentadas a ele. A
pontuacao do jogo e dada pela soma dos pontos de cada
membro da equipe. O jogo deve ser instalado nos dispos-
itivos moveis dos indivduos participantes da atividade e o
controle de acesso `as perguntas e sincronizacao s ao feitos
utilizando um servidor. O jogo serviu como uma aplicacao
prot otipo para observar o potencial requisitos de groupware
movel, e assim, identicar pontos fracos relacionados com a
usabilidade.
Os trabalhos mencionados consideram a ideia de auxiliar
um grupo de pessoas para desenvolver determinadas tare-
fas necessarias para o grupo a partir de dispositivos moveis.
Ainda que uma das grandes vantagens da plataforma movel
seja a mobilidade dos usuarios, o foco desses trabalhos nao
foi a mobilidade, mas sim a avaliacao de aspectos como co-
operacao e coordena cao das atividades. Alem disso, a co-
municacao face-a-face predominou em todas as aplicacoes.
3. PROTTIPO DESENVOLVIDO
O Simple Question foi desenvolvido para possibilitar a co-
labora cao dos participantes de palestras, na elabora cao de
perguntas a partir de dispositivos m oveis. As perguntas re-
alizadas atraves de dispositivos portateis ou computadores
desktops sao disponibilizadas aos demais usuarios, permitindo
aos participantes, por exemplo, conhecer as perguntas a
serem feitas `a um palestrante durante uma palestra. As
tecnologias que auxiliaram o desenvolvimento da ferramenta
foram as linguagens de marcacao HTML e CSS; a linguagem
de programa cao PHP 5; e o banco de dados relacional MySQL.
O objetivo da ferramenta e auxiliar participantes de palestras,
congressos e conferencias, a realizar perguntas atraves de
dispositivos m oveis ou xos em palestras presenciais. Du-
rante a apresentacao, participantes podem submeter pergun-
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 77 -
tas ou esclarecimentos de d uvidas que ocorrem no decorrer
da apresentacao. Os participantes redigem as perguntas e
as enviam pela ferramenta.
As perguntas submetidas cam disponveis para acesso aos
demais participantes. Se um participante desejar fazer uma
pergunta que ja esta cadastrada, ele tem a opcao de apoiar
a pergunta. Cada pergunta possui um contador de partici-
pantes que e incrementado a cada apoio. E ao nal, quando
o palestrante encerrar a apresentacao do tema, a ferramenta
possibilita apresentar as perguntas em ordem decrescente de
valor de seus contadores.
Para participar da sessao colaborativa e necessario que os
participantes possuam dispositivos m oveis com acesso Wi-Fi
ou computador conectado `a rede. O dispositivo deve conter
um navegador, o qual permite abrir a aplicacao. A Figura
1(a) apresenta a janela inicial da aplica cao. A ferramenta
possui suporte para dois idiomas: ingles e portugues.
Ao entrar no sistema, o participante precisa fazer um cadas-
tro. O cadastro e util para identicar a autoria das per-
guntas. E no caso de a pergunta ser selecionada, mas nao
respondida, por desconhecimento do palestrante ou falta de
tempo durante a sessao, e possvel que o palestrante ou uma
pessoa respons avel, entre em contato com o participante
atraves do cadastro e responda a pergunta pendente. Con-
tudo, de modo a preservar a identidade dos participantes,
apenas o mediador da sessao tem acesso a identica cao dos
responsaveis pelas perguntas. Dessa forma, conjectura-se
que a n ao identicacao dos participantes incentive a realiza-
cao de perguntas por pessoas que se sintam intimidados em
fazer uma pergunta em p ublico.
Conforme apresentado na Figura 1(b), as perguntas s ao ex-
ibidas no dispositivo conforme uma lista. Sendo que, a cada
pergunta e atribudo um ttulo pelo participante, o qual e re-
sponsavel por identic a-la. Vale considerar que a pergunta
enviada por ultimo aparece no topo da lista. A lista ap-
resenta sete perguntas por vez. Isso acontece porque al-
guns navegadores para dispositivos moveis sao limitados e
nao conseguem renderizar uma grande quantidade de infor-
ma coes na janela de uma s o vez. Sendo assim, no nal da
lista existe um botao que permite visualizar as demais per-
guntas, tal como apresentado na Figura 1(c).
O acesso ao conte udo das perguntas e feito ao clicar em cima
do seu ttulo. Uma nova janela exibira o nome do autor,
o ttulo da pergunta e conte udo. Assim que o acesso da
pergunta for feito, o usuario tem a opcao de apoiar. A Figura
1(d) apresenta a janela correspondente a esta situa cao.
Ainda, atraves da janela principal e possvel saber o n umero
de questoes enviadas ate o momento e a quantidade de usu arios
conectados. Ela possui um bot ao para acesso a algumas in-
formacoes da palestra com nome da apresenta cao, nome do
palestrante, duracao prevista, entre outras. Tambem, por
meio desta janela, o participante pode: acessar a janela para
elaborar perguntas, conforme a Figura 1(e); sair da aplicacao
para voltar a pagina inicial; e e possvel atualizar a janela
atraves de um botao que sincroniza os dados sem utilizar
atualiza cao do navegador.
O mediador e a pessoa responsavel por organizar e acom-
panhar o andamento da reuniao. Ele pode utilizar um com-
putador xo, notebook, netbook ou tablet para gerenciar a
aplicacao. Atraves de uma aplicac ao integrada ao sistema
de perguntas, o mediador pode manter uma reuniao e moni-
torar as perguntas cadastradas, os apoios e a quantidade de
participantes cadastrados.
A partir da janela principal apresentada na Figura 2, o me-
diador pode criar, editar, abrir, salvar e fechar sessoes de
perguntas. Ao criar uma palestra ela e salva automatica-
mente, porem, para que o estado atual seja recuperado e
necess ario salvar a sess ao sempre que for necessario.

E pos-
svel ltrar as perguntas pelo ttulo. Essa funcionalidade se
torna interessante quando o palestrante receber um n umero
elevado de questoes.
Todas as perguntas enviadas sao listadas em ordem decres-
cente de apoios. Assim, as perguntas que estiverem no topo
da lista, representam aquelas que obtiveram o maior n umero
de apoios.
Para acessar as informacoes de uma pergunta, basta clicar
na linha corrente onde ela se encontra na tabela. Sempre que
uma pergunta nova aparecer na janela, a sua fonte aparecera
em negrito. Apos a visualizacao, a fonte deixa de ser negrito.
Isso auxilia o mediador a diferenciar as perguntas lidas, das
n ao lidas. Tambem e possvel acessar uma pergunta e marca-
la como j a respondida, ou n ao respondida. No caso das
perguntas respondidas, uma ag verde aparece ao lado da
pergunta. As n ao respondidas tem ags vermelhas.
4. ESTUDO DE CASO
O estudo de caso teve como objetivo observar a utilizacao da
ferramenta de colaboracao m ovel e a sua eciencia na sessao
de perguntas atraves da colaboracao do grupo.
4.1 Ambiente do Desenvolvimento
O ambiente de desenvolvimento e de experimento e com-
posto por 2 unidades m oveis, a saber, Palm OS 5.4.8 e
Iphone equipados com interface Wi-Fi, 13 computadores de
mesa sob Windows 7, um servidor Apache 2.2 sob Win-
dows 7 e uma infra-estrutura de rede local sem o segundo
o padrao IEEE 802.11 e rede local com o segundo o padrao
Ethernet.
A comunica cao entre cliente e servidor e feita atraves do pro-
tocolo HTTP. Por se tratar de uma aplicacao m ovel, foram
adotadas as recomendacoes pr aticas de desenvolvimento de-
scritas por Rabin e McCathieNevile [5]. N ao h a atualizacoes
autom aticas das informa coes, assim o sincronismo ocorre
quando o cliente solicita a atualizacao.
4.2 Estrutura do experimento controlado
O experimento foi realizado com 26 participantes, 20 homens
e 6 mulheres, com idades entre 20 e 26 anos (idade media
= 22.2 anos). Porem, os participantes estiveram dispostos
em grupos de dois ou tres elementos, a m de compartilhar
os recursos. Portanto, os dados aqui apresentados estao de
acordo com os representantes de cada grupo. Todos os par-
ticipantes s ao estudantes de gradua cao no curso de Tecnolo-
gia em Analise e Desenvolvimento de Sistemas da UDESC
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 78 -
Figure 1: a) Janela inicial; b) Janela principal sem rolagem; c) Janela principal com rolagem; d)Janela para
visualizar pergunta; e) Janela editar a pergunta
Figure 2: Janela Principal do Mediador
e estao cursando os periodos nais do curso. Em relacao `a
experiencia previa desses participantes com os recursos en-
volvidos no experimento, todos indicaram ja ter utilizado
um dispositivo m ovel. Tambem, dos treze representantes de
cada grupo, doze alegaram ja ter utilizado aplica coes Web
atraves de dispositivos moveis. No entanto, nenhum deles
teve oportunidade previa de utilizar algum dispositivo movel
em palestras.
Os instrumentos para coleta dos dados e avaliacao foram os
seguintes: (i ) Observacoes feitas pelos mediadores da sessao
durante os experimentos; (ii ) Logs registrados no servidor
contendo informa coes sobre os acessos e apoios as perguntas;
e (iii ) Question arios preenchidos pelos participantes.
Conforme mostrado na Figura 3(a), no ambiente do experi-
mento os participantes estao proximos uns dos outros (colo-
cated). Entretanto, apesar dos participantes estarem em
uma mesma sala, usando o seu dispositivo para acessar a
sess ao eletr onica, a orientacao era de que as perguntas fos-
sem feitas utilizando a ferramenta, sendo que cada grupo de-
veria realizar pelo menos uma pergunta e apoiar pelo menos
uma. Cada grupo cadastrou-se com o nome do representante
ou nome dos membros do grupo para participar da sessao.
4.3 Resultados Coletados
Foram realizadas duas apresentacoes de palestras com sessoes
de perguntas colaborativas. Os mediadores da sessao foram
responsaveis por fornecer as instrucoes sobre o estudo de
caso aos participantes. Antes de iniciar as tarefas moni-
toradas, cada participante preencheu o Questionario Pre-
experimento buscando identicar o perl do participante e a
sua experiencia anterior com dispositivos moveis. Apos cada
experimento monitorado, foi aplicado o Questionario P os-
experimento com o qual se busca identicar elementos de
percep cao, coerencia, compreensao das atividades e desem-
penho obtidos pelos participantes. Nesse documento tam-
bem se solicita ao participante a indicacao de sugestoes para
realiza cao de levantamento das necessidades do usuario.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 79 -
Figure 3: a) Participantes durante a palestra; b) Flagrantes das telas dos dispositivos.
Na primeira sessao doze participantes se cadastraram, seis
perguntas foram realizadas, houve um total de dez apoios
distribudos entre as seis perguntas, sendo que a mais votada
obteve quatro apoios e uma das perguntas nao obteve nen-
hum. Na segunda sess ao quatorze participantes se cadas-
traram, dez perguntas foram realizadas, trinta e quatro apoios
foram distribudos entre as perguntas, e houve duas pergun-
tas com total de apoios igual a cinco. A Figura 3(b) apre-
senta um agrante das telas dos dispositivos.
5. ANLISE DOS RESULTADOS
Nesta se cao apresentam-se as analises realizadas para obser-
var os resultados obtidos, a m de avaliar a utilizacao da
ferramenta no ambiente do estudo de caso.
O question ario aplicado ap os o experimento contem uma
serie de perguntas sobre satisfacao, percepcao e o esfor co
gasto em todas as tarefas. Alem disso, o questionario foi
utilizado para vericar se as informacoes apresentadas aos
participantes estavam coerentes com as informacoes de cada
sess ao colaborativa. Algumas das questoes sao apresentadas
na Tabela 1. Os participantes do experimento foram in-
strudos a fazer um crculo em volta do n umero que melhor
representa a sua avaliacao. Os valores para avaliacao das
respostas dos participantes foram categorizados da seguinte
forma: 1-Muito Negativo, 2-Negativo, 3-Neutro, 4-Positivo
e 5-Muito Positivo. Assim, as pontuacoes menores (1 e 2) in-
dicam que a ferramenta inui negativamente nas operacoes
enquanto que as pontuacoes maiores (4 e 5) indicam uma
inuencia positiva.
O resumo da avaliacao est a sumarizado na Tabela 2.
Para 50% dos participantes, a capacidade de utilizar o aplica-
tivo de maneira satisfatoria foi denida como Muito Posi-
tivo. Os demais participantes consideraram entrePositivo
ou Neutro.
Para avaliar a percep cao, em media, os participantes deni-
ram como Neutro os elementos presentes na janela para
identicar outros participantes e suas acoes. Nesse caso,
e importante observar que o n umero de usu arios online e
o n umero de perguntas submetidas foram as unicas formas
de identicar outros participantes na sessao. Contudo, os
participantes consideraram como Positivo o esquema de
cores apresentados para o estado das perguntas. Um partic-
ipante abordou que, o esquema de cores se assemelha a out-
ras aplicacoes que ele utiliza no dia-a-dia, como por exemplo,
aplicacoes de e-mail. Com isso, ele nao teve diculdade na
realizacao das operacoes da ferramenta.
Como o sistema e assncrono, os participantes deveriam sin-
cronizar os dados conforme achassem necessario. Os partic-
ipantes consideraram como Neutro poder acompanhar as
perguntas durante a sessao sem sincronizacao imediata dos
dados. Conforme observado pelos mediadores, em alguns
momentos da sessao os participantes permaneciam na janela
principal sem realizar nenhuma a cao. Com isso, eles nao
acompanhavam o estado corrente da sessao de perguntas.
Para elaborar as perguntas, 50% dos participantes consider-
aram Negativo a facilidade para denir uma pergunta; os
demais consideraram comoPositivoeMuito Positivo. No
entanto, para apoiar uma pergunta os participantes consid-
eraramPositivo o esquema de palavras chaves para identi-
car as perguntas. Segundo um participante, ele leu apenas
as questoes com ttulos que chamaram a sua atencao, em
relacao a apresentacao da palestra.
Conforme descrito na sessao anterior, houve uma breve ex-
plana cao sobre a ferramenta. Entretanto, os participantes
avaliaram como Positivo a facilidade de aprender a uti-
lizar o aplicativo, realizar as tarefas com a ferramenta e tam-
bem, o esfor co para realizar qualquer atividade. No entanto,
deve ser lembrado que o perl dos participantes indica que a
maioria pertence ` a area de tecnologia. Em rela cao ao nvel
de concentra cao requerido para realizar as tarefas, apenas
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 80 -
Table 1: Quest oes relacionadas com a percep cao e o esfor co durante as tarefas cooperativas.
Questao Op coes para avaliacao do usuario
1-Voce conseguiu utilizar o aplicativo de maneira satisfat oria? Pouco...1 2 3 4 5...Muito
2-As informa coes apresentadas na tela principal auxiliaram a identicar os participantes? Pouco...1 2 3 4 5...Muito
3-Voce conseguiu identicar o estado de cada pergunta pelo esquema de cores proposto? Pouco...1 2 3 4 5...Muito
4-Voce conseguiu identicar as acoes dos demais participantes? Pouco...1 2 3 4 5...Muito
5-Os ttulos elaborados pelos participantes ajudaram na selecao das perguntas de interesse? Pouco...1 2 3 4 5...Muito
6-O quao difcil foi acompanhar as perguntas sem ter sincronizacao imediata? Muito difcil..1 2 3 4 5..Muito f acil
7-Quao difcil foi elaborar as perguntas? Muito difcil..1 2 3 4 5..Muito f acil
8-O quao difcil foi utilizar o dispositivo m ovel? Muito difcil..1 2 3 4 5..Muito f acil
9-O quao difcil foi aprender a utilizar o sistema colaborativo de perguntas? Muito difcil..1 2 3 4 5..Muito f acil
10-O quao difcil foi completar as tarefas? Muito difcil..1 2 3 4 5..Muito f acil
11-O quanto de esforco as tarefas necessitaram? Muito difcil..1 2 3 4 5..Muito f acil
12-O quao difcil foi se concentrar para executar as tarefas? Muito difcil..1 2 3 4 5..Muito f acil
Table 2: Sumario da avaliacao
Requisito Questoes analisadas Comentarios
Satisfa cao 1 e respostas descritiva Os participantes declararam alto grau de satisfacao no uso da aplica cao
Os elementos de percepcao utilizados precisam ser melhorados, contudo, o
Percepcao 2, 3, 4, 5
esquema de cores proposto auxiliou na identicacao do estado das questoes
Os participantes consideraram facil utilizar a aplica cao, porem declararam que
Esfor co 6, 7, 8, 9, 10, 11, 12
os rudos e a leitura das perguntas distrairam sua aten cao
Falta de sincroniza cao prejudicou a coerencia entre as informacoes apresentadas
Coerencia respostas descritiva
aos participantes e as informacoes de cada sessao colaborativa
um participante deniu como Muito Negativo. Os demais
participantes consideraram Neutro ou Positivo. Entre-
tanto quando solicitado se houve distracoes durante o uso
da ferramenta, 50% informaram que sim. A maioria deniu
que o principal motivo foi os rudos durante a sessao. Um
dos participantes considerou que car lendo as perguntas o
distraiu de prestar aten cao na palestra. Em torno de 25%
dos participantes alegaram o uso da ferramenta impediu de
acompanhar detalhes importantes da palestra.
A avaliacao da coerencia das informa coes buscou vericar
se as informa coes apresentadas aos participantes estavam
coerentes com as informacoes de cada sessao colaborativa.
Para essa avalia cao, foi solicitado aos participantes que in-
formassem o n umero total de perguntas recebidas e a quan-
tidade de participantes que utilizavam a ferramenta durante
a sessao. Nao houve respostas coerentes. Considerando que
ocorreram duas sessoes, pode ter havido confus ao para re-
sponder essas quest oes. E conforme observado pelos medi-
adores, alguns participantes nao utilizaram com tanta fre-
q uencia a ferramenta. Deste modo, os dados nao estavam
atualizados, levando em conta que e necess ario o pr oprio
participante atualizar as informacoes da sessao.
Atraves dos resultados obtidos nos experimentos, e possvel
correlacionar a colaboracao do grupo ` a facilidade de apren-
der e utilizar a ferramenta. Em geral, os participantes ap-
resentaram conceitos positivos com relacao `a facilidade de
aprender a utilizar a ferramenta. Prova disso sao os resul-
tados com rela cao ao esforco realizado e o desempenho dos
participantes por gerar um n umero interessante de pergun-
tas e apoios. Do mesmo modo, a satisfa cao com o uso da
ferramenta tambem colaborou com o aprendizado, ja que os
participantes consideraram satisfatorio o uso da ferramenta.
No entanto, durante a utilizacao alguns detalhes impediram
total colabora cao do grupo. De modo que, a coerencia dos
dados dependia da freq uencia de utiliza cao da aplicacao e
interesse do participante. Alguns participantes se sentiram
distrados ao utilizar a ferramenta, para ler e elaborar as
perguntas.
No experimento realizado foi possvel constatar que num
primeiro momento os participantes tiveram diculdade em
entender do que realmente se tratava a ferramenta. Sendo
que, durante a primeira sessao apenas seis perguntas foram
submetidas e obtiveram dez apoios no total. No entanto, na
segunda sessao, obteve-se um aumento de 66.6% no n umero
de perguntas realizadas e 240% de aumento no n umero de
apoios. Deste modo, conforme os participantes se acostu-
maram com o uso da ferramenta, maior foi a colabora cao
entre eles.
6. CONCLUSO
O Simple Question possibilitou oferecer aos usu arios uma
nova forma de realizar perguntas. Assim, varias perguntas
podem ser feitas e apoiadas, sendo que, e possvel previ-
amente conhecer as d uvidas dos demais participantes e co-
laborar para obter uma gama de perguntas relacionadas com
o perl dos participantes.
Neste trabalho, constatou-se ainda que os participantes nao
tiveram diculdades em utilizar o groupware. O principal
esforco, segundo dados relativos com o questionario p os-
experimento foi para realizar as perguntas. Mas levando
em conta que as outras atividades nao necessitavam tanta
complexidade, a elaboracao da pergunta dependia exclusi-
vamente do entendimento do participante com relacao ao
contexto da apresentacao. A falta de concentra cao pode ter
inuenciado negativamente a palestra, ja que alguns partic-
ipantes se distraram durante o experimento.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 81 -
Em geral, a ferramenta auxiliou os participantes de um sem-
in ario a realizar e apoiar perguntas de outros participantes.
De modo que, ao nal do seminario foi possvel levantar um
n umero relativamente satisfatorio de perguntas. As pergun-
tas com mais apoios e possivelmente a com maior interesse
puderam ser apresentadas ao palestrante.
Alguns problemas identicados neste trabalho est ao em aberto
e serao endere cados futuramente. Entre as sugestoes para
trabalhos futuros destacam-se: (i ) Permitir o mediador l-
trar todas as perguntas submetidas pelos participantes, a
m de impedir que perguntas sem sentido sejam visualizadas
por todos que utilizam a ferramenta; (ii ) Atribuir novas fun-
cionalidades a ferramenta com inten cao de possibilitar os
proprios participantes responder as perguntas. Com isso,
tambem pode-se permitir que os participantes denam um
grau de satisfa cao para as respostas; (iii ) Adicionar mais
elementos de percepcao `a janela principal, a m de melho-
rar o reconhecimento do ambiente atraves dos dispositivos,
considerando que, dispositivos m oveis possuem uma janela
reduzida. Esses elementos teriam inten cao de responder per-
guntas como: O que esta acontecendo? eO que devo fazer
em seguida?; (iv) Denir uma maneira de compartilhar a
edi cao de perguntas, de modo que, um participante possa
submeter uma pergunta e outros possam complementa-la;
(v) Avaliar o desempenho para um n umero grande de partic-
ipantes, por exemplo 200 a 300 participantes; (vi ) Permitir
a hierarquiza cao ou outra forma de agrupamento da per-
guntas; (vii ) Usar sistema de multi-agente para moderacao;
e (viii ) Incluir os participantes remotos para elaboracao e
apoio as perguntas.
Agradecimentos
Ao DCC pelo disponibiliza cao da infra-estrutura computa-
cional. Aos alunos da turma A-2011/1 de TES-03 - SQL,
voluntarios por participar dos experimentos. Agradecemos
tambem aos revisores anonimos pelos comentarios e sug-
est oes durante a elaboracao e revis ao do artigo.
7. REFERENCES
[1] C. D. M. Berkenbrock and C. M. Hirata.
Implementacao e an alise de uso de uma aplicacao para
edicao cooperativa em dispositivos moveis. Sistemas
Colaborativos, Simposio Brasilerio de, 0:99110, 2008.
[2] C. D. M. Berkenbrock, C. M. Hirata, C. T. Fernandes,
and M. C. Pichiliani. Usability requirements for the
development and evaluation of mobile groupware
systems. In SBSC 09: Proceedings of the 2009
Simp osio Brasileiro de Sistemas Colaborativos, pages
1018, Washington, DC, USA, 2009. IEEE Computer
Society.
[3] M. Esponda. Electronic voting on-the-y with mobile
devices. In ITiCSE 08: Proceedings of the 13th annual
conference on Innovation and technology in computer
science education, pages 9397, New York, NY, USA,
2008. ACM.
[4] P. Lu and C. Heath. Mobility in collaboration. In
CSCW 98: Proceedings of the 1998 ACM conference
on Computer supported cooperative work, pages
305314, New York, NY, USA, 1998. ACM.
[5] J. Rabin and C. McCathieNevile. Mobile web best
practices 1.0, 2011.
[6] J. Roth. Seven challenges for developers of mobile
groupware. In IN: WORKSHOP: MOBILE AD HOC
COLLABORATION, CHI 2002, 2002.
[7] S.-J. Yu and T. Selker. Who said what when?:
capturing the important moments of a meeting. In CHI
EA 10: Proceedings of the 28th of the international
conference extended abstracts on Human factors in
computing systems, pages 32833288, New York, NY,
USA, 2010. ACM.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 82 -

S E S S O 4
Ferramentas e Desenvolvimento de
Sistemas Colaborativos
Adicionando informaes de contexto de tarefa a uma
ferramenta de chat sncrono para apoiar o
desenvolvimento distribudo de software
Ana Paula Chaves
Coord. Tecn. em Sistemas
para Internet (COINT)
UTFPR Campo Mouro - PR
anachaves@utfpr.edu.br
Igor Scaliante Wiese
Coord. Tecn. em Sistemas
para Internet (COINT)
UTFPR Campo Mouro - PR
igor@utfpr.edu.br
Igor Steinmacher
Coord. Tecn. em Sistemas
para Internet (COINT)
UTFPR Campo Mouro - PR
igorfs@utfpr.edu.br
Fabio Baia
UTFPR Campo Mouro-PR
baiacfabio@gmail.com
Edilson F. da Costa
UTFPR Campo Mouro-PR
edilsonfc@gmail.com
Karen Moreschi
UTFPR Campo Mouro-PR
karenmoreschi@gmail.com
Cicero Jupi
UTFPR Campo Mouro-PR
cicerojupi@gmail.com
Marco Aurlio Gerosa
Departamento de Cincia
da Computao(DCC-IME)
Univ. de So Paulo (USP)
gerosa@ime.usp.br
ABSTRACT
Communication is one of the challenges brought by the ap-
proach called Distributed Software Development (DSD). One
way to improve communication is to make members of a
conversation aware of other developers context. This paper
presents a synchronous chat tool to support DSD, by sharing
the developers context automatically. The tool is presented
as an Eclipse plugin, and the information shared is related
to the code piece in which the developer is working.
RESUMO
A comunicacao e um dos desaos trazidos pela abordagem
chamada Desenvolvimento Distribudo de Software (DDS).
Uma das maneiras de melhorar a comunicacao e possibili-
tar que, durante uma intera cao, os membros de uma con-
versa quem cientes do contexto da outra parte. Este artigo
apresenta uma ferramenta de chat sncrono para apoiar o
DDS, compartilhando o contexto da tarefa do desenvolve-
dor. A ferramenta e apresentada como um plugin para a IDE
Eclipse, e as informa coes compartilhadas dizem respeito ao
trecho de c odigo em que o desenvolvedor esta trabalhando.
Palavras-chave
Desenvolvimento Distribudo de Software, comunica cao, con-
texto
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for prot or commercial advantage and that copies
bear this notice and the full citation on the rst page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specic
permission and/or a fee.
Copyright 2011 ACM X-XXXXX-XX-X/XX/XX ...$10.00.
1. INTRODUO
A ind ustria de desenvolvimento de software vem utili-
zando os benefcios trazidos pelo trabalho cooperativo apoi-
ado por computador (CSCW) para obter as vantagens com-
petitivas em termos de custo, qualidade e da possibilidade de
encontrar prossionais em qualquer parte do globo [18]. Esta
abordagem, chamada Desenvolvimento Distribudo de Soft-
ware (DDS), e baseada em equipes geogracamente distantes
trabalhando colaborativamente em um projeto de software.
Entretanto, as vantagens sao acompanhadas de desaos re-
lacionados a diferencas culturais, contextuais, geogr acas,
organizacionais e polticas [13].
Dentre os desaos, destacam-se aqueles relacionados `a co-
municacao, como a distancia temporal e geograca dos de-
senvolvedores [12]. Segundo Herbsleb [11], problemas na
comunica cao em DDS podem levar a falta de percepcao e
falta de informacao sobre quem pode ajudar em uma tarefa,
ou quem e responsavel por executar uma tarefa. Isto acon-
tece porque desenvolvedores em locais diferentes de trabalho
percebem pequenas partes do contexto relacionado `as tare-
fas e ao projeto em que estao trabalhando. Com isso, eles
passam a desconhecer o contexto da tarefa dos outros mem-
bros e a disponibilidade para iniciar uma conversa. A falta
de informa cao contextual diculta o incio de uma intera-
cao, pois a necessidade de compartilhar o contexto em que
o problema ser a discutido pode tornar a comunicacao um
processo moroso, adiando a discuss ao do t opico principal.
Portanto, e necessario propor abordagens praticas para
estabelecer comunica cao a partir da percepcao do contexto
de uma tarefa. Este artigo apresenta uma ferramenta de
chat sncrono que objetiva melhorar a comunicacao por meio
do compartilhamento de informa coes contextuais da tarefa
em que o desenvolvedor est a trabalhando. Tal ferramenta e
apresentada na forma de um plugin para o ambiente de de-
senvolvimento Eclipse, evitando que o desenvolvedor neces-
site mudar o foco de atencao, e permitindo que o protocolo
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 84 -
de incio da interacao seja simplicado. As informacoes com-
partilhadas dizem respeito ao c odigo fonte em que o desen-
volvedor est a trabalhando no momento. A ferramenta est a
em fase de desenvolvimento e um experimento est a sendo
conduzido a m de avaliar seu uso.
O restante deste artigo esta estruturado da seguinte forma:
a Secao 2 discute a comunica cao em DDS e apresenta alguns
trabalhos relacionados; a Secao 3 apresenta a ferramenta de
chat sncrono proposta para apoiar desenvolvedores em ce-
narios de DDS; e a Secao 4 apresenta a conclusao deste artigo
e os trabalhos futuros.
2. REFERENCIAL TERICO
2.1 Comunicao em DDS
Membros de uma equipe de software podem colaborar de
diferentes formas, tais como: chamadas telefonicas, fax, ins-
tant messaging, videocoferencia e email. Segundo Paasiva-
ara [14], estas praticas sao utilizadas para apoiar necessida-
des de comunica cao em DDS: resolucao de problemas, cons-
tru cao de relacionamento, tomada de decisao e coordenacao.
No entanto, alguns desaos precisam ser enfrentados como
o design das ferramentas que nao facilitam sua adocao [21].
Alem disso, as ferramentas de comunicacao nao s ao aprovei-
tadas pelos desenvolvedores em alguns casos. Muitas vezes,
apesar da disponibilidade das ferramentas, os desenvolvedo-
res nao comunicam as alteracoes feitas durante o dia para
outros membros da equipe dispersos geogracamente [16],
resultando em repeticao de trabalho e desperdcio de tempo
[17].
De acordo com Cockburn [5], as pessoas nem sequer sabem
o que desejam comunicar na maioria dos casos. Assim, e im-
portante pensar em integrar ferramentas ao contexto atual
da tarefa, com o objetivo de evitar comunicacao desnecess a-
ria e minimizar o risco de informa coes serem propagadas de
forma incorreta ou incompleta.
Para Carmel et. al [3], a comunicacao sncrona pode resol-
ver falhas de comunicacao, mal-entendidos e pequenos pro-
blemas antes que se tornem maiores. Um pequeno problema
pode levar muito tempo para ser resolvido com discussoes
por meio assncrono (e.g. email), mas uma breve conversa
sncrona pode esclarecer rapidamente o problema. Assim,
a comunica cao assncrona, muitas vezes pode gerar atrasos
para a resolu cao de problemas. Como a codicacao e uma
tarefa dinamica que necessita de resolucao rapida, isto de-
manda interacao entre os envolvidos, justicando a necessi-
dade de meios sncronos para apoi a-la.
2.2 Trabalhos relacionados
Existem na literatura varias ferramentas e arquiteturas
que tem como um de seus objetivos melhorar a comunica-
cao para cen arios de DDS, como observado em [23]. Uma
ferramenta de tickertape (uma especie de barra de status
que exibe mensagens de eventos) foi introduzida em [8] para
mostrar mensagens de commits em CVS (Concurrent Ver-
sion System) para os membros de um projeto, possibilitando
que estes iniciem um chat privado ou em grupo dentro do
contexto da mensagem inserida no CVS. Communico [6]
e uma ferramenta que apresenta mecanismos de percepcao
para possibilitar que participantes vejam discussoes em an-
damento ou passadas, saibam quem esta conversando e o
nvel de conhecimento desses indivduos. Jazz [4] inclui uma
ferramenta de chat para que desenvolvedores incluam links
para transcricoes de chats anteriores e para as noticacoes
de eventos das equipes. Uma extensao da ferramenta Jazz,
chamada COFFEE [2], oferece uma ferramenta de discussao,
incorporado na IDE Eclipse, possibilita que os desenvolvedo-
res conduzam discussoes categorizadas dentro do ambiente
de desenvolvimento. EGRET [22] tambem oferece um chat
contextualizado e ferramentas de email que facilitam a inser-
cao autom atica ou manual de links naveg aveis para artefatos
relevantes nas mensagens.
Outros trabalhos ([7, 24, 1, 15]) apresentam ferramentas
de chat sncrono como parte de ambientes de DDS mais
completos, que oferecem diversas facilidades para equipes
distribudas. Porem as ferramentas de chat s ao forneci-
das na forma de instant messengers tradicionais (como o
Same-time, MSN, jabber), sem qualquer tipo de alteracao
que possa contribuir para tornar a comunica cao mais facil e
mais efetiva em ambientes de DDS.
Existem alguns outros estudos com foco na fase de codi-
ca cao, em especial para apoiar a pratica de programacao
em pares em equipes distribudas, possibilitando aos desen-
volvedores cooperar sobre um determinado trecho de codigo
([9, 20, 19, 10]). Essas ferramentas geralmente oferecem
formas dos desenvolvedores se comunicarem, exibindo seus
papeis na interacao e outras informacoes relevantes ao de-
senvolvimento em pares (como edicao sncrona de codigo e
compartilhamento de tela).
Os trabalhos apresentados apontam iniciativas para facili-
tar a comunicac ao em DDS e ate mesmo para compartilhar
o contexto em mensagens. Porem, essas iniciativas sao ge-
ralmente integradas a ambientes mais complexos, cujo foco e
mais amplo do que a comunicacao em si. Foram identicadas
outras pesquisas que tratam de mecanismos de comunicacao
para metodologias de desenvolvimento especcas, como e o
caso do XP (eXtreme Programming). No entanto, nao foram
encontrados estudos que apresentem ferramentas especcas
para comunica cao, independentes de outras funcionalidades
ou recursos, e que oferecam o compartilhamento do contexto
da intera cao de maneira simples.
3. FERRAMENTA PROPOSTA
Nesta se cao, sera apresentada a ferramenta proposta no
presente artigo. Ela consiste em um chat sncrono para de-
senvolvedores, criado como um plugin para o ambiente de
desenvolvimento Eclipse, como pode ser vericado na Fi-
gura 1. A ferramenta foi desenvolvida como uma evolu cao
ao plugin EIMP
1
, ja existente no SourceForge.
A ferramenta apresenta-se como uma View do ambiente
de desenvolvimento, e sua interface e semelhante `a de um
chat sncrono tradicional, conforme apresentado na Figura
2. Os contatos aparecem em uma lista ordenada por nome,
apresentando o status de cada um deles. Ate o momento, os
status possveis s ao desconectado (branco), ausente (ama-
relo), ocupado (vermelho) e disponvel (verde).
A principal caracterstica da ferramenta e possibilitar que,
ao iniciar as intera coes, o contexto da tarefa do desenvolve-
dor seja automaticamente compartilhado com a outra parte.
Isto e feito a partir do envio de uma mensagem autom atica
no momento em que o chat e iniciado. Essa mensagem con-
tem os nomes do projeto, da classe e do metodo (apresen-
tando o local do c odigo que esta selecionado) onde o foco
de trabalho do usu ario que iniciou a interacao esta ativo
1
http://sourceforge.net/projects/eimp
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 85 -
Figure 1: Ambiente Eclipse com a ferramenta de chat e uma mensagem contendo informac oes de contexto
enviada automaticamente
Figure 2: Apresentacao da lista de contatos e status
(Figura 1). Com essas informacoes sendo enviadas automa-
ticamente, pretende-se que haja uma economia de tempo no
incio da comunica cao. Isto deve ocorrer uma vez que sao
deixados de lado os passos iniciais do protocolo formal de
comunicacao, tornando a outra parte ciente do contexto da
tarefa em que o desenvolvedor se encontra.
Durante a conversa, e possvel solicitar o compartilha-
mento do local em que o desenvolvedor esta focado. Isto e
feito a partir de um menu pop-up, clicando na opcao Share
my context. Isto permite que, se solicitado, o desenvolve-
dor possa informar `a outra parte o local exato em que est a
trabalhando. Neste caso, se um trecho de codigo estiver
selecionado, o texto e compartilhado no chat (Figura 3).
4. CONCLUSOETRABALHOS FUTUROS
O presente artigo apresentou uma ferramenta que tem por
objetivo melhorar a comunicacao por meio do compartilha-
mento de informa coes contextuais. Tal ferramenta e apre-
Figure 3: (a) Menu popup que permite o compar-
tilhamento de contexto e (b) mensagem comparti-
lhada via chat
sentada na forma de um plugin para o ambiente de desen-
volvimento Eclipse, evitando que o desenvolvedor necessite
mudar o foco da aten cao. O compartilhamento de contexto
oferecido pela ferramenta visa, primordialmente, melhorar
a comunica cao e a coordenacao entre membros de equipes
geogracamente dispersas. Tal melhoria e obtida uma vez
que o uxo de comunica cao e iniciado por uma mensagem
padronizada, conhecida pelas partes envolvidas na conversa.
Isso possibilita que as primeiras mensagens trocadas ja di-
gam respeito `a tarefa em que os usuarios estao trabalhando,
tornando a comunica cao mais rapida e efetiva.
Atualmente a ferramenta est a em fase de desenvolvimento
e esta sendo utilizada pela equipe que realizou seu desenvol-
vimento. Est ao sendo incorporadas novas funcionalidades e
modos de apresenta cao das informacoes. Paralelo a isso, um
experimento em ambiente academico controlado esta sendo
preparado para vericar se a ferramenta atende aos obje-
tivos propostos. Ao nal do experimento, um questionario
ser a aplicado aos participantes visando descobrir os reais
benefcios e aplicacoes da ferramenta.

E importante observar que os dados compartilhados por


meio da ferramenta nao formam um conjunto exaustivo de
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 86 -
possveis informacoes contextuais. Outros dados relaciona-
dos `as tarefas do desenvolvedor podem ser utilizadas para
aumentar a percep cao dos membros da equipe sobre o tra-
balho colaborativo. Para tanto, faz-se necessario mapear as
informacoes contextuais que necessitam ser compartilhadas
para melhorar este cenario. Pretende-se, alem dos dados so-
bre o codigo propriamente dito, coletar informa coes relativas
ao relacionamento do desenvolvedor com o ambiente e com
o projeto (por exemplo, tempo de interacao com a classe,
tempo que trabalha com o projeto, quantidade de contribui-
coes etc.). Por m, pretende-se, de acordo com as informa-
coes de contexto obtidas, recomendar interacoes com outros
membros da equipe que melhor se adequem `a situa cao.
5. REFERNCIAS
[1] H. Bani-Salameh, C. Jeery, Z. Al-Sharif, and
I. Abu Doush. Integrating collaborative program
development and debugging within a virtual
environment. In Groupware: Design, Implementation,
and Use, volume 5411 of LNCS, pages 107120.
Springer Berlin, 2008.
[2] F. Belgiorno, I. Manno, G. Palmieri, and V. Scarano.
Argumentation tools in a collaborative development
environment. In Cooperative Design, Visualization,
and Engineering, volume 6240 of LNCS, pages 3946.
Springer Berlin, 2010.
[3] E. Carmel and R. Agarwal. Tactical approaches for
alleviating distance in global software development.
IEEE Software, 18(2):2229, March 2001.
[4] L.-T. Cheng, S. Hupfer, S. Ross, and J. Patterson.
Jazzing up eclipse with collaborative tools. In
Proceedings of the 2003 OOPSLA workshop on eclipse
technology eXchange, pages 4549, Anaheim,
California, 2003. ACM.
[5] H. Cockburn. Agile software development.
Addison-Wesley Professional, Boston, MA, 2002.
[6] K. Dullemond, B. van Gameren, and R. van Solingen.
Virtual open conversation spaces: Towards improved
awareness in a gse setting. pages 247256, aug. 2010.
[7] R. Duque, M. L. Rodrguez, M. V. Hurtado, C. Bravo,
and C. Rodrguez-Domnguez. Integration of
collaboration and interaction analysis mechanisms in a
concern-based architecture for groupware systems.
Science of Computer Programming, 2010.
[8] G. Fitzpatrick, P. Marshall, and A. Phillips. Cvs
integration with notication and chat: lightweight
software team collaboration. In Proceedings of the
2006 20th anniversary conference on Computer
supported cooperative work, pages 4958, Ban,
Alberta, Canada, 2006. ACM.
[9] B. Hanks. Empirical evaluation of distributed pair
programming. International Journal of Human
Computer Studies, 66(7):530544, 2008.
[10] R. Hegde and P. Dewan. Connecting programming
environments to support ad-hoc collaboration. In ASE
2008 - 23rd IEEE/ACM International Conference on
Automated Software Engineering, Proceedings, pages
178187, 2008.
[11] J. D. Herbsleb. Global software engineering: The
future of socio-technical coordination. In 2007 Future
of Software Engineering, pages 188198, Washington,
DC, USA, 2007. IEEE Computer Society.
[12] J. D. Herbsleb and D. Moitra. Guest editors
introduction: Global software development. IEEE
Software, 18:1620, 2001.
[13] M. Ivcek and T. Galinac. Aspects of quality assurance
in global software development organization. In 31st
International Convention MIPRO, pages 150155,
2008.
[14] M. Paasivaara. Communication needs, practices and
supporting structures in global inter-organizational
software development projects. 2003.
[15] V. Penichet, J. Gallud, R. Tesoriero, and M. Lozano.
Design and evaluation of a service oriented
architecture-based application to support the
collaborative edition of uml class diagrams. In
Computational Science - ICCS 2008, volume 5103 of
LNCS, pages 389398. Springer Berlin, 2008.
[16] R. Prikladnicki, J. Audy, and R. Evaristo. Distributed
software development: Toward an understanding of
the relationship between project team, users and
customers. In Proceedings of International Conference
on Enterprise Information Systems (ICEIS), Angers,
France, 2003.
[17] V. Ramesh and A. Dennis. The object-oriented team:
Lessons for virtual teams from global software
development. In System Sciences, 2002. HICSS.
Proceedings of the 35th Annual Hawaii International
Conference on, pages 212 221, 2002.
[18] M. Robinson and R. Kalakota. Oshore Outsourcing:
Business Models, ROI and Best Practices. Mivar
Press, Georgia, 2004.
[19] S. Salinger, C. Oezbek, K. Beecher, and J. Schenk.
Saros: an eclipse plug-in for distributed party
programming. In CHASE 10: Proceedings of the 2010
ICSE Workshop on Cooperative and Human Aspects
of Software Engineering, pages 4855, Cape Town,
South Africa, 2010. ACM.
[20] T. Schuemmer and S. Lukosch. Supporting the social
practices of distributed pair programming. In
Groupware: Design, Implementation, and Use, volume
5411 of LNCS, pages 8398. Springer Berlin, 2008.
[21] N. S. Shami, N. Bos, Z. Wright, S. Hoch, K. Y. Kuan,
J. Olson, and G. Olson. An experimental simulation of
multi-site software development. In Proceedings of the
2004 conference of the Centre for Advanced Studies on
Collaborative research, pages 255266, Markham,
Ontario, Canada, 2004. IBM Press.
[22] V. Sinha, B. Sengupta, and S. Chandra. Enabling
collaboration in distributed requirements
management. IEEE Software, 23(5):5261, 2006.
[23] I. Steinmacher, A. P. Chaves, and M. A. Gerosa.
Awareness support in global software development: a
systematic review based on the 3c collaboration
model. In 16th international conference on
Collaboration and technology, CRIWG10, pages
185201, Berlin, 2010. Springer-Verlag.
[24] M.-A. D. Storey, D.

Cubranic, and D. M. German. On
the use of visualization to support awareness of human
activities in software development: a survey and a
framework. In Proceedings of the 2005 ACM
symposium on Software visualization, pages 193202,
St. Louis, Missouri, 2005. ACM.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 87 -
Desenvolvimento e Implantao de uma Ferramenta de
Apoio a Reunies Presenciais
Daniel Catarino Biscalchin
Instituto de Computao/UNICAMP
Campinas, Brasil
Bolsista do CNPq - Brasil
danielbiscalchin@gmail.com
Jacques Wainer
Insitituto de Computaao/UNICAMP
Campinas, Brasil
wainer@ic.unicamp.br
ABSTRACT
Meetings play an important role within organizations, and
they are the means by which many decisions are taken. Al-
lowing participants to contribute in a satisfactory manner, as
well as keep costs (of time and money) low are challenges to
meeting organizers. Technology seeks to make this task eas-
ier through meeting support systems (meetingware), which
provide the means to improve the interaction between par-
ticipants and the use of resources. In this work, we devel-
oped a software for supporting face to face meetings based
on Roberts Rules of Order, rules created in the nineteenth
century and used to direct formal meetings in various or-
ganizations. The software provides features designed to en-
hance the progress of meetings and interaction of its partici-
pants, as the result of automating administrative tasks such
as preparation of the minutes. Currently, the system has a
version developed and is being used by the Congregation of
the Computing Institute at UNICAMP. Data collected from
meetings using the software will be confronted with data al-
ready obtained before the use of the system. In addition,
after implantation questionnaires will be used to assess user
satisfaction.
RESUMO
Reunioes desempenham um importante papel dentro de or-
ganiza coes, sendo o meio pelo qual s ao tomadas diversas de-
cisoes. Permitir que seus participantes contribuam de forma
satisfatoria, assim como evitar que seus custos (tempo e din-
heiro) sejam maiores que o necess ario s ao desaos de seus
organizadores. A tecnologia busca tornar esta tarefa mais
facil atraves de sistemas para suporte a reunioes (meeting-
ware), que fornecem meios para melhorar a interacao entre
os participantes e o aproveitamento dos recursos utilizados.
Neste trabalho, desenvolvemos um software para suporte a
reunioes presenciais baseadas nas Roberts Rules of Order,
regras criadas no seculo XIX e usadas para direcionar re-
unioes formais em varias organizacoes. A ferramenta fornece
recursos que visam aprimorar o andamento de reunioes e
a intera cao de seus participantes, assim como automatizar
tarefas burocraticas resultantes desta, como a elabora cao da
ata. Atualmente, o sistema possui um versao desenvolvida e
est a em fase de implantacao nas reunioes da Congregacao do
Instituto de Computa cao. Dados coletados das reunioes uti-
lizando o software serao confrontados com dados ja obtidos
antes de sua implantacao, como os tempos despendidos com
os itens da pauta. Alem disso, ap os a implanta cao ser ao uti-
lizados questionarios para avaliar a satisfacao dos usuarios.
Categories and Subject Descriptors
H.4.1 [INFORMATION SYSTEMS APPLICATIONS]:
Groupware; H.5.3 [INFORMATION INTERFACES AND
PRESENTATION]: Group and Organization Interfaces
General Terms
Experimentation
Keywords
Meetingware, design, avaliacao
1. INTRODUO
Reunioes sao essenciais para organiza coes, pois, por meio de-
las, sao tomadas importantes decis oes e feitos planejamen-
tos. No entanto, elas podem ter um custo elevado para a
empresa, uma vez que, se mal conduzidas, acarretam em um
grande desperdcio de tempo e dinheiro. A tecnologia pode
contribuir para o aumento da eciencia das reunioes, ou seja,
para que elas ocorram em menos tempo e que todos os par-
ticipantes cumpram seus papeis de forma satisfat oria e, por
isso, cada vez mais empresas e pesquisadores tem se interes-
sado por sistemas de suporte a reunioes (ou meetingware),
alguns dos quais sao voltados a reunioes ` a dist ancia po-
dendo possuir recursos de vdeo conferencia ou, ate mesmo,
gracos 3D enquanto outros tem como foco as reuni oes
presenciais (caso da ferramenta proposta neste projeto).
Desde o nal da decada de 1980, diversas pesquisas foram
realizadas para desenvolver sistemas capazes de tornar re-
unioes mais ecientes e, tambem, para avaliar tais sistemas
quanto `a satisfacao dos usu arios. Em 1991, o artigo [6]
propos o termo electronic meeting system (ou apenas EMS)
para referir-se a sistemas computacionais com o prop osito
de melhorar os processos de reunioes. Alem disso, neste
mesmo artigo, os autores contam que desenvolveram uma
variedade de softwares com este proposito, os quais foram
testados por milhares de indivduos. Ao nal do projeto, os
autores identicaram alguns aspectos importantes no pro-
jeto de EMS e concluram que tais sistemas, podem, em
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 88 -
muitas situacoes, contribuir para a melhora do processo, mas
reconheceram a necessidade de pesquisa posterior. Desde en-
tao, mais pesquisadores interessaram-se pelo assunto e mais
pesquisa foi desenvolvida com o intuito de reconhecer qual-
idades importantes neste tipo de software, e tambem, para
desenvolver metodos ecientes de avaliac ao dos mesmos. A
referencia [1] busca identicar tais aspectos relevantes destes
softwares e apresentar modelos para inserir estas caracters-
ticas no software. Ja as referencias [7, 5, 2] tem o seu foco
na avalia cao das ferramentas.
A avaliacao de ferramentas colaborativas e um assunto com-
plexo [7, 5, 2], pois ha varias dimens oes a serem avaliadas.
Na dimensao pessoal, os usuarios devemgostarousentirem-
se a vontade em usar o software [3]. Nesta dimensao, as
questoes de usabilidade do software colaborativo nao s ao
diferentes das de um software comum. Numa segunda di-
mensao, um software colaborativo deve facilitar a execucao
de uma atividade colaborativa, nesse caso uma reuniao [4,
8]. Desta forma, o software deve trazer ganhos para os
objetivos da atividade colaborativa. No caso de reunioes,
ha varios objetivos: decis oes mais corretas, menor tempo
gasto na reuniao, explora cao melhor das alternativas, medi-
acao de diferentes pontos de vista, difusao de tensoes, etc.
Finalmente, a outra dimens ao relevante para a avaliacao de
ferramentas colaborativas e a melhoria ou a manutencao do
ambiente social do grupo.
O software desenvolvido neste projeto tem como foco as re-
unioes presenciais baseadas nas Roberts Rules of Order,
usadas para direcionar reunioes formais em varias organi-
zac oes. Acreditamos que o fato de nossa ferramenta ser
baseada nestas regras representa um diferencial para a mesma,
ja que a maioria das ferramentas para suporte eletronico a
reunioes desenvolvidas ate hoje seguem um prototipo em que
os participantes interagem a maior parte do tempo atraves
do software, perdendo, assim, um pouco do car ater presen-
cial da reuni ao.
Outro aspecto importante da ferramenta desenvolvida e que
ela visa nao apenas a melhorar o andamento de reuni oes,
como tambem `a automatiza cao de tarefas burocraticas apos
seu termino, ja que estas tarefas tambem demandam bas-
tante tempo, embora muitas vezes esse custo nao receba a
devida atencao. O software pode preencher informacoes co-
muns a diversas atas, como hor arios de incio e termino,
assuntos debatidos e resultados de votacoes, cabendo a um
usu ario humano apenas a tarefa de preencher alguns poucos
dados.
Apos o desenvolvimento do software, ocorre sua implantacao
em reuni oes reais. Entao, tem incio a fase de avaliacao, na
qual, atraves de metodos quantitativos e qualitativos, veri-
camos a ecacia da ferramenta proposta. Esta ecacia deve
levar em consideracao n ao apenas medidas como tempo de
duracao das reunioes, mas tambem a satisfac ao dos usu arios
e a qualidade de suas intervencoes nas reunioes.
2. MTODOS
2.1 Desenvolvimento
A aplicacao Web proposta foi desenvolvida dentro do paradigma
de Orientac ao a Objetos, buscando representar de forma
modular aspectos importantes deste tipo de software, assim
como em [1]. Dentre os principais componentes represen-
tados no software, estao os recursos da reuniao (pauta, ata,
etc.), papeis dos participantes e as etapas da reuniao (etapas
do processo).
Os papeis envolvidos no tipo de reuniao abordado sao presi-
dente, secret aria e participante ativo. O primeiro representa
a gura do lder, coordenando o andamento da reuni ao e,
em casos excepcionais, tomando decisoes relativas ao seu
rumo; o segundo, e respons avel por tomar nota dos acon-
tecimentos, alem de elaborar tanto a pauta, quanto a ata;
ja o terceiro corresponde `aqueles que participam ativamente
da reuni ao, agregando informacoes atraves de intervencoes,
como coment arios e votos.
Como foi dito, as reuni oes em questao seguem regras con-
hecidas como Roberts Rules of Order. Este tipo de reuniao
e dividido em tres grandes etapas: Ata da Reuniao, Expe-
diente e Ordem do Dia. Estas etapas ocorrem nesta ordem
durante a reuni ao e estao claramente indicadas na pauta,
cada uma contendo seus pr oprios itens.
Na Ata da Reuni ao, sao aprovadas atas de reunioes anteri-
ores. Nesta etapa, cada ata corresponde a um item na pauta
e os participantes podem intervir sugerindo modicacoes ou
corre coes. Caso uma ata n ao seja aprovada, ela sera sub-
metida ` a aprovacao novamente, na reuniao seguinte, ap os
terem sido feitas as modicacoes necess arias.
Durante o Expediente, sao discutidos assuntos relevantes
para a congrega cao que n ao precisam ser submetidos ` a votacao.
Normalmente, o presidente inicia esta etapa passando alguns
informes e, entao, os demais participantes tambem podem
expressar sobre os assuntos.
Ja a Ordem do Dia inicia-se com o destaque de seus itens.
Tanto a mesa, representada pela gura do presidente, quanto
os demais participantes podem selecionar itens da Ordem do
Dia para que estes sejam submetidos a uma apreciacao antes
de serem votados. Os itens nao destacados s ao votados em
bloco logo em seguida, enquanto os outros sao discutidos e
votados seguindo a sequencia da pauta.
Para o desenvolvimento do software, utilizou-se a linguagem
de programa cao Python, juntamente do framework Cher-
ryPy, escrito nesta mesma linguagem, para executar a l ogica
do servidor. A interface Web baseou-se em HTML, CSS e
JavaScript, tambem responsavel pela logica do cliente. Para
cria cao da interface tambem foi utilizada a linguagem Gen-
shi, para criacao de templates.
2.2 Implantao e Avaliao
A implanta cao do sistema nas reunioes da congrega cao do
Instituto de Computacao da UNICAMP teve incio em abril
de 2011. Futuramente, o sistema ser a avaliado atraves de
analises quantitativas e qualitativas.
Para a analise quantitativa, serao obtidos os valores de di-
versos parametros ao longo de varias reuni oes e, entao, estes
valores serao comparados com aqueles referentes ao perodo
anterior ` a utiliza cao da aplica cao. Dentre estes parametros,
est a o tempo medio de dura cao dos itens da pauta. Com
o ac umulo de varias reuni oes, podemos comparar estes val-
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 89 -
ores para avaliar se o software torna o processo mais rapido.
Alem deste, outros parametros como o n umero e o tempo
das intervencoes tambem podem ser analisado.
J a a analise qualitativa ser a feita atraves do preenchimento
de questionarios pelos usuarios, de forma a obter uma me-
dida da satisfacao dos mesmos. Esta avalia cao e importante
para estimar parametros subjetivos, como a qualidade das
intervencoes feitas.
3. O QUE J FOI FEITO
Atualmente, ha uma versao do sistema em funcionamento
nas reunioes da Congregacao do Instituto de Computacao,
que ocorrem mensalmente. Esta versao permite que os usuarios
entrem e saiam da la para falar atraves do computador.
Alem disso, tanto as votacoes como os destaques (no incio
da Ordem do Dia) s ao feitos atraves da aplicacao. Tam-
bem e apresentado um cr onometro ao participante que fala
e ao presidente da reuniao, para que ambos possam contro-
lar melhor a utilizacao do tempo. Apos a reuniao, uma ata
resumida e gerada, sendo necessario apenas que a secretaria
preencha alguns detalhes.
A ata resumida e gerada com base em varios logs armazena-
dos pelo sistema durante a reuniao. O software grava infor-
ma coes referentes ao momento de chegada e sada de partic-
ipantes, ao andamento do processo, `a evolucao da la para
falar, alem, e claro, dos votos e destaques. Estes dados tam-
bem poderao ser utilizados para a avalia cao do sistema.
A implanta cao do sistema tem sido bem recebida pelos usuarios,
sendo que v arios, inclusive, sugeriram modicacoes. Mesmo
aqueles que apresentavam certa desconanca mostraram-se
satisfeitos com as novas possibilidades de interacao, como
acompanhar, atraves do computador, as decisoes (votos, destaques,
etc.) dos outros participantes.
J a dando incio `a etapa de avaliacao, foram obtidos os au-
dios de todas as reunioes realizadas durante o ano de 2010
para medir os tempos gastos em determinados eventos das
reunioes. Os tempos medios gastos nos itens de cada uma
das etapas (Ata da Reuni ao, Expediente e Ordem do Dia)
ja foram calculados e serao usados para comparacao com
dados obtidos ap os a implanta cao do sistema. Arquivos de
audio muito antigos nao foram utilizados porque o formato
das reunioes era diferente do atual, o que comprometeria a
avalia cao do sistema.
4. ETAPAS FUTURAS
Embora o desenvolvimento da versao inicial do software es-
teja completo, ainda estao sendo feitos varios aprimoramen-
tos. Em breve, com uma versao mais madura, planejamos
elaborar um question ario de satisfa cao a ser respondido pe-
los usu arios. Posteriormente, para termos uma compreensao
quantitativa dos objetivos alcancados pela aplicacao, fare-
mos um experimento comparando o tempo medio gasto por
item antes e depois de sua implantacao. Ja possumos varias
medidas anteriores `a implanta cao, porem, para fazer uma
comparacao adequada, ainda e necess ario acumular mais
medidas ap os a implantacao.
Nossas espectativas para a avaliacao s ao de que as funcional-
idades implementadas contribuam para a diminuicao da du-
racao das reunioes, assim como o aumento da satisfa cao dos
usu arios. Esta hip otese baseia-se, principalmente, em duas
funcionalidades relacionadas `as discussoes: o cron ometro e
a la.
O cron ometro e mostrado a um participante no momento
em que este comeca a falar. Apesar de nao limitar o tempo
permitido de fala, ja que e competencia do presidente encer-
rar a fala de um participante, acreditamos que a exibicao
do cron ometro sirva como um alerta. Assim, ao notar que
bastante tempo transcorreu, um participante pode apressar-
se para encerrar sua fala. Alem disso, ao ver que o tempo
de um participante ultrapassou um limite, o presidente da
reuniao pode solicitar que este conclua seu raciocnio.
Por outro lado, a la tambem dever a contribuir para a diminui cao
da duracao da reuni ao, porem de duas formas distintas. A
primeira delas e que, ao ver na la que sua vez de falar esta
aproximando-se, um participante pode preparar sua fala an-
tecipadamente. Desta forma e prov avel que, quando inciar
sua fala, o participante tenha maior facilidade para desen-
volver seu raciocnio, o que, possivelmente, diminuiria seu
tempo de fala. J a a segunda contribui cao estaria relacionada
ao tamanho da la. Acreditamos que o fato de a la es-
tar sendo exibida constantemente, desistimularia os partici-
pantes a entrar na la quando esta estivesse muito grande.
Isto contribuiria para a agiliza cao da reuni ao, uma vez que
menos participantes falariam.
5. AGRADECIMENTOS
Aos membros da Congregacao do Instituto de Computa cao,
que aceitaram utilizar o sistema, e aos funcion arios respon-
s aveis pela organiza cao das reunioes, pelo apoio na implan-
tac ao.
6. REFERENCES
[1] P. Antunes, L. Carri co, L. Laboratorio, S. I. Gr,
E. Escala, and D. D. Informatica. Modeling the
information structures of meetingware. In In Proc. of
Workshop de Sistemas de Informao Multimdia e
Cooperativos (COOP-MEDIA03, 2003.
[2] P. Antunes and C. J. Costa. Perceived value: A
low-cost approach to evaluate meetingware. In J. Favela
and D. Decouchant, editors, CRIWG, volume 2806 of
Lecture Notes in Computer Science, pages 109125.
Springer, 2003.
[3] C. Gutwin and S. Greenberg. The mechanics of
collaboration: Developing low cost usability evaluation
methods for shared workspaces. In WETICE, pages
98103. IEEE Computer Society, 2000.
[4] S. R. Haynes, S. Purao, and A. L. Skattebo. Situating
evaluation in scenarios of use. In J. D. Herbsleb and
G. M. Olson, editors, CSCW, pages 92101. ACM,
2004.
[5] V. Herskovic, J. A. Pino, S. F. Ochoa, and P. Antunes.
Evaluation methods for groupware systems. In
CRIWG07, pages 328336, 2007.
[6] J. F. Nunamaker, A. R. Dennis, J. S. Valacich, D. R.
Vogel, and J. F. George. Electronic meeting systems to
support group work. Commun. ACM, 34(7):4061,
1991.
[7] W. M. Post, M. H. in t Veld, and S. A. A. V. D.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 90 -
Boogaard. Evaluating meeting support tools. Personal
and Ubiquitous Computing, pages 223235, 2008.
[8] O. Stiemerling and A. B. Cremers. The use of
cooperation scenarios in the design and evaluation of a
cscw system. IEEE Trans. Software Eng.,
24(12):11711181, 1998.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 91 -
Ambientes eParticipativos sob a tica do modelo 3C de
colaborao
Cleyton Slaviero
Instituto de Computao -
Universidade Federal Fluminense
Rua Passo da Ptria, 156 Bloco E
So Domingos Niteri, RJ - Brasil
cslaviero@ic.uff.br
Ana Cristina Bicharra Garcia
Instituto de Computao -
Universidade Federal Fluminense
Rua Passo da Ptria, 156 Bloco E
So Domingos Niteri, RJ - Brasil
bicharra@ic.uff.br
Cristiano Maciel
Instituto de Computao
Universidade Federal de Mato
Grosso
Av. Fernando Corra da Costa, n
2367 - Bairro Boa Esperana. Cuiab
- MT
cmaciel@ufmt.br
RESUMO
A participao online dos cidados em assuntos polticos
realizada com o uso das Tecnologias de Informao e
Comunicao, como chats, fruns de discusso, ferramentas de
votao, entre outros. Cidados so chamados a interagir entre si
e com o governo para discutir e deliberar sobre assuntos
realizando diversas atividades, formando ambientes de
eParticipao. notvel que estas atividades se assemelham
quelas realizadas em ambientes colaborativos. No entanto,
pesquisas em eParticipao que versam sobre o aspecto
colaborativo na eParticipao so escassas. Neste artigo,
apresentamos as atividades de eParticipao sob a tica do
modelo 3C de colaborao, classificando estas atividades em
coordenao, comunicao e colaborao, a fim de evidenciar
que um ambiente de eParticipao possui caractersticas de
sistemas colaborativos, chamando a ateno para investigaes
que relacionem estas duas reas.
Categories and Subject Descriptors
H.5.3. [Group and Organization Interfaces] Collaborative
Computing
General Terms
Design, Human Factors, Theory.
Keywords
eParticipao, Modelo 3C de colaborao, sistemas
colaborativos, ambientes de eParticipao.
1. INTRODUO
A participao dos cidados em assuntos de cunho
governamental importante tanto para governo quanto para o
cidado. O cidado tem maior contato com assuntos de seu
interesse e tem sua voz ouvida, podendo opinar e votar demandas
que influenciem a sociedade. O governo capaz de ouvir estes
cidados e adaptar estas demandas para trazer benefcios para a
sociedade.
Embora participar seja importante, os cidados podem enfrentar
obstculos na tentativa de ter sua voz ouvida pelo governo. Estes
obstculos podem ser: fsicos, quando os cidados tm, por
exemplo, que se deslocar para participar; temporais, quando
estes precisam reservar um tempo para discutir um assunto e
chegar a um consenso; ou cognitivos, quando estes cidados
precisam memorizar e argumentar sobre um elevado nmero de
informaes para realizar estas discusses. O advento das
tecnologias de informao e comunicao, em especial a internet,
permitiu a reduo da distncia entre os cidados e o governo. A
utilizao de ferramentas para participao eletrnica, conhecido
como eParticipao, como chats, blogs, fruns, ferramentas de
votao, entre outras, possibilitou a interao, troca de opinies e
deliberao sobre assuntos de seu interesse entre os cidados
[1][14].
As ferramentas utilizadas para promover as interaes cidado
para cidado (Citizen to Citizen - C2C) e governo para cidado (
Government to Citizen - G2C) tambm so ferramentas onde a
colaborao necessria, a fim de atingir um objetivo comum.
Cidados implcita ou explicitamente formam grupos para trocar
informaes e cooperam entre si para tomar decises, enquanto o
governo pode atuar na coordenao da eParticipao. Alm disto,
estes desempenham vrias atividades durante sua participao,
as quais podem variar de acordo com a iniciativa e ferramentas
utilizadas [2].
Alguns autores versam sobre a colaborao como um dos
aspectos relevantes para promover a participao, como em
Wang e French [3]. No entanto, pesquisas em eParticipao
relacionadas sistemas colaborativos, quando existentes, no
possuem um referencial terico fundamentado nesta rea.
reconhecido que a participao online pode ser descrita como um
tipo de sistema colaborativo, tendo em vista o interesse em
investigaes neste sentido [4]. Todavia, o motivo de poucas
anlises sobre os aspectos mencionados pode estar relacionado
com a falta de compreenso sobre como e em que momento
adicionar o elemento multidisciplinar em eParticipao.
O modelo 3C de colaborao, originalmente proposto por Ellis et
al. [12], uma referncia em sistemas colaborativos, sendo
utilizada em diversos domnios para representar a colaborao
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, or
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSC11, 57 Outubro, 2011, Paraty, RJ, Brazil.
Copyright 2011 ACM $10.00.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 92 -
[5]. Este modelo divide a colaborao em 3 aspectos:
comunicao, cooperao e coordenao.
Com vistas a facilitar o entendimento das semelhanas entre
sistemas colaborativos e eParticipao, este artigo apresenta uma
anlise do ponto de vista de sistemas colaborativos sobre
ambientes de eParticipao. Classificamos as atividades
realizadas por governo e cidados em ambientes de eParticipao
de acordo com cada eixo do modelo 3C de colaborao [5]. Alm
disso, apresentamos um conjunto de pesquisas de sistemas
colaborativos que podem ser exploradas em eParticipao.
O artigo se divide da seguinte forma: aps a introduo,
descrevemos a rea de eParticipao, os interessados e as
atividades presentes nesta. Em seguida descrevemos rapidamente
o motivo da escolha do modelo 3C de colaborao. Na prxima
seo apresentamos a categorizao proposta e por fim,
discutimos as implicaes do uso de abordagens de sistemas
colaborativos em pesquisas de eParticipao.
2. EPARTICIPAO
A eParticipao uma rea de pesquisa em governo eletrnico
que investiga a utilizao das Tecnologias de Informao e
Comunicao (TIC) para suportar e auxiliar a promover a
participao dos cidados em demandas democrticas [6]. J [7]
descreve a eParticipao como um termo hbrido, que relaciona
diversas reas, das cincias sociais computao, pelo estudo
das ferramentas de eParticipao, e cincia da informao,
estudando como dados e conhecimento so produzidos e
distribudos. Para [8], a eParticipao, ou participao eletrnica,
maximiza as possibilidades da democracia, proporcionando uma
outra forma dos cidados participarem da vida pblica.
Os principais interessados na eParticipao so os cidados e o
governo. Sob a perspectiva do governo esto representantes
eleitos, responsveis pela implementao das polticas pblicas,
criadores de polticas, entre outros. Sob a perspectiva do cidado
esto representantes civis, organizaes no-governamentais,
empresas e os prprios cidados agindo individualmente [6].
Para que estes e outros interessados possam participar e interagir
eletronicamente, so utilizadas TIC como blogs, chats, fruns de
discusso, enquetes, entre outras ferramentas [1][8]. Estas
ferramentas so selecionadas de acordo com a inteno da
eParticipao e os resultados esperados pelos interessados nela.
Com estas ferramentas cidados realizam diversas atividades
rumo a um interesse determinado pelo contexto da participao.
No h um consenso sobre a nomenclatura destas atividades.
Entretanto, possvel analisar que estas so similares em sua
descrio. Em [9], so descritas as seguintes atividades de
eParticipao, as quais usam as TIC para:
Fornecimento de informaes estruturar, armazenar e
gerenciar informao no contexto da participao;
Comunidades virtuais fortalecer a formao de
comunidades;
Consulta contribuio das agncias pblicas ou privadas
com opinies em assuntos especficos;
Campanha criar iniciativas coletivas, como peties,
protestos, lobby, entre outros;
Eleitorado auxiliar a promoo de campanhas polticas;
Deliberao discutir demandas por cidados;
Discurso TIC sendo utilizadas para promover a conversa
entre cidados e polticos eleitos;
Mediao TIC utilizadas para resolver conflitos em um
contexto online;
Planejamento espacial TIC para planejamento urbano e
avaliao ambiental;
Pesquisa de opinio- TIC utilizadas para analisar a opinio
pblica sobre um assunto;
Votao TIC no contexto de votaes pblicas.
Saebo, Rose e Flak [6] tambm apresentam como mais
proeminente atividades de eParticipao as atividades de
eVotao, discurso poltico online, tomada de deciso online,
eAtivismo, eConsulta, eCampanha e ePetio. Embora tratados
por nomes diferentes, estes esto respectivamente relacionados
com as reas de Votao, Discurso, Deliberao, Comunidades
Virtuais, Consulta, Eleitorado e Pesquisa de opinio. Assim
como [10] apresenta uma anlise sobre iniciativas europias
sobre cada um destes tipos de atividades, Maciel, Roque e Garcia
[8] apresentam exemplos de iniciativas internacionais e nacionais
relacionadas a algumas das atividades acima apresentadas, com
vistas a identificar a formao de comunidades virtuais para
eDemocracia.
Estas diferentes iniciativas de eParticipao ainda podem ser
categorizadas de acordo com o nvel de engajamento dos
cidados, como apresentado pela IA2P [11]. Muitas vezes, nestas
iniciativas, no h uma integrao destas TIC, sendo
selecionadas sem um critrio especfico [1] [2]. Em outros casos,
os cidados utilizam TICs externas para discusso, pois no
existe um ambiente prprio para eParticipao. Esta falta de
critrio e a disperso das opinies por mltiplas ferramentas
pode dificultar o acompanhamento das opinies pelos cidados e
pelo governo [14].
Neste sentido, pesquisas investigam mtodos, teorias e modelos
para compreender e representar a eParticipao de modo a
estabelecer um processo para criao de ambientes de
eParticipao efetivos. Phang e Kankahalli [1] analisam as TIC
utilizadas para eParticipao, evidenciando a necessidade de um
processo de seleo destas para o sucesso da eParticipao.
Slaviero, Garcia e Maciel [1] propem uma soluo para a
construo de processos e ambientes de eParticipao sob a tica
do projetista destes processos. Nesta viso, considerada a
utilizao de uma ontologia para representar o domnio, modelos
de processos para modelar os processos de eParticipao em si,
alm das TIC e principalmente o relacionamento entre estas e os
mtodos de participao pblica.
2.1 O MODELO 3C DE COLABORAO
Um sistema colaborativo pode ser descrito sob trs aspectos na
interao entre usurios: comunicao, coordenao e cooperao
entre os usurios. Estas trs caractersticas so descritas por Ellis
et al. [12] em seu artigo. Esta representao, chamada de Modelo
3C de colaborao, uma referncia nesta rea de pesquisa,
sendo utilizada em diversos domnios [5][15].
De acordo com [5], este modelo utilizado principalmente para
classificar sistemas colaborativos, mas os mesmos autores j
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 93 -
passam a considerar o uso do mesmo para anlise de um
domnio, como o de ferramentas de groupware.
A escolha desta representao se deu pela sua abrangncia com
relao s caractersticas de sistemas colaborativos, o que pode
auxiliar na construo de investigaes em outras reas de
pesquisa.
3. O MODELO 3C EM EPARTICIPAO
Como descrito previamente, as atividades utilizam distintas TIC
para promover a eParticipao. Embora estas nem sempre sejam
escolhidas seguindo um critrio especfico, elas acabam sendo
utilizadas para atingir um determinado objetivo para cada uma
destas atividades. Considerando as interaes e tarefas presentes
em cada uma destas atividades, vamos definir quais delas
possuem elementos de comunicao, cooperao e coordenao.
Realizamos esta categorizao tomando como base o modelo 3C
de colaborao, com o objetivo de analisar quais dos trs
aspectos so mais relevantes para cada uma das atividades. No
entanto, a diviso no considera que uma rea no contenha
outros aspectos do modelo de colaborao, mas leva em conta
qual destes aspectos so mais presentes e necessrios em cada
atividade. Utilizamos o conjunto de atividades de eParticipao
descritas em [4] por abrangerem praticamente todos os aspectos
da eParticipao, sendo comumente utilizadas em pesquisas que
necessitam da descrio destas atividades de eParticipao
[1][[10]
3.1 Comunicao
No modelo 3C, a comunicao diz respeito troca de
informaes entre usurios, com um objetivo em comum [5].
Essa comunicao pode ser sncrona ou assncrona. Em
eParticipao, consideramos que as atividades de Fornecimento
de informaes, Comunidades Virtuais, Campanha, Deliberao,
Discurso, Mediao e Planejamento Espacial so atividades de
demandam a comunicao, seja entre cidados ou entre cidados
e governo. As atividades de Consulta, Eleitorado, Pesquisa de
opinio e Votao no dependem diretamente da comunicao
entre as partes para serem executadas, e por este motivo so
desconsideradas como pertencentes a este eixo.
3.2 Coordenao
A coordenao envolve a garantia do cumprimento das atividades
por meio de mecanismos de coordenao, com esta coordenao
sendo realizada seguindo um protocolo social ou mecanismos
complexos [5]. Em um ambiente de eParticipao, a coordenao
pode ser realizada tanto pelo governo quanto pelo cidado. Em
[14], por exemplo, os cidados podem atuar como moderadores
das opinies, inserindo ressalvas se necessrio, auxiliando desta
forma na organizao do ambiente de discusso. O governo o
responsvel por receber os relatrios da eParticipao e tomar
uma deciso, que pode ser ratificar ou retificar o que foi decidido
pelos cidados. Apesar da democracia pressupor que as
demandas venham do povo [14], o governo pode coordenar a
sistematizao destes processos, com vistas a dar o feedback das
aes tomadas em prol da melhoria pblica. Consideramos que
todas as atividades dependem de uma coordenao, seja do
governo, com o intuito de convidar os participantes e divulgar os
resultados da participao, ou ento dos cidados, como
moderadores, como descrito anteriormente.
3.3 Cooperao
A cooperao em um sistema colaborativo descrita como a
operao conjunta em um espao, a fim de atingir um objetivo
comum [5]. Na eParticipao, a cooperao pode estar presente
nos momentos em que cidados devem discutir questes em
conjunto buscando solues, como nas atividades de
comunidades virtuais, campanhas e principalmente deliberao,
ou at mesmo a cooperao espontnea que emerge nas redes
sociais, em funo de campanhas sociais e de movimentos
polticos, por exemplo, com alto ndice de participao. Sem a
cooperao entre os cidados, os objetivos das atividades podem
no ser atingidos, prejudicando a participao como um todo.
A Tabela 1 apresenta de forma resumida a relao entre aspectos
do modelo 3C de colaborao e as atividades de eParticipao
descritos anteriormente.
Tabela 1. Relao entre eixos do modelo 3C e as
atividades/reas de eParticipao.
Modelo 3C Iniciativas de eParticipao
Comunicao
(sncrona)
Fornecimento de informaes
Comunidades virtuais
Campanha
Deliberao
Discurso
Mediao
Planejamento Espacial
Coordenao Fornecimento de informaes
Comunidades virtuais
Consulta
Campanha
Eleitorado
Deliberao
Mediao
Pesquisa de opinio
Votao
Cooperao Comunidades virtuais
Campanha
Deliberao
4. DISCUSSO
O presente trabalho teve por objetivo colocar uma nova viso
sobre a eParticipao, considerando a aplicao de uma
abordagem sob a tica do modelo 3C de forma a auxiliar novas
pesquisas em eParticipao, apresentando sob quais aspectos da
colaborao estas atividades podem ser modeladas.
Ao olhar para a eParticipao sob a tica do modelo 3C de
colaborao, podemos notar uma semelhana que ocorre em
grande parte pela utilizao das mesmas ferramentas utilizadas
em sistemas colaborativos. No entanto, poucas pesquisas relatam
a eParticipao como um tipo de sistema colaborativo. A
definio de elementos de eParticipao neste artigo tomando
como base um modelo de colaborao difundido na literatura traz
tona uma possibilidade de pesquisa pouco visada. Neste
contexto, as investigaes em eParticipao podem se apropriar
das teorias e modelos j validados presentes em sistemas
colaborativos, adaptando-as para melhorar a interao entre
governo e cidado. Por exemplo, podem ser utilizados conceitos
de trabalho colaborativo, como crowdsourcing para definir metas
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 94 -
para participao dos cidados de forma a auxiliar o governo a
aplicar solues propostas pelos prprios cidados.
O projeto de ambientes de eParticipao tambm deve ponderar
caractersticas da criao do processo, como tcnicas e de
organizao das TIC, bem como caractersticas de
comportamento esperado e das interfaces que so base para a
externalizao destes comportamentos [14]. No projeto das
interfaces se enquadram as caractersticas de sistemas
colaborativos, e neste momento que se espera utilizar teorias e
modelos presentes em sistemas colaborativos, para cobrir as
recomendaes que permitam com que a eParticipao tenha
sucesso.
Neste momento, a expresso das atividades de eParticipao sob
a tica do modelo de colaborao 3C podem ser benficas para
focar a ateno de designers da interao em eParticipao.
Outro benefcio que pode ser visualizado ao utilizar uma
abordagem de um sistema colaborativo a facilitao da
montagem de ambientes de eParticipao, por meio da definio
de componentes para as distintas TIC [16].
Os benefcios supracitados evidenciam a relevncia de pesquisas
relacionadas ao aspecto colaborativo da eParticipao, sendo
estas de fundamental importncia para tornar a eParticipao
mais eficiente e possibilitar o sucesso nestas iniciativas. Espera-
se que a abordagem sugerida neste trabalho seja utilizada por
pesquisadores como ponto de partida para novas investigaes
unindo as reas de eParticipao e sistemas colaborativos. Para
que este ponto de vista seja melhor investigado, avaliaes
prticas que analisem como a colaborao est inserida dentro de
eParticipao devem ser conduzidas em pesquisas futuras.
5. REFERNCIAS
[1] Slaviero, C., Garcia, A.C.B., Maciel, C. (2011). Towards
an ontology to support the deployment of eParticipation
environments. In: 2nd International Conference on
Electronic Government and the Information Systems
Perspective - EGOVIS 2011. (em fase de de publicao).
[2] Phang, C.W. and Kankanhalli, A. (2008) A framework of
ICT exploitation for e-participation initiatives. In:
Communications of the ACM. vol. 51, ed. 12 p. 128-132.
ACM New York, NY, USA.
DOI=10.1145/1409360.1409385
[3] Wang, W. e French, S. (2008). A multi-dimensional
framework for facilitating wide participation and common
understanding. In Proceedings of the hypertext 2008
workshop on Collaboration and collective intelligence
(WebScience '08). ACM, New York, NY, USA, 23-27.
DOI=10.1145/1379157.1379164
[4] DEMO-net (2006), D4.1: The Initial Demo-net
Landscape., DEMO-net The eParticipation Network.
[5] Fuks, H., Raposo, A.B. e Gerosa, M.A.. (2003) Do Modelo
de Colaborao 3C Engenharia de Groupware. Pontifcia
Universidade Catlica do Rio de Janeiro (PUC-Rio).
[6] Saebo, O., Rose, J. and Flak, L. S. (2008). The shape of
eParticipation: characterizing an emerging research area.
In: Government Information Quarterly, vol. 25, n. 3. p. 400-
428, Elsevier.
[7] Macintosh, A., Coleman S. and Schneeberger, A. (2009).
eParticipation: The research Gaps. In: Lectures Notes in
Computer Science. Vol. 5694, p. 1-11. Springer Berlin /
Heidelberg
[8] Maciel, C., Garcia, A. C. B., Roque, L. E-Democracy:
Concepts, Experiences and Challenges In: Democracy in
Theory and Action ed.New York : Nova Science Publishers,
Inc., 2011, p. 51-92.
[9] DEMO-net (2006), D5.1: Report on current ICTs to enable
Participation, DEMO-net The eParticipation Network.
[10] Panopoulou, E., Tambouris, E. e Tarabanis, K. (2009)
eParticipation initiatives: How is Europe progressing?. In
European Journal of ePractice.
[11] IAP2 (2004). IAP2 Spectrum of Public Participation,
http://www.iap2.org.au/sitebuilder/resources/knowledge/ass
et/files/36/iap2spectrum.pdf
[12] Ellis, C.A., Gibbs, S.J. & Rein, G.L. (1991) Groupware -
Some Issues and Experiences. Communications of the
ACM, Vol. 34, No. 1, pp. 38-58. .
[13] Maciel, C, Roque, L. and Garcia, A.C.B. (2008).
Comunidade democrtica cidad (CDC): um ambiente para
consulta e votao na web. In Proceedings of the VIII
Brazilian Symposium on Human Factors in Computing
Systems (IHC '08). Sociedade Brasileira de Computao,
Porto Alegre, Brazil, Brazil, 320-321.
[14] Maciel, C., Roque, L e Garcia, A.C.B. (2009) Principios
para o projeto de comunidades virtuais governamentais com
fins e-Democrticos. In Anais do XXIX Congresso da
Sociedade Brasileira de Computao - I Workshop de
Computao Aplicada em Governo Eletrnico
(WCGE2009), 2009. p. 1377-1391
[15] Pimentel, M., Gerosa, M.A., Filippo, D., Raposo, A., Fuks,
H., Lucena, C.J.P. (2006) Modelo 3C de colaborao para
o desenvolvimento de sistemas colaborativos. In: Anais do
III Simpsio Brasileiro de Sistemas Colaborativos, pp. 58
67.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 95 -

S E S S O 5
Recomendao
Creating a Blog Recommendation System Through a
Framework for Building Blog Crawlers
Rafael Ferreira
Informatics Center, Federal
University of Pernambuco
Recife, Brazil
rm@cin.ufpe.br
Jean Melo
Computing Institute, Federal
University of Alagoas
Macei, Brazil
jean.melo@ic.ufal.br
Patrick Brito
Computing Institute, Federal
University of Alagoas
Macei, Brazil
patrick@ic.ufal.br
Evandro Costa
Computing Institute, Federal
University of Alagoas
Macei, Brazil
evandro@ic.ufal.br
Rinaldo Lima
Informatics Center, Federal
University of Pernambuco
Recife, Brazil
rjl4@cin.ufpe.br
Fred Freitas
Informatics Center, Federal
University of Pernambuco
Recife, Brazil
fred@cin.ufpe.br
ABSTRACT
Blogs have become interesting tools for knowledge genera-
tion and sharing, specially because there are more than 133
million blogs and hundreds of new ones are created every
day. As a matter of fact, the activity on blogs doubles every
two hundred days. Thus, several applications might use the
daily information stored in blogosphere in order to provide
valuable decisions. However, the blogs dynamism hinders
the manual information extraction from it, which demands
the development of new computational and automated ap-
proaches. In this context this paper proposes framework
to create blog crawlers. This framework provides services
for preprocessing, indexing, content extraction, classica-
tion, and tag recommendation. In addition, we present a
recommendation system (as case study) in order to demon-
strate one potential application of blogs a recommendation
system. It helps student interactions in educational forums.
This research takes into account aspects of software engi-
neering to evaluate the framework, as well as a qualitative
analysis related to aspects of the developed application, such
as the evolution impact.
Categories and Subject Descriptors
H.3.1 [Information Storage and Retrieval]: Information
Search and Retrieval; D.3.3 [Language Constructs and
Features]: Frameworks; I.5.4 [Pattern Recognition]: Ap-
plications
General Terms
Algorithms, Experimentation, Human Factors
Keywords
Recommendation Systems, Blog Crawler, Framework
1. INTRODUCTION
A blogger needs only a computer, Internet access, and an
opinion [23], Weblogs have become so ubiquitous that for
many of us the term is synonymous with personal Web
site [4], There are more than 133 million blogs, every day
are created hundreds, and the activity on blogs doubles ev-
ery two hundred days [27]. These aforementioned phrases
present the two main features that expose why blogs are
largely adopted: simplicity and popularity. They show that
blogs have become a very interesting tool as well. So, it may
be used in various areas, e.g. e-commerce and e-learning.
At the same time, due to the large volume of data generated
on blogs, it becomes infeasible to extract all information
manually. Thus, it is necessary computational approaches
to extract data from blogs in order to make a protable use
of its content. Some researches have been developed to au-
tomate the data extraction process from blogs [12, 18, 14].
These proposals attempt to solve specic problems such as:
the performance issue, discover most accessed blogs, recom-
mend blogs with similar topics, and discover trends through
blogosphere.
Although both the variability and size of blogosphere demon-
strate the importance of blogs. It also causes two problems:
(i) it is dicult to build a general approach to deal with such
variabilities, and (ii) it is necessary to assist the developer
for solving basic problems like extracting the main content
of the blog, and the preprocessing of the blogs text. A solu-
tion which addresses the former problem is the building of a
software framework, while the latter could be addressed by
using several articial intelligence techniques as natural lan-
guage processing and information extraction, for example.
In this context, this work proposes a software framework to
create blog crawlers. This framework addresses the problems
aforementioned and some issues related to software engineer-
ing. For example, a better evolvability, reuse, and easiness
for instantiating the framework in a software application. It
is important to clarify that each component of the frame-
work can be used independently. Following these issues, the
framework can be used to create applications quickly and
easily, thus facilitating its use.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 97 -
In order to evaluate our approach, the proposed framework
was applied on a case study of a blog recommendation sys-
tem for helping student interactions in educational forums.
The obtained results take into account the eort reduction
when creating a blog crawler application by using our frame-
work, as well as the facility of using their services applied to
the recommendation system.
The rest of the paper has been structured as follows. Sec-
tion 2 provides the background required to understand the
rest of the paper. Section 3 presents the requirements of
the framework, including its hot spots and frozen spots.
Section 4 describes the implementation of the component-
based framework. Section 5 describes a case study through
the building of one blog recommendation system. Section 6
shows some related work. Finally, Section 7 presents our
conclusion and future work.
2. BACKGROUND
In order to facilitate the understanding of the paper this
section presents an overview of: i) framework; ii) features
model; iii) COSMOS* model.
2.1 Framework
There are many denitions of framework, among them the
most used are those of Ralph E. Johnson [17] [16]: i) Frame-
work is a set of classes which include an abstract design
for solutions of a related problems; ii) Framework is a set
of objects collaborating to perform a set of responsibilities
to an application domain, an application that can be easy
customized by the developer.
Frameworks may be classied according to the extension
technique [8]: i) White Box: They are strongly connected
to programming language features, to customize it uses in-
heritance. It requires a good understanding of framework to
create an application; ii) Black Box: It is instantiated from
some kind of conguration le, such as XML. These frame-
works mainly use composition (components or classes) and
delegation to perform customization. It does not require un-
derstanding of details to produce an application, iii) Gray
Box: This kind of framework is designed to avoid the dis-
advantages presented by white box and black box, allowing
some degree of exibility and extensibility without exposing
internal information unnecessary.
Two important properties in order to understanding a frame-
work are [6] the Hot and Frozen Spots. Hot Spots repre-
sent the framework exible parts, the developer extends the
framework using these spots. In other hand, the Frozen
Spots are frameworks unchanged parts, it provides basic
components the relationships between them.
Some advantages of using the frameworks is [24] [25]: i) the
developer write few code lines; ii) it reduces costs and devel-
opment time; iii) more reliable and robust code; iv) reduced
maintenance and easier evolution; v) improved consistency
and compatibility among applications; vi) stabilization of
the code (fewer bugs) due to the use in several applications.
2.2 Feature Model
A feature is a system property that is relevant to some stake-
holder and is used to capture similarities and variabilities
between systems [7]. The feature modeling is the activity
of identifying similarities and variability of the products of
a product line, or frameworks applications, in order to or-
ganize them in a model. A feature model represents a hi-
erarchical decomposition of resources, usually including two
types of relationships: aggregation and generalization. The
aggregation relationship is used if a resource can be decom-
posed into a set of sub-functions, and the relationship of
generalization is used when a resource can be specialized
with more specic information [20].
Relationships between a parent feature and its child features
(or subfeatures) are categorized as:
Mandatory: child feature is required;
Alternative: one of the sub-features must be selected;
Optional: child feature is optional, in other words, one
or more children can be instantiated or no child as well.
For instance, in Figure 1 [1], to instantiate the ATM System
is necessary to choose instances of User Identication and
Balance(mandatory relationship). On the other side in order
to have the User Identication is required to choose only one
subtype between Touch Screen e Card Reader(alternative
relationship). Finally, to instantiate Balance it is necessary
one instance of Display(mandatory relationship) and the in-
stance of Printer is optional(optional relationship).
Figure 1: Feature Model
2.3 COSMOS* Model
The COSMOS* model[11] uses programming language fea-
tures and well-known design patterns to represent software
architectures explicitly in the program code. The COS-
MOS* model denes the specication and implementation of
COSMOS* components, COSMOS* connectors, COSMOS*
architectural congurations, and COSMOS* composite com-
ponents.
The COSMOS* model is divided in a specication model,
which a component exposes its specication; an implemen-
tation model, which guides the internal implementation of a
component; a connector model, which species the connec-
tion between components using connectors; and a compo-
sition model, which new components or entire systems are
built using existing components.
Therefore, the main goals the COSMOS* model are: First,
provide an accompanying from software architecture to pro-
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 98 -
Figure 2: Features Model
gram code. Second, help maintenance of the implementa-
tion. This, in its turn, is regarded as a model which re-
duces the coupling between architectures modules and still
oers software reuse, so we decided to use it for developing
the framework proposal. Although COSMOS* has four sub-
models (specication, implementation, connector and com-
position), this work only uses two which are the specication
model and implementation model because the connectors are
simple classes. It is important quote that all frameworks
components were implemented using COSMOS*.
3. FRAMEWORK REQUIREMENTS
The proposed framework consists of a gray-box framework
for blog crawlers development. In other words, although the
developer can modify the code to build new crawlers, he/she
can instantiate the framework based on high-level interfaces.
For this, the framework was implemented in Java according
to the COSMOS* component implementation model [11].
Figure 2 presents the feature model involving the function-
alities of the framework. This model uses the notation pro-
posed by [13], which represents hot spots and frozen spots
in an explicit way.
Some points in this diagram should be analyzed: i) The
Content Extraction, Indexing, and Tag Parsing features are
mandatory, they have to be instantiated; ii) The Classi-
cation, and Tag Recommendation features are optional; iii)
The subtypes of all features, except the Preprocessing, are
all alternate, i.e., the developer should choose one of them
for each main feature; iv) The Preprocessing feature has
three mandatory and four optional sub-features. The op-
tional sub-features can be selected when instantiating the
Preprocessing feature of the framework.
The collection of alternative and optional features represent
the hot spots of the framework, whose combination dene
the decision model. In the following we present a description
of each hot spot:
Preprocessing: it removes the information consid-
ered irrelevant to the blog analysis. The current ver-
sion of the framework provides seven types of pre-
processing: (i) Clean HTML, which is responsible for
cleaning all HTML tags; (ii) White Space Remover,
which removes extra white spaces; (iii) Lowercase, which
changes all letters to lowercase; (iv) English Filtering,
it removes English stop words; (v) English Stemming,
it performs a stemming technique to English; (vi) Por-
tuguese Filtering, it removes Portuguese stop words;
and (vii) Portuguese Stemming, it performs a stem-
ming technique to Portuguese.
Content Extraction: This service extracts the tex-
tual content of blog posts. Four services are already
implemented: (i) Summary Strategy [2], it uses the
blog summary to extract the content; (ii) Document
Slope Curve (DSC) [22], it seeks text blocks based on
document slope curve; (iii) Text-to-Tag Ratio (TTR) [28],
it uses the the ratio of the amount of non-tag charac-
ters by the number of HTML tags per text line to
extract content; and (iv) Boilerplate [19], it is an algo-
rithm based on decision tree to examine shallow fea-
tures of the text.
Indexing: The service indexes texts for the search
process. Although there is one service implemented
that uses the tool Lucene
1
, the framework allows the
denition of new indexing schemas.
Classication: it provides text classication services
based on statistical techniques. Three services are
available: (i) Naive Bayes: Provides a trainable naive
bayes text classier, with tokens as features; (ii) KNN:
implements k-nearest-neighbor classication based on
euclidian distance; and (iii) TF-IDF: Provides a ser-
vice for training discriminative classiers based on the
weighting of term-frequency and inverse document fre-
quency of features.
1
http://lucene.apache.org
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 99 -
Figure 3: Similarity Component
Tag Recommendation: it aligns dierent blog tags.
Four types of alignment have been dened: (i) Sim-
ilarity, it is based on the metric of Levenshtein Dis-
tance [21]; (ii) Dictionary, This service addresses words
with similar semantics, using WordNet [9]; (iii) Clus-
tering, which performs the alignment using a classical
version of the KNN cluster algorithm [26]; and (iv)
Classify, it is focused on a bag of words classier which
uses the words of blog posts and their respective fre-
quency to generate a Naive Bayes classier [15];
Tag Parsing: it executes a search and returns a list
of blog links matching to a given tag. It is currently
available for searching on Technorati
2
and Icerocket
3
blog indexing services.
The features model dene the decision model. This model
provides the possible instantiations and congurations of the
framework under dierent scenarios (products).
The frozen spots implements basic services which are used in
the crawling process. The frozen spots available are: i) le
manipulation, it provides operation with les, like save and
delete; ii) HTTP requests, it handled all web connections;
iii) XML le manipulation, it validates and opens xml les;
iv) string manipulation, it provides operations like compare
strings and count number of words; v) language detection,
it uses the google API to determine the language of a text;
and vi) WordNet, it accesses the database WordNet.
4. COMPONENT-BASEDIMPLEMENTATION
The framework uses a component-based implementation based
on the COSMOS*implementation model in order to improve
2
http://technorati.com
3
http://www.icerocket.com
the traceability between the software architecture and the
source code. COSMOS* uses programming language fea-
tures, like interfaces, classes and packages, and a set of de-
sign patterns to represent software architectures explicitly
in the program code. Moreover, the guidelines dened by
the COSMOS* model also improves the system modularity
and the internal evolution of the software components.
To illustrate the implementation, Figure 3 shows the class
diagram of the Similarity component, which implements a
technique of tag recommendation. It receives two strings
lists as parameters, these must contain the tags to be align.
As return it creates a strings list containing the alignment
rules.
According to the COSMOS* model, the user has access only
to the spec package and the SimilarityFactory class. The
IManager interface is dened by COSMOS* and provides
the component basic operations, for example, operations for
getting instances for the provided interfaces of the compo-
nent (getProvidedInterface) and for binding an object that
implements a required interface (setRequiredInterface). The
ISimilarity interface is a provided interface that contains the
operations to the tag recommendation service.
5. CASESTUDY: ABLOGRECOMMENDA-
TIONSYSTEMFORHELPINGSTUDENTS
IN EDUCATIONAL FORUM INTERAC-
TIONS
This section describes a blog recommendation system cre-
ated using the proposed framework services. This case study
is divided into two parts: i) blog crawling, and ii) blog rec-
ommendation. These applications are designed for helping
students in MASSAYO environment.
MASSAYO [3] aims to build an educational platform based
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 100 -
on Semantic Web technologies, oering the following advan-
tages: i) extensibility, ii) it ensures participatory knowledge
creation; iii) it has a structure that takes into account char-
acteristics of each user, making the system adaptable to
them.
In face of this context, the applications proposed in this case
study deal with these aspects in the forum tool. First, it is
extensible because the developer is allowed to create new
applications by changing few lines of code. Then, it uses
texts from blogosphere ensuring universal and participatory
knowledge creation. Finally, the recommendation system
tracks each student and recommends specic blogs for each
one.
Next section presents the blog crawling and blog recommen-
dation applications.
5.1 Blog Crawler
The application crawlers Tecnhoratis blogs related to spec-
ied categories, like education, mathematics, geometry, al-
gebra, and stores it in a MySQL database. As a result, an
index with blogs information is created. The recommenda-
tion system, detailed in next section, use this information to
suggest blogs to students.
In order to create this application is necessary to choose
the alternative components and possible optional compo-
nents. Firstly, we choose Lucene Index (Index), Technorati
(tag parser), TTR (content extraction) as alternative com-
ponents, and English Filtering as optional. In addition, the
application uses Clean HTML, White Space Remover, Lower
Case (preprocesing) as mandatory components, i.e. every
time when the framework is instantiated they are loaded.
These services were chosen because the application require-
ment was performance. Therefore, the TTR and English
Filtering components are more suitable in this case because
they use simple algorithms to perform these operation. Fig-
ure 4 shows the components conguration used directly by
the application.
Given this context, in order to create this application we
only need to create one class specifying the components men-
tioned above. The code follows the model proposed in [11]:
Instantiate interfaces and their managers;
Setting the required interfaces;
Receiving the interfaces provided.
As a result of using architecture-driven and components ap-
proaches, this code uses a high-level representation, i.e. in-
terfaces. Thus, it is clear that the developer does not need
to know specic details of the code. Indeed, if the devel-
oper wishes to change some component she usually needs to
rewrite only on average 4 lines of code.
This fact highlights the low instantiation cost, reuse, and
modularity of the framework.
Figure 4: Component diagram
Finally, in order to run the crawler it is only necessary to
create an instance of the crawler class that is already avail-
able in the framework, and call the runCrawler method, as
shown below.
public static void main(String[] args) {
Crawler crawler =
new Crawler(new TechnoratiSpecification());
crawler.runCrawler();
}
In summary, to create a crawler using the proposed frame-
work the software developer has to:
1. Choose the appropriate components for the application
being developed;
2. Create a class specifying these components and their
interfaces;
3. Run main class showed above.
5.2 Recommendation System
This system recommends blogs for helping students in MAS-
SAYO educational forum. In summary, the system monitors
the forum discussion among the students and, in case of iden-
tifying students questions, the system recommends blogs for
them in order to overcome doubts. The recommended blogs
were crawled using the application described in the previous
section.
The main objective of this system is to highlight the facility
provided by our framework when reusing components. It
uses the naive Bayes component for classication and En-
glish ltering in its preprocessing step.
In the Recommendation system, posts may be classied as
(i) Doubt, student questions appeared in forums; (ii) Expla-
nation, when questions issues are explained; and (iii) Neutral
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 101 -
comment, comments unrelated to any of the above classes.
The system only recommends blogs if a post is classied as
a doubt. Figure 5 shows how the overall recommendation
process works.
Figure 5: Activity diagram
User interaction: The user interacts with the forum
on the environment, and every post is sent to the rec-
ommendation system;
Post classication: The recommendation system clas-
sies (via the Naive Bayes component) a users post as
a doubt, an explanation or a neutral comment;
Post processing: Using the English Filtering com-
ponent, the recommendation system lters out stop
words prior to text processing;
Post subject detection: In order to determine the
subject of the post, the recommendation system uses
course keywords provided by the MASSAYO environ-
ment. Course keywords are created when a course
starts. Next, the system matches these keywords with
those from users post with the aim of nd out its sub-
ject;
Blog Recommendation: The recommendation sys-
tem tests if a post concerns users doubts. If that is
the case, then the system suggests a blog to the user;
it does nothing, otherwise.
This system uses two services provided by the proposed
framework. It shows that services can be easily reused by
other applications even if they are not blog crawler.
6. RELATED WORK
The authors in [14] present a solution for blog crawling that
attends specic quality attributes such as performance and
scalability; and [12] describes an application to investigate
blog collections by using learning machine techniques and
natural language processing. This application shares infor-
mation like the most cited sentences, key people, and most
accessed blogs. However, these solution are specic for some
blogs and does not allow variability of dierent strategies.
Other papers present a more general approach. [5] propose a
framework for blog mining that include spiders, parsers, ana-
lyzers, and visualizers; [2] propose a framework for building
context-based blog crawlers; and [18] proposes a blog min-
ing and search framework that extracts the interests of the
blogger, nds and recommends blogs with similar topics,
and provides blog oriented search functionality. However,
these are white-box object-oriented frameworks that do not
present a clear traceability between the software architec-
ture and the source code. Thus, the developer has to know
the implementation classes for using and extending the men-
tioned frameworks.
The main feature of the proposed work is to provide services
that can be used to create crawlers for specic information,
as in [14][12], and provide high-level interfaces that facilitate
the framework instantiation, dealing with problems found
in[5][10][18].
7. CONCLUSION AND FUTURE WORK
This paper presented a framework for creating blog crawlers.
It was implemented in Java using the COSMOS* implemen-
tation model. The proposed framework provides a large col-
lection of services (section 3) which oers to users the pos-
sibility of creating a large number of applications with dif-
ferent settings. The frameworks source code is available for
download
4
under the GNU General Public License (GPL)
5
.
In order to evaluate it a blog recommendation system was
presented as a case study.
The main advantages identied were: i) Low instantiation
cost, to create an application with the framework is sucient
to indicate a few hot spots; ii) Understandability, since for
creating an application the user has only to know the speci-
cation (interfaces) of components that she wants to use (high
granularity); iii) Modularity and Evolvability, specially for
adding a new feature (component); iv) Manageability, spe-
cially related to the parallelism of the development process,
since the components are self-contained and the developer
needs only to know their interfaces; v) Monitoring, it is eas-
ier to monitor separate architectural components than the
entire system; and vi) Reuse, since each component is inde-
pendent and self-contained (low coupling), reuse is simpler.
As future work we intend to: i) evaluate the framework
in large blog databases; ii) apply concepts of distributed
systems in order to have crawlers on several machines con-
nected(parallelism); iii) create new case studies; iv) use the
framework to create web news crawlers.
8. REFERENCES
[1] P. B. Ana Elisa Lobo and C. M. F. Rubira. A
systematic approach for architectural design of
component-based product lines. Technical report,
Instituto da Computa cao - Universidade Estadual de
Campinas, 2007.
[2] Authors. Omitted for blind. 2010.
[3] I. I. Bittencourt, E. de Barros Costa, M. Silva, and
E. Soares. A computational model for developing
4
https://sourceforge.net/projects/retriblog/
5
http://www.gnu.org/licenses/gpl.html
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 102 -
semantic web-based educational systems.
Knowl.-Based Syst., 22(4):302315, 2009.
[4] R. Blood. How blogging software reshapes the online
community. Commun. ACM, 47(12):5355, 2004.
[5] M. Chau, J. Xu, J. Cao, P. Lam, and B. Shiu. A blog
mining framework. IT Professional, 11:3641, January
2009.
[6] P. Clements and L. Northrop. Software product lines:
practices and patterns. 0201703327, 2001.
[7] K. Czarnecki, S. Helsen, and U. Eisenecker. Staged
conguration through specialization and multilevel
conguration of feature models. Software Process:
Improvement and Practice, 10(2):143169, 2005.
[8] M. E. Fayad, D. C. Schmidt, and R. E. Johnson.
Building application frameworks: object-oriented
foundations of framework design. John Wiley & Sons,
Inc., New York, NY, USA, 1999.
[9] C. Fellbaum, editor. WordNet: an electronic lexical
database. MIT Press, 1998.
[10] R. Ferreira, R. J. Lima, I. I. Bittencourt, D. M. Filho,
O. Holanda, E. Costa, F. Freitas, and L. Melo. A
framework for developing context-based blog crawlers.
Proceedings of the IADIS International Conference on
WWW/Internet, pages 120126, 2010.
[11] L. A. Gayard, C. M. F. Rubira, and P. A.
de Castro Guerra. COSMOS*: a COmponent System
MOdel for Software Architectures. Technical Report
IC-08-04, Institute of Computing, University of
Campinas, February 2008.
[12] N. S. Glance, M. Hurst, and T. Tomokiyo. Blogpulse:
Automated trend discovery for weblogs. In WWW
2004 workshop on the weblogging ecosystem:
aggregation, analysis and dynamics, 2004.
[13] H. Gomaa. Designing Software Product Lines with
UML: From Use Cases to Pattern-Based Software
Architectures. Addison Wesley, 2004.
[14] M. Hurst and A. Maykov. Social streams blog crawler.
In ICDE 09: Proceedings of the 2009 IEEE
International Conference on Data Engineering, pages
16151618, Washington, DC, USA, 2009. IEEE
Computer Society.
[15] L. Jiang, D. Wang, Z. Cai, and X. Yan. Survey of
improving naive bayes for classication. In Proceedings
of the 3rd international conference on Advanced Data
Mining and Applications, ADMA 07, pages 134145,
Berlin, Heidelberg, 2007. Springer-Verlag.
[16] R. E. Johnson. Components, frameworks, patterns.
COMMUNICATIONS OF THE ACM, 40:1017, 1997.
[17] R. E. Johnson and B. Foote. Designing reusable
classes. Journal of Object-Oriented Programming,
1(2):2235, 1988.
[18] M. Joshi. Blogharvest: Blog mining and search
framework. In In: Proc. of the International Conf. on
Management of Data COMAD, 2006.
[19] C. Kohlsch utter, P. Fankhauser, and W. Nejdl.
Boilerplate detection using shallow text features. In
Proceedings of the third ACM international conference
on Web search and data mining, WSDM 10, pages
441450, New York, NY, USA, 2010. ACM.
[20] K. Lee and K. C. Kang. Feature dependency analysis
for product line component design. pages 6985, 2004.
[21] F. P. Miller, A. F. Vandome, and J. McBrewster.
Levenshtein Distance: Information theory, Computer
science, String (computer science), String metric,
Damerau? Levenshtein distance, Spell checker,
Hamming distance. Alpha Press, 2009.
[22] D. Pinto, M. Branstein, R. Coleman, W. B. Croft,
M. King, W. Li, and X. Wei. Quasm: a system for
question answering using semi-structured data. In
Proceedings of the 2nd ACM/IEEE-CS joint
conference on Digital libraries, JCDL 02, pages 4655,
New York, NY, USA, 2002. ACM.
[23] A. Rosenbloom. The blogosphere - introduction.
Commun. ACM, 47(12):3033, 2004.
[24] J. P. Sauve. Projeto de software orientado a objeto.
http://www.dsc.ufcg.edu.br/ jacques/cur-
sos/map/html/frame/oque.htm, 2000.

Ultimo acesso
em Dezembro de 2009.
[25] I. Sommerville. Software Engineering (7th Edition)
(International Computer Science Series). Addison
Wesley, May 2004.
[26] S. Tan. An eective renement strategy for knn text
classier. Expert Syst. Appl., 30:290298, February
2006.
[27] Technorati. State of the blogosphere 2008.
http://technorati.com/blogging/feature/state-of-the-
blogosphere-2008/, 2008. Accessed on March
2011.
[28] T. Weninger and W. H. Hsu. Text extraction from the
web via text-to-tag ratio. In Proceedings of the 2008
19th International Conference on Database and Expert
Systems Application, pages 2328, Washington, DC,
USA, 2008. IEEE Computer Society.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 103 -
How to Know What Do You Want?
A Survey of Recommender Systems and the
Next Generation
Angelina Ziesemer
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
angelina.ziesemer@acad.pucrs.br
Joo Batista S. de Oliveira
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
oliveira@inf.pucrs.br
ABSTRACT
Recommender systems are popular tools to deliver relevant
content to users according to the prole information ob-
tained during their interactions with the system. The chal-
lenge is to comprehend how the Web 2.0, e-commerce and
social networks together can reach all kinds of users. This
paper presents a review on the eld of recommender systems,
including methods for ltering content, approaches for ob-
taining user feedback and the opportunities that Web 2.0
provides in order to improve the interactions within these
environments. We also present the challenges and prospec-
tives in recommender systems and developing alternatives
to understand user preferences for better content delivery.
Categories and Subject Descriptors
H.3.3 [Information Search and Retrieval]: Information
Filtering
General Terms
Algorithms
Keywords
recommendation; collaborative, recommender system
1. INTRODUCTION
Recommender systems have recently become very popular
[13, 21, 45, 7] due to the advent of social media networks,
Web 2.0 and the rich content provided by user interactions.
Having a huge amount of information available on the Web,
the development of recommender systems has become neces-
sary to users in a personalized way. A recommender system
shows relevant content to users, ltering what could be in-
teresting to the prole and trying to identify the relationship
between users and items to develop the recommendation and
personalization. The personalization involves the dynamic
content delivery such as textual elements, links, videos, im-
ages and the recommendation of products, tailored to the
needs or interests of a user or set of users [26]. For instance,
a set of users U = {u1
, u
2
, . . . , u
m
} can relate to a set of
items I = {i
1
, i
2
, . . . , i
n
} through a relationship (R UI).
Despite some recommender system approaches have already
been developed, there is much research trying to improve
the eectiveness and the quality of content delivered to users
[27, 48, 31, 2, 36]. There are surveys about recommender
systems [5, 1, 47, 9] and all have a contribution to the rec-
ommender area. Our main contribution in this work, is to
group traditional recommender system approaches, new ap-
proaches, and analyze how/what kind of data are explored
to suggest content. Moreover, we discuss the current recom-
mender system approaches and its peculiarities according to
each environment, the challenges and trends due to the Web
2.0 advent [28].
This paper has been organized as follows: In the next Sec-
tion we will present how the approaches of recommender
systems are divided. Section 3 introduces the data collec-
tion to improve the recommendation; Sections 4 and 5 will
discuss the challenges and prospects, and the conclusions
based on the presented overview.
2. BACKGROUND
Information retrieval [37] is the key method to the discovery
of personalized information and recommendation of content.
According to Adomavicius [1] recommender systems are di-
vided into three categories: collaborative ltering, content-
based and hybrid recommendation approaches. Mobasher
[26] also considered the rule-based recommender systems re-
lated to business rules with goals and specic interests for
the systems. In this paper we also show the graph-based
recommender approach, a recently technique to explore re-
lationships in social networks and recommendation.
2.1 Collaborative Filtering Approach
Recommender systems that use collaborative ltering (CF)
[47] assume that if two users rate n items similarly or ac-
cess items in the same category, they will rate or access
other items similarly. This association relates the interests
between users and suggest to the created groups by the rat-
ings of the preferences more products or contents that may
be of their interest.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 104 -
One of the rst approaches was the k-Nearest-Neighbor (k-
NN) [4, 10] used to compare the prole of a user to other
proles and nd the k users who have similar interests.
CF systems are divided into memory-based algorithms, that
use techniques to identify users with similar behaviors, and
model-based algorithms, that use collections of ratings to
learn a model to predict new recommendations [1].
According to Liu [23] there are two main disadvantages in
CF method: these systems can not recommend content that
was not previously rated/clicked/read by others and also
not all users have the same interests. In spite of this, this
technique has grown in popularity because of its simplicity
to implement and ease of initial training. Both memory-
based and model-based approaches to CF will be explained
in the next subsections.
2.1.1 Memory-Based Approach
Memory-based algorithms use the similarity between users
(user-based) [43] or items (item-based) [22, 11] to predict
new items in order to recommend to the active user. In
the user-based approach, the grouping happens as users rate
similarity the items.
The rating value a
u,i
is the relation between the user u and
the item i. I.e., a set of users that rated the same item in
a similar way will be part of a neighborhood with the same
interests [1].
According to Su e Khoshgoftaar [47] in the neighborhood-
based CF algorithm is necessary to calculate the similarity
between users or items and produce a prediction for the
active user by taking the weighted average of all the ratings
of the user or item on a certain item or user.
Similarity: there are distinct approaches to calculate the
similarity sim(u
i
, u
j
) between users u
i
and u
j
from U and
between items I. Among the most popular approaches there
are the correlation and vector cosine.
One of the most widely used techniques to compute the sim-
ilarity is by calculating the Pearson correlation coecient
[32, 35]. For instance, to nd the similarity in user-based
approach between u
1
e u
2
, the correlation coecient is given
by
sim(u
1
, u
2
) =
P
iI
(a
1,i
a
1
)(a
2,i
a
2
)
q
P
iI
(a
1,i
a
1
)
2
q
P
iI
(a
2,i
a
2
)
2
where I is the set of all item ratings by users u
1
and u
2
and
a
k,i
represents the ratings of user k on item i.
To compute the similarity on user-based approach between
u
1
and u
2
by vetor cosine [4] we can use the following formula
cos(u
1
, u
2
) =
(u
1
.u
2
)
u
1

2
u
2

2
where the user ratings u
1
and u
2
are treated as vectors, then
the similarity between two vectors can be computed by the
angle cosine between them.
Aggregation: from the similarity among users, we can rec-
ommend the rating items from the set of other similar users
whose the active user belongs. For instance, in last.fm
1
on-
line radio, a set of users usually listens and rates the rock
music category in a positive way. The users receive other
content well rated to the set which is the network developed
according to the similarity obtained. The most common ag-
gregation approach is to use the weighted sum of user ratings
where

G is the subset of users which are similar to the active
user u [1].
ru,i
= k
X
g


G
sim(u, g

) r
g

,i
In this approach the similarity between the active user u and
the user g

of the subset is used in the aggregation formula


for the weighted sum. These approaches were applied to the
user-based technique but it can be adapted to item-based
approach [38]. Item-based algorithms were developed to x
the scalability problem (Section 4.3) that happens in user-
based algorithms.
2.1.2 Model-Based Approach
Model-based techniques calculate utility (rating) predictions
based on a model learned from the underlying data using sta-
tistical and machine learning techniques [1]. This is the main
dierence between the content-based ltering presented in
the next Section.
CF systems which use model-based approaches use the past
ratings to predict new recommendations [8]. This approach
is dierent from memory-based algorithms, because in this
case the system needs to learn the tastes of only one user
at a time to dene the prole according to the ratings and
then make new recommendations. Thus, rating models are
created based on behavior recognition using data mining or
machine learning in the previously rated data of the active
user.
Breese [4] developed two probabilistic models to CF model-
based approach. The rst uses clustering, where the users
are grouped in classes and their ratings are independent.
The second model uses Bayesian networks where the states
of each node corresponds to possible rating values for each
item. Recent models include the Markov decision processes
[41], Latent Dirichlet Allocation [15] and PLSI (probabilistic
latent semantic indexing) [14].
2.2 Content-Based Approach
Generally a content-based [33] (CB) recommender system
analyzes a set of document ratings by one user and then
uses the content of these documents as well as the ratings
to infer a prole that could be used to recommend relevant
items [43].
In contrast to CF, in the CB approach the proles are indi-
vidual and developed only from the individual associations
with items previously visualized and rated by the active user
[26]. The recommendation is given by the similarity between
documents, analyzed by the content regularity compared to
others. For this reason, this kind of approach is hard to ap-
ply in documents like images, videos and music. However,
1
http://www.lastfm.com
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 105 -
what characterizes the CB approach is the close relation-
ship between users and items. CB approach was developed
to provide recommendations mainly based on textual items,
because the content in this case is usually described with
keywords [1].
TF-IDF (term frequency/inverse document frequency) is a
well known approach to information retrieval. In this ap-
proach TF is the frequency of times that the keyword i oc-
curs in a document j and IDF is the inverse frequency of a
document j to the keyword i, then the weight p of TF-IDF
for the keyword is given by
p
i,j
= TF
i,j
IDF
i
.
The kind of prole derived by CB recommender system de-
pends on the method of learning being used. Decision trees,
neural networks and vector-based representation have al-
ready been developed [5].
2.3 Rule-based
Rule-based recommender systems generally use user infor-
mation, provided in an explicit way to recommend content.
The system rules can be adapted to the user data like de-
mographic location or information provided by them. For
instance, it is possible to recommend news or products ac-
cording to the region where users are located or to other
information provided in their prole such as age, gender,
tastes, etc. According to Mobasher [26] the primary draw-
backs of rule-based techniques emanate from methods used
for the generation of user proles. The input is usually the
subjective description of users or their interests, and thus
is prone to bias. In addition, in systems like e-commerce,
the user taste is not updated and thus the system perfor-
mance degrades over time as the proles age. However,
rule-based recommender systems have shown good results
to workaround the cold start problem [29].
2.4 Graph-based
Recently, the Web started a transformation process where
the collaboration between users and system became essen-
tial to disseminate information, changing also the relation-
ship among users in the web environment. Along with these
environment changes, appeared graph-based recommender
systems for social networks to explore the relationships be-
tween users and recommend content [49, 20, 51, 40]. This
approach in combination with CF could be a solution to the
cold start problem (Section 4.1), making initial content rec-
ommendations using the relationships among users in the
social network. The popularity of these environments is
due to the spontaneous user interaction, given the system
a large amount of data to analyze the user preferences. Fur-
thermore, on social media networks the information is more
specic because the users can express his/her tastes by using
ratings, reviews and tags.
The graph-based recommendation is a link prediction prob-
lem where connection nodes show how the relationship be-
tween user-user, user-resource or resource-resource occurs
and the challenge is to use this information to predict rec-
ommendations. Huang et. al. [16] developed a graph-based
recommender system using CF and CB approaches to sug-
gest books on a digital library. The graph model was devel-
oped with two layers: books and customers. Links between
book nodes represent the similarity among the books and
the same rule is used for the similarity among users.
Graph-based recommender approach is a growing research
area mainly because the popularity of social networks reaches
all kinds of people and can be applied in distinct environ-
ments such as e-commerce, social media, blogs, and so forth.
2.5 Hybrid Systems
Hybrid recommender systems join two or more approaches
and come from the eort to overcome the known problems
frequently related to new users and new items. New items
do not have previous ratings, therefore are not recommended
to the users. The new user problem happens because a new
user has no interaction with the system and there is no data
to create the personalized prole.
According to Burke [6], hybrid systems can be classied as
follows:
Weighted: a hybrid recommender system merges results from
dierent techniques.
Switching: dierent recommender systems are used accord-
ing to the recommendation criteria;
Mixed: recommendations from dierent systems are pre-
sented together;
Cascade: one recommender renes recommendations given
by another;
Feature combination: features from dierent recommenda-
tion data sources are combined into a single recommendation
algorithm.
Feature augmentation: one recommender system is used to
compute a result and then use this result as input values to
another recommendation system;
Fab [3] was developed using a combination of CF and CB.
In Spiegels work [46] ratings and content information are
used in a unied model to reduce the number of parameters
and get better recommendations. In [23], Google News
2
used CF and started to use together a CB system to predict
user interests by a Bayesian framework. The main objective
in hybrid systems is try to solve problems existing in each
recommender systems approach.
The next Section presents techniques to obtain data to use
in the recommender approaches presented so far.
3. DATA COLLECTION
Content recommendation is generated mainly from feedback
about user activities. In order to obtain the relevance of
each topic, product or content there must exist an interface
to allow us to analyze the user behavior and get feedback
about the users preferences. The feedback may be extracted
through an explicit [17, 21, 11, 2, 43] or implicit [31, 30, 50]
way, both described as follows:
2
http://news.google.com.br/
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 106 -
Implicit approach: uses techniques developed for monitoring
the user interactions with the systems. The main advantage
of this technique is to exempt the user eort to provide rat-
ings or feedback to the accessed content [19]. In the Ama-
zon
3
site, e.g., the users search history is used to identify
the item category being searched and suggest other items
from the same category.
Explicit approach: there are researches showing that despite
the good results of implicit approach, the explicit approach
is more eective to identify the prole to receive recommen-
dations [17, 19, 18]. It happens because, in this approach the
user is the one who informs the content relevance. In this
kind of approach the user usually has a link with the system,
i.e., it may be necessary the users registration to obtain rec-
ommendations. In Youtube
4
, site to share and view online
videos, it is possible for logged users to rate video relevance
and add them to the favorite list. This approach assumes
that when the video rating is relevant, the user will also be
interested in other videos from the same category. However,
recent researches show that the feedback of explicit approach
still needs to be improved: the information consistency pro-
vided by the user, in a recommender system that uses rating,
should be rened to characterize the relevant content to the
prole. This problem is related to the repetitive ratings that
cause noise, damaging the content relevance [2].
Initially, a recommendation system could extract content
from the user activities by the number of clicks and search
queries. However, with the advent of the Web 2.0 the space
for user interaction has increased, and other sources of infor-
mation began to be explored in order to generate recommen-
dations. For instance, the on-line radio last.fm requires users
to register in order to access content such as smart playlists
or personalized radio. This enables the system to moni-
tor actions such as content searches, mouse clicks, ratings,
and store information such as usage statistics and others.
Furthermore, tags and comments made explicitly by users
are also used now. With this information, the system per-
forms the data collection that will shape the user prole or
the group in which it will be included. Figure 1 illustrates
recommendation approaches and the type of data used to
extract information from the user interactions and to model
the user prole according to each distinct environment.
3.1 Clickstreams
Clickstreams are the records of the user actions on the Web
environment. This technique of data collection is used to
identify a user and the accessed items during his interaction
with the page or document, which enables a remote server to
maintain the records of identication and actions [12]. The
idea of storing mouse clicks supposes that if the user clicks
on a hiperlink the information contained in this link is con-
sidered more interesting than others that were not clicked in
that same document [50]. This analysis is important because
the communication with a user in the Web environment is
more restricted than communicating directly with that user
outside the system environment. Therefore, every user ac-
tion in the Web becomes important, since the access to a
content, subject or advertisement is made spontaneously by
3
http://www.amazon.com
4
http://www.youtube.com
hybrid system
Collaborative Filtering
Rule-based
Content-based
data
user interface
Graph-based
Tags
Query
Rating
Clicks
Figure 1: Recommender system approaches and in-
teraction possibilities for the user environment.
necessity, interest or curiosity.
In [8] click records are used to generate new recommenda-
tions in Google News. For instance, if a user clicks on the
same category over and over, e.g. sports, the recommenda-
tion system will identify the group of users that also access
this category, by measuring the similarity between the user
and the rest of the group to recommend content not yet vis-
ited by that user. The recommendation also occurs when a
news article appears in the list of Top Stories, which contains
the most accessed news by online readers. This recommen-
dation system ts in the context of CF systems, which use
content evaluation performed by user groups that share the
same interests, in order to generate future recommendations.
Once observing the user behavior by the clicks, it is possible
to monitor the passing parameters on the URLs. For exam-
ple, if a URL brings into its structure the user u and item
i that means that the recommendation of content will use
this information to develop the prole P of u or of i through
the relationship between them. This approach is important
because it does not rely on manual user ratings to identify
relevant content to his/her, since this information can be
inferred by analyzing how many clicks a given category is
receiving compared to the others.
3.2 Query history
It is common to nd Web search engines that complement
the results of a search with a list of related searches [36].
The searching records from a user contain one of the im-
plicit feedbacks more currently used because typed words
in a search are directly related with the content of interest
of the user at the time of the access. The main challenge
is to identify the dierent interests of the users from their
research records. For example, when a user searches for the
word latex he/she can be searching for the set of macros
L
A
T
E
X or simply for the tree that originates latex, because
the interests of each user are dierent and, since the system
does not know the user, any information may be returned.
Moreover, new approaches are trying to improve the search
results by the combination between social bookmarking and
CF approach [25]. Regardless of the kind of approach used,
the aim of the query history technique is to identify the rel-
evance of the information that was delivered and then the
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 107 -
system learns by the user interactions which are the users
preferences.
On the Amazon site, the search records are used to suggest
unknown products to the active user and already seen by
similar users. This suggestion infers that the user that is
searching for an item i
1
can also be interested in the prod-
uct i
2
already seen by his neighbors. This is the same result
obtained by the CF technique, in other words, the same al-
gorithm that is used to nd the similarity between users and
to group them with their neighbors. Similarly the ranking
related to the access of a given user to a given category of re-
sults helps the recommendation system to understand that
the content accessed makes part of his/her list of preferences.
3.3 Tags
Tags are terms freely chosen by users of online systems to
classify a subject, image, video, music or any content related
to a category or theme. It is a simple assignment of keywords
to the content being published.
In the Web 2.0 the use of explicit textual information is
becoming more popular [44, 13, 21, 24, 42], because the
assigning of meaning to the content sent by a user would
be laborious, in the case it was performed by system ad-
ministrators, so it became convenient to let users the free
classication of what is being published.
Categorizing subjects or things is known as a taxonomy and
generally performed by specialists. In the case of tags we call
those sets of assignments folksonomy for being performed by
people (folks), i.e., users that assign keywords according to
their preferences to classify the kind of publishing content.
In recommendation systems that use CF the tags are used
in order to dene the users interests. Those systems are
based on the idea that users with similar interests share
similar tags [9]. According to Shepitsen et. al. [42] the
hierarchical clustering of tags to recommend personalized
navigation is eective to identify the interests of users as
well as to determine the topic of a content.
The popularity of systems that use tags is due to the user
freedom to dene the category according to his/her prefer-
ences and quick proliferation of social media networks that
use this resource such as Flickr
5
, last.fm and YouTube be-
sides systems of bookmarking such as del.icio.us
6
, digg
7
etc.
Tags may classify content that characterizes the document
and relevance of the subject being published, using words
that give emphasis to the information, author, kind of pub-
lished document, date, region and events. More than one
tag is often associated to the document, ending up as tips
to the subject of which is being assigned.
In [52] an approach was developed with the goal of improv-
ing the result of the searches on Web 2.0: the social ranking
explores the similarity between users and tags. Gemmel [13]
proposed the adaptation of the k-NN neighborhood to the
users and tags and so identify the group which they belong.
5
http://www.ickr.com
6
http://www.delicious.com
7
http://www.dig.com
This kind of technique is the adaptation of the recommen-
dation systems of the CF to the recent area of folksonomy
that is ascending.
Initially the social networks used tags in order to ease the
navigation and as alternative of search, since those are the
information that will be related, for example, an image on
Flickr. However, the tags presented themselves in a wider
context when compared to links for content search, mainly
through the similarity between users and items, becoming
more popular in the recommendation area.
3.4 Ratings
When user feedback is performed spontaneously we call this
technique explicit approach. The evaluation of content
in the explicit approach consists on providing mechanisms
for the system to receive feedback from the user through
rating or manifestation of relevance of the content. Rating
approaches avoids the discrepancy that occurs in the evalua-
tion performed by ratings or quantity of stars. According to
Amatriain [21], extreme evaluations, i.e., maximum or mini-
mum ratings, are more consistent than the medium opinions
for the denition of the user preferences.
Considering feedback by evaluation, a recommendation sys-
tem denes and personalizes the order of importance to the
content that will be available [9].
4. CHALLENGES AND PROSPECTS
Many challenges were faced by each technique for content
recommendation. Among them we nd the challenges re-
lated to deliver content to new users and items for recom-
mendation that were not rated. Both cases are known as
the cold start problem [39]. Other challenges include over-
specialization in CB systems and scalability in CF systems.
However, new methods of information retrieval are been de-
veloped, trying to analyze the relationship between users in
social networks, bringing new perspectives for recommender
systems. In this Section we will discuss the problems and
challenges being investigated to workaround the shortcom-
ings of each recommender approach and the perspectives
using new interaction techniques.
4.1 Cold start
The cold start problem occurs early in the development and
use of recommendation systems. To generate personalized
content, it is mandatory that the user have some previ-
ous interaction with the system and thus provide data to
the system to understand the tastes and dene its prole.
That is, the cold start problem is related directly with new
users, new items [3] and new systems. In CB recommender
approach the new user problem occurs primarily because
when a user begins to use the system, there are not enough
clicks or search queries history to understand his/her prole
tastes. The same problem occurs to CF technique that uses
ratings to identify the similarity between users and, thus,
group them to suggest content. Hybrid systems like [3] were
developed to bypass this problem. however, there are other
researches being developed [34, 29] to recommend content to
new users and suggest new items, because the development
of the hybrid approach is usually laborious. The rule-based
approach may be a initial solution to the cold start problem,
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 108 -
using demographic rules to suggest content according to the
user location.
4.2 Overspecialization
In CB approach the user prole is based on his interactions
with the system and there is not a relationship with other
users. Furthermore, when a user evaluates an item, the rec-
ommendation will occur based only on the item category
which was accessed. This problem is known as overspecial-
ization, i.e., the user is limited to recommend items that are
always similar to those already rated because there is not
enough information to produce more recommendations. For
instance, a user in a news environment that access political
content will receive most of the content about this category.
It happens because the system learns that this kind of con-
tent is interesting to the active user. The problem is that
the user can be overloaded with repeated suggestions of the
same categories and maybe it is only a momentary interest.
To solve this problem there are implementations of hybrid
systems to take initial users characteristics and recommend
content rated by similar users.
4.3 Scalability
One of the main problems found in CF approach is related
to scalability. It happens because of the need of comput-
ing the similarity among users every time they have a new
item rating. The computational complexity of the method
grows linearly with the number of users, which is typical
in social networks and e-commerce sites, reducing system
performance that has a large daily access or with frequent
changes.
One of the ways to improve the system scalability in rec-
ommender approaches is using item-based algorithms [11]
to recommend similar items that were rated positively by
other users.
4.4 Social Networks and E-commerce
The combination between social networks and e-commerce
is a recent approach and still has under construction. We
observe this technique mainly among ebay
8
customers where
each user can be a seller, a buyer or both. The social graph
on e-commerce is given basically by the users interests for
other users. The relationship among users occurs when some
buyer saves a seller in his/her list of sellers. In e-commerce
environments it can be assumed that this seller has some in-
teresting product for this buyer. Having a huge of informa-
tion in social networks and e-commerce stores the potential
of the union between these environments could improve the
e-commerce using recommender systems and thus it reaches
distinct levels of end users.
5. CONCLUSION
In this paper we have discussed the main techniques to rec-
ommend content, the alternatives and challenges for infor-
mation retrieval and new perspectives to recommender sys-
tems.
The Web 2.0 provides new ways of interaction between users
and systems and the user feedback became essential to bet-
ter understand user tastes and interests. This is the main
8
http://ebay.com
reason for the explicit approach to get better acceptance
than other techniques for information retrieval, e.g., content
rating in social media networks. We have noticed a growing
popularity in CF approach due to the easy implementation
and quick initial training. Also, the folksonomy is showing
nice results as a way to obtain information and to recom-
mend content based on tags to categorize personal content.
This kind of categorization is growing and creating depen-
dent systems from tags provided by users and associations
created in the content posted.
We know that to deliver content in a more eective way, hy-
brid systems, ruled-based recommendation and social net-
works are being studied to promote the recommendation in
distinct environments. This is a growing area and there are
many approaches and techniques still under research. We
believe that the recommendation area is in a development
stage characterized by the user interactions through explicit
feedback, by CF approach, folksonomy and rating. The next
generation of recommender systems is expected to be based
on relationships through social networks in all kinds of en-
vironments such as e-commerce sites.
6. REFERENCES
[1] G. Adomavicius and A. Tuzhilin. Toward the next
generation of recommender systems: A survey of the
state-of-the-art and possible extensions. IEEE Trans.
on Knowl. and Data Eng., 17:734749, June 2005.
[2] X. Amatriain, J. M. Pujol, N. Tintarev, and N. Oliver.
Rate it again: increasing recommendation accuracy by
user re-rating. In Proceedings of the third ACM
conference on Recommender systems, RecSys 09,
pages 173180, New York, NY, USA, 2009. ACM.
[3] M. Balabanovic and Y. Shoham. Fab: Content-based,
collaborative recommendation. Communications of the
ACM, 40:6672, 1997.
[4] J. S. Breese, D. Heckerman, and C. Kadie. Empirical
analysis of predictive algorithms for collaborative
ltering. pages 4352. Morgan Kaufmann, 1998.
[5] R. Burke. Hybrid recommender systems: Survey and
experiments. User Modeling and User-Adapted
Interaction, 12:331370, November 2002.
[6] R. Burke. The adaptive web. pages 377408, Berlin,
Heidelberg, 2007. Springer-Verlag.
[7] S. C. Cazella, E. Reategui, and L. O. C. Alvares.
E-commerce recommenders authority: applying the
users opinion relevance in recommender systems. In
Proceedings of the 12th Brazilian Symposium on
Multimedia and the web, WebMedia 06, pages 7178,
2006.
[8] A. S. Das, M. Datar, A. Garg, and S. Rajaram.
Google news personalization: scalable online
collaborative ltering. In Proceedings of the 16th
international conference on World Wide Web, WWW
07, pages 271280, New York, NY, USA, 2007. ACM.
[9] A. Dattolo, F. Ferrara, and C. Tasso. The role of tags
for recommendation: a survey. In Proc. of the 3rd
International Conference on Human System
Interaction - HSI2010, pages 548555, Rzeszow,
Poland, May 2010. IEEE press.
[10] J. Delgado and N. Ishii. Memory-based
weighted-majority prediction for recommender
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 109 -
systems, 1999.
[11] M. Deshpande and G. Karypis. Item-based top-n
recommendation algorithms. ACM Trans. Inf. Syst.,
22:143177, January 2004.
[12] M. Eirinaki and M. Vazirgiannis. Web mining for web
personalization. ACM Trans. Internet Technol.,
3:127, February 2003.
[13] J. Gemmell, T. Schimoler, M. Ramezani, and
B. Mobasher. Adapting K-nearest neighbor for tag
recommendation in folksonomies. In S. S. Anand,
B. Mobasher, A. Kobsa, and D. Jannach, editors,
ITWP, volume 528 of CEUR Workshop Proceedings.
CEUR-WS.org, 2009.
[14] T. Hofmann. Probabilistic latent semantic analysis. In
In Proc. of Uncertainty in Articial Intelligence,
UAI?99, pages 289296, 1999.
[15] T. Hofmann. Latent semantic models for collaborative
ltering. ACM Trans. Inf. Syst., 22:89115, January
2004.
[16] Z. Huang, W. Chung, T.-H. Ong, and H. Chen. A
graph-based recommender system for digital library.
In JCDL, pages 6573. ACM, 2002.
[17] G. Jawaheer, M. Szomszor, and P. Kostkova.
Characterisation of explicit feedback in an online
music recommendation service. In Proceedings of the
fourth ACM conference on Recommender systems,
RecSys 10, pages 317320, New York, NY, USA,
2010. ACM.
[18] T. Kamba, H. Sakagami, and Y. Koseki.
Anatagonomy: a personalized newspaper on the world
wide web. Int. J. Hum.-Comput. Stud., 46:789803,
June 1997.
[19] D. Kelly and J. Teevan. Implicit feedback for inferring
user preference: a bibliography. SIGIR Forum,
37:1828, September 2003.
[20] I. Konstas, V. Stathopoulos, and J. M. Jose. On social
networks and collaborative recommendation. July 20
2009.
[21] H. Liang, Y. Xu, Y. Li, R. Nayak, and L.-T. Weng.
Personalized recommender systems integrating social
tags and item taxonomy. In Proceedings of the 2009
IEEE/WIC/ACM International Joint Conference on
Web Intelligence and Intelligent Agent Technology -
Volume 01, WI-IAT 09, pages 540547, Washington,
DC, USA, 2009. IEEE Computer Society.
[22] G. Linden, B. Smith, and J. York. Amazon.com
recommendations: Item-to-item collaborative ltering.
IEEE Internet Computing, 7:7680, January 2003.
[23] J. Liu, P. Dolan, and E. R. Pedersen. Personalized
news recommendation based on click behavior. In
Proceeding of the 14th international conference on
Intelligent user interfaces, IUI 10, pages 3140, New
York, NY, USA, 2010. ACM.
[24] P. Lops, M. de Gemmis, G. Semeraro, P. Gissi,
C. Musto, and F. Narducci. Content-based ltering
with tags: The rst system. In ISDA, pages 255260.
IEEE Computer Society, 2009.
[25] B. Merlin and C. d. Souza. Implicit social
bookmarking to improve web searches. In Proceedings
of the 2009 Simposio Brasileiro de Sistemas
Colaborativos, SBSC 09, pages 3643, Washington,
DC, USA, 2009. IEEE Computer Society.
[26] B. Mobasher. Data mining for web personalization. In
The Adaptive Web: Methods and Strategies of Web
Personalization, chapter 3, pages 90135. 2007.
[27] B. Mobasher, H. Dai, T. Luo, and M. Nakagawa.
Eective personalization based on association rule
discovery from web usage data. In Proc. of the 3rd int.
workshop on Web information and data management
(WIDM 01), pages 915, New York, NY, USA, 2001.
ACM.
[28] S. Murugesan. Understanding web 2.0. IT
Professional, 9(4):3441, 2007.
[29] A.-T. Nguyen, N. Denos, and C. Berrut. Improving
new user recommendations with rule-based induction
on cold user data. In J. A. Konstan, J. Riedl, and
B. Smyth, editors, RecSys, pages 121128. ACM, 2007.
[30] D. M. Nichols. Implicit rating and ltering. In In
Proceedings of the Fifth DELOS Workshop on
Filtering and Collaborative Filtering, pages 3136,
1998.
[31] J. Oh, S. Lee, and E. Lee. A user modeling using
implicit feedback for eective recommender system. In
Proceedings of the 2008 International Conference on
Convergence and Hybrid Information Technology,
pages 155158, Washington, DC, USA, 2008. IEEE
Computer Society.
[32] S. G. W. L. S. A. Patricia Cohen, Jacob Cohen.
Applied multiple regression/correlation analysis for
the behavioral sciences, 2002.
[33] M. J. Pazzani and D. Billsus. Content-based
recommendation systems. In The Adaptive Web:
Methods and Strategies of Web Personalization,
chapter 10, pages 325341. 2007.
[34] A. M. Rashid, I. Albert, D. Cosley, S. K. Lam, S. M.
McNee, J. A. Konstan, and J. Riedl. Getting to know
you: learning new user preferences in recommender
systems. In IUI, pages 127134, 2002.
[35] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, and
J. Riedl. Grouplens: an open architecture for
collaborative ltering of netnews. In Proceedings of the
1994 ACM conference on Computer supported
cooperative work, CSCW 94, pages 175186, New
York, NY, USA, 1994. ACM.
[36] E. Sadikov, J. Madhavan, L. Wang, and A. Halevy.
Clustering query renements by user intent. In
Proceedings of the 19th international conference on
World wide web, WWW 10, pages 841850, New
York, NY, USA, 2010. ACM.
[37] G. Salton and M. J. McGill. Introduction to Modern
Information Retrieval. McGraw-Hill, Inc., New York,
NY, USA, 1986.
[38] B. Sarwar, G. Karypis, J. Konstan, and J. Reidl.
Item-based collaborative ltering recommendation
algorithms. In Proceedings of the 10th international
conference on World Wide Web, WWW 01, pages
285295, New York, NY, USA, 2001. ACM.
[39] A. I. Schein, A. Popescul, L. H. Ungar, and D. M.
Pennock. Methods and metrics for cold-start
recommendations. In Proceedings of the 25th annual
international ACM SIGIR, SIGIR 02, pages 253260,
New York, NY, USA, 2002. ACM.
[40] A. Seth and J. Zhang. A social network based
approach to personalized recommendation of
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 110 -
participatory media content. In E. Adar, M. Hurst,
T. Finin, N. S. Glance, N. Nicolov, and B. L. Tseng,
editors, ICWSM. The AAAI Press, 2008.
[41] G. Shani, D. Heckerman, and R. I. Brafman. An
mdp-based recommender system. J. Mach. Learn.
Res., 6:12651295, December 2005.
[42] A. Shepitsen, J. Gemmell, B. Mobasher, and
R. Burke. Personalized recommendation in social
tagging systems using hierarchical clustering. In
Proceedings of the 2008 ACM conference on
Recommender systems, RecSys 08, pages 259266,
New York, NY, USA, 2008. ACM.
[43] Y. Shi, M. Larson, and A. Hanjalic. Exploiting user
similarity based on rated-item pools for improved
user-based collaborative ltering. In Proceedings of the
third ACM conference on Recommender systems,
RecSys 09, pages 125132, New York, NY, USA,
2009. ACM.
[44] S. Siersdorfer and S. Sizov. Social recommender
systems for web 2.0 folksonomies. In Proceedings of the
20th ACM conference on Hypertext and hypermedia,
HT 09, pages 261270, New York, NY, USA, 2009.
ACM.
[45] E. M. Silva, E. R. Pinto, R. A. Costa, L. R. B.
Schmitz, and S. R. L. Meira. Recommending domain
experts in a social network. In Proceedings of the 2009
Simposio Brasileiro de Sistemas Colaborativos, SBSC
09, pages 184192, 2009.
[46] S. Spiegel, J. Kunegis, and F. Li. Hydra: a hybrid
recommender system [cross-linked rating and content
information]. In Proceeding of the 1st ACM
international workshop on Complex networks meet
information &#38; knowledge management, CNIKM
09, pages 7580, New York, NY, USA, 2009. ACM.
[47] X. Su and T. M. Khoshgoftaar. A survey of
collaborative ltering techniques. Adv. in Artif. Intell.,
2009:4:24:2, January 2009.
[48] X. Tan, M. Yao, and M. Xu. An eective technique for
personalization recommendation based on access
sequential patterns. In APSCC, pages 4246. IEEE,
2006.
[49] Z. Wang, Y. Tan, and M. Zhang. Graph-based
recommendation on social networks. In W.-S. Han,
D. Srivastava, G. Yu, H. Yu, and Z. H. Huang, editors,
APWeb, pages 116122. IEEE Computer Society,
2010.
[50] S. Xu, H. Jiang, and F. C. Lau. Personalized online
document, image and video recommendation via
commodity eye-tracking. In Proceedings of the 2008
ACM conference on Recommender systems, RecSys
08, pages 8390, New York, NY, USA, 2008. ACM.
[51] M. Ye, P. Yin, and W.-C. Lee. Location
recommendation for location-based social networks. In
Proceedings of the 18th SIGSPATIAL International
Conference on Advances in Geographic Information
Systems, GIS 10, pages 458461, New York, NY,
USA, 2010. ACM.
[52] V. Zanardi and L. Capra. Social ranking: Finding
relevant content in web 2.0. In Intl. Workshop on
Recommender Systems, 2008.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 111 -
Ativistas, passageiros, ocasionais e especialistas
Perfis de usurio na construo de um site de Q&A

Adabriand Furtado
Universidade Federal de Campina Grande
Av. Aprgio Veloso, 882,
Campina Grande - PB
+55 83 2101 1684
adabriand@lsd.ufcg.edu.br
Nazareno Andrade
Universidade Federal de Campina Grande
Av. Aprgio Veloso, 882,
Campina Grande - PB
+55 83 2101 1684
nazareno@computacao.ufcg.edu.br

RESUMO
Entender a estrutura e dinmica de funcionamento de sistemas de
Question and Answer (Q&A) imprescindvel no
desenvolvimento de mecanismos para incentivar e melhor
aproveitar a produo de contedo por parte dos usurios. Neste
artigo, exploramos os padres de comportamento de usurios em
um site de Q&A de grande porte segundo mtricas de motivao
(quantidade de contribuies) e habilidade (qualidade das
contribuies) dos usurios. Nossos resultados revelam quatro
perfis principais: ativistas, usurios que contribuem muito por um
longo perodo; passageiros, usurios com uma curta permanncia
e que fazem contribuies de qualidade mediana ou baixa;
ocasionais, usurios que permanecem por um longo perodo,
porm contribuindo esporadicamente; e especialistas: usurios
semelhantes aos ocasionais, mas que so hbeis na execuo de
um tipo de atividade. Ao examinar a parcela de contribuio dos
grupos formados por esses perfis, observamos que passageiros e
ocasionais colaboram com os ativistas na construo da ampla
maioria do corpo de contribuies, e que a ausncia de qualquer
um destes perfis possivelmente degradaria o desempenho do
sistema. Com respeito aos especialistas, identificamos que a sua
representatividade no total de contribuies pequena. Esta
descoberta motiva o desenvolvimento de mecanismos para
incentivar a participao desses usurios.
Palavras-chave: Comunidade de Pergunta e Resposta,
comportamento de usurios, perfis de usurios.

ABSTRACT
Understanding the structure and dynamics of operating Question
and Answer (Q&A) systems is essential for the development
mechanisms that encourage and better leverage the content
production of different user profiles. In this paper, we explore the
patterns of user behavior according to metrics capturing
motivation (amount of contribution) and ability (quality of the
contributions). Our results reveal four main user profiles:
activists, users who make a large number of contributions for a
long period; passengers, those users with a short permanence and
who make medium or low quality contributions; occasionals,
users who stay for a long period, however sporadically contribute;
and specialists, similar to occasionals users, but who are skilled in
performing a kind of activity. By analysing the parcel of
contribution of each group formed by these profiles, we observed
that passengers and ocassionals collaborate with activists in the
construction of the majority of contributions, and the lack of any
of these profiles possibly would degrade the system performance.
In regard of the specialists, we discovered that their representation
in the total of contributions is small. This finding motivates the
development of mechanisms to stimulate the participation of these
users.
Keywords: Question and answer community, user behavior,
user profiles
ACM Classification Keywords: H5.3. Group and
Organization Interfaces: Computer-supported cooperative work.
General Terms: Measurement, Human Factors
1. INTRODUO
Recentemente, o modelo de produo de conhecimento Question
and Answer (Q&A) tem sido amplamente utilizado: o site Yahoo
Answers chegou marca de 24 milhes de questes resolvidas [3]
e o Naver Knowledge iN, maior site de Q&A da Coreia do Sul,
agrega mais de 60 milhes de postagens (perguntas e respostas)
geradas por usurios [4]. Outros sites de Q&A se destacam pelo
seu alto desempenho, como o caso do StackOverflow, onde 92%
de um total de mais de um milho e meio de perguntas sobre
programao possuem respostas, e o tempo mediano para se obter
uma resposta de aproximadamente 11 minutos [5].
A compreenso da estrutura e da dinmica de sites de Q&A
importante no desenvolvimento de novas comunidades, bem como
no aperfeioamento da operao das existentes. Em particular,
conhecer os padres de comportamento dos usurios - por
exemplo quanto s suas motivaes [4] (desejo de aprender,
altrusmo, hobby, etc.) - auxilia o desenvolvimento de
mecanismos para incentivar e melhor aproveitar a produo de
contedo dos diferentes perfis de usurios.
Neste contexto, diversos trabalhos [3][4][5] tm procurado
identificar padres de participao de usurios e o efeito desses
padres no funcionamento do sistema. No entanto, estes estudos
em geral identificam perfis de usurios considerando apenas
aspectos de seu comportamento relacionados ao volume de
contribuies gerado, como a frequncia de postagem de
perguntas e respostas. Em contraste, h pouco conhecimento

.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 112 -
sobre padres de comportamento de usurios considerando no s
quantidade, mas tambm qualidade de sua atuao no sistema,
como por exemplo a avaliao das respostas geradas por um
usurio. De fato, Gazan [8] revisou a literatura de estudos em
Q&A e observou que faltam concepes mais refinadas dos
participantes e de seus papis com relao s atividades de
perguntar, responder e avaliar.
Neste trabalho, exploramos os padres de comportamento de uma
comunidade de Q&A segundo aspectos da quantidade e qualidade
das contribuies geradas pelos usurios do sistema. Nosso estudo
analisa a comunidade de Q&A Super User, com cerca de 64 mil
usurios e 230 mil postagens. A Super User baseada na
plataforma para comunidades de Q&A StackExchange
1
, que
publica periodicamente uma base completa de dados
2
sobre suas
comunidades. Nossa abordagem para extrair padres de
comportamento dos dados parte de um conjunto de mtricas de
motivao (quantidade de contribuio) e de habilidade
(qualidade das contribuies) do usurio. Partindo das mtricas
que definimos, identificamos grupos de usurios com
comportamento semelhante combinando dois algoritmos de
agrupamento de usurios, um hierrquico e outro no hierrquico.
Nossos resultados revelam nove perfis de usurios que podem ser
classificados em quatro tipos principais: ativistas (cerca de 1% do
total), usurios que contribuem muito, passam um longo tempo no
sistema e tm bom desempenho nas mtricas de habilidade;
passageiros (cerca de 74%), usurios com pequena contribuio,
que abandonam a comunidade rapidamente e cujas contribuies
so medianas ou de baixa qualidade; ocasionais (cerca de 18%),
usurios que permanecem no sistema por um longo perodo, mas
que contribuem esporadicamente e no se sobressaem nas
mtricas de habilidade; e especialistas (cerca de 7%), usurios
que se assemelham aos ocasionais quanto motivao, mas
apresentam uma alta habilidade na execuo de um tipo especfico
de atividade, como perguntas, respostas ou comentrios.
Aliada descoberta dos perfis na comunidade, utilizamos a
categorizao dos usurios para examinar o quo importante cada
grupo para o funcionamento do site de Q&A que examinamos.
Desta anlise, observamos que usurios poucos ativos como os
dos perfis Passageiros e Ocasionais, colaboram com os ativistas
na construo da ampla maioria do corpo de contribuies, tanto
sob a perspectiva da quantidade quanto da qualidade. Ao
examinar cada grupo separadamente, notamos que o sistema
possivelmente sofreria uma perda significativa de desempenho
caso os usurios de qualquer um destes tipos de perfis no
estivessem presentes na comunidade.
Ademais, ao observar a contribuio conjunta do grupo de
especialistas, identificamos que embora eles se mantenham na
comunidade por um longo perodo e sejam hbeis, a sua
representatividade no total de contribuies pequena. Esta
observao motiva o desenvolvimento de mecanismos para
incentivar a participao deste tipo de usurio.
No restante deste artigo, posicionamos o nosso estudo dentro dos
trabalhos relacionados (Seo 2); descrevemos o funcionamento
de um site tpico da plataforma StackExchange (Seo 3) e
esclarecemos o mtodo utilizado para agrupar os usurios da
comunidade Super User (Seo 4). Em seguida, apresentamos

1
http://stackexchange.com/
2
http://blog.stackoverflow.com/category/cc-wiki-dump/
uma interpretao dos perfis observados (Seo 5) e o
desempenho de cada grupo no funcionamento do site (Seo 6).
Por fim, discutimos as implicaes destes resultados no estudo de
sistemas de computao social, em especial os sites de Q&A.
2. REVISO DA LITERATURA
Trabalhos anteriores buscaram identificar e explicar
comportamentos tpicos dos usurios na construo do
conhecimento coletivo em sites de Q&A.
Mamykina et al. [5] conduziram um estudo na comunidade
StackOverflow, maior comunidade da plataforma para sites de
Q&A StackExchange. Na anlise de desempenho do
StackOverflow, padres de uso do sistema foram identificados
com base na frequncia com que usurios proveem respostas
durante sua participao no sistema. Como resultado, foram
observados 4 tipos de perfis: ativistas da comunidade; shooting
stars, usurios registrados com um nico pico atividade; low-
profile, usurios registrados que nunca tiveram alta atividade;
lurkers e visitantes, usurios sem atividade. Apesar da pequena
presena de ativistas da comunidade e shooting stars, a
contribuio total destes usurios chega a quase metade das
respostas no sistema.
Um estudo similar foi realizado por Nam et al. [4] na comunidade
Naver Knowledge-iN. Este estudo de caso tambm teve por
objetivo identificar padres na participao dos usurios e
explicar os fatores que motivam a contribuio dos usurios,
complementada por uma anlise qualitativa. Neste contexto, os
seguintes padres foram observados: separao clara dos usurios
com o perfil de questionador e respondedor; os usurios mais
ativos, cerca de 1%, proveem aproximadamente metade de todas
as respostas do sistema, e a grande maioria dos usurios tem uma
participao altamente intermitente.
Com o objetivo de entender a atividade de compartilhamento na
comunidade de Q&A Yahoo Answers, Adamic et al. [3]
identificaram padres nas interaes entre usurios nas diversas
categorias (sub-fruns). Alm dos perfis de perguntador e,
respondedor, observou-se em certas categorias um perfil de
usurios que tem ambas as caractersticas, denominado de
'discutidores.
Kang et al [2] tambm buscaram entender como os usurios agem
dentro de uma comunidade de Q&A, analisando como os
relacionamentos criados pelos usurios influenciam seu prprio
comportamento. A partir de uma anlise focada apenas nos
usurios ativistas, foram observados indcios de que estes usurios
esto mais interessados em ajudar e obter reconhecimento.
Alguns destes trabalhos tambm tentaram mostrar uma relao
entre mtricas de participao e habilidade dos usurios: Nam et
al. [4] observaram uma correlao positiva entre a quantidade de
perodos ativos e a qualidade das respostas dos usurios,
indicando que usurios mais comprometidos com o sistema so
mais propensos a prover boas respostas. Kang et al. [2]
identificaram que a competio repetida com certos usurios
desestimulou a produo de respostas de qualidade de alguns
usurios, supostamente pela menor chance de ter a resposta aceita.
Farzan et al. [1] combinaram mtricas de motivao e habilidade
para identificar potenciais experts, utilizando dados de atividade
das suas primeiras semanas.
De forma geral, observamos que h bastante esforo dedicado a
compreenso das diversas formas de participao de um usurio
em comunidades de Q&A, geralmente sob a perspectiva de
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 113 -
quantidade de contribuio provida. Contudo, faltam estudos que
considerem em conjunto quantidade e qualidade das
contribuies, com o propsito de revelar padres que relacionem
estas duas dimenses. Apenas um estudo [1] observou as
dimenses de quantidade e qualidade de comportamento dos
usurios de sites de Q&A em conjunto, e ele focou em apenas um
perfil, os experts. Nosso estudo complementa o estado da arte
investigando que perfis descrevem todos os usurios de um site de
Q&A de grande porte segundo dimenses de quantidade e
qualidade das contribuies realizadas no sistema.
3. FUNCIONAMENTO DE UMA
COMUNIDADE DO STACKEXCHANGE
As comunidades do StackExchange seguem o modelo comum de
sites de Q&A. Na Figura 1, temos uma pgina tpica de uma
questo com suas respostas e comentrios. As etapas comuns no
processo de um usurio obter uma resposta so as seguintes:
1. O usurio posta uma questo.
2. A pergunta criada visualizada por outros usurios, que
podem votar sobre a utilidade ou no da questo e
marcar a questo como favorita.
3. Caso um usurio poste uma resposta, ela ser agregada
pergunta, e tambm ser avaliada atravs de votos da
comunidade. Os votos so utilizados para definir a
ordem em que perguntas e respostas so apresentadas.
4. O perguntador e os respondedores podem fazer
comentrios tanto na questo em si quanto nas
respostas. De forma semelhante a perguntas e respostas,
os comentrios tambm podem ser votados.
5. Por fim, o perguntador escolhe qual das respostas lhe
foi mais til, e marca esta como a melhor resposta.
Para um novo usurio de uma das comunidades do
StackExchange, as seguintes funcionalidades so oferecidas:
postar perguntas e respostas, fazer edies e comentrios nestas,
definir qual a melhor resposta recebida de suas perguntas e
adicionar questes aos seus favoritos.

Figura 1. Pgina referente a uma questo na plataforma
StackExchange.
medida que o usurio participa da comunidade e as suas
contribuies so avaliadas, este usurio adquire pontos de
reputao. Ao atingir uma quantidade pr-estabelecida de
reputao, o usurio ganha acesso a certas funcionalidades, que
so geralmente meios para a realizao de atividades de
moderao. Por exemplo, com 15 pontos, o usurio pode dar
votos positivos nas questes, respostas e comentrios. Com 50
pontos, o usurio pode fazer comentrios nas postagens de outros
usurios.
Com base nesta descrio do funcionamento de uma comunidade
do SE, vemos que um usurio pode desempenhar diversas
atividades. Estes usurios perguntam, respondem, comentam e
avaliam o contedo gerado, e fazendo isto, alm de estarem
construindo colaborativamente a comunidade, esto socializando
entre si.
4. METODOLOGIA
Duas perguntas de pesquisa guiam este estudo:
P1. Que perfis de usurios so identificados em um site tpico de
perguntas e respostas considerando as perspectivas de
quantidade e qualidade da atividade dos usurios?
P2. Que papel cada um desses grupos desempenha no
funcionamento do site?
A primeira pergunta visa contribuir para o entendimento dos tipos
de usurio que existem no sistema, enquanto a segunda foca na
viso da importncia de cada grupo no funcionamento da
comunidade. A observao da quantidade e da qualidade da
contribuio agregada de cada grupo nos d indcios de como
estes grupos em conjunto constroem a comunidade.
A estratgia de investigao emprica e consiste em um estudo
de caso aplicado numa das comunidades da plataforma SE, o
Super User. Nesta comunidade as perguntas so focadas em
software e hardware de computadores. Esta escolha se deve a dois
motivos: a segunda maior comunidade da plataforma, com cerca
de 64 mil usurios registrados e 230 mil postagens, e o seu
tamanho no proibitivo para o processamento que realizamos.
Os dados completos das atividades dos usurios esto disponveis
publicamente sob a licena Creative Commons, e compreendem o
perodo entre a criao do sistema em julho de 2009 e maro
de 2011. No processamento desses dados, no tratamos nem
contamos as pessoas que usam o site sem se registrar.
O estudo de caso que realizamos ao mesmo tempo exploratrio
e confirmatrio. Por um lado, desconhecemos os padres de
comportamento do Super User e a distribuio de usurios nos
perfis definidos por esses padres. Nosso estudo de caso explora
esses aspectos do sistema. Por outro lado, o estudo tambm
confirmatrio, pois nos permite verificar se os perfis identificados
no Super User se assemelham a perfis j encontrados na literatura.
O problema de identificar perfis de usurios na comunidade
equivalente ao de identificar grupos homogneos de usurios
segundo seu comportamento no sistema. Neste estudo, abordamos
essa busca por uma estrutura natural nos dados atravs de tcnicas
de anlise de agrupamento [9]. Essa tcnica particularmente
adequada para o aspecto exploratrio deste trabalho, onde no
sabemos que grupos sero observados nos dados a priori.
Na anlise de agrupamento, objetos so agrupados com base na
sua similaridade segundo um conjunto de caractersticas. As
mtricas que consideramos para caracterizar os usurios e realizar
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 114 -
os agrupamentos so de dois tipos, motivao e habilidade, e
esto listadas a seguir:
Mtricas de motivao
x Nmero de respostas fornecidas pelo usurio.
x Nmero de perguntas feitas pelo usurio.
x Nmero de comentrios fornecidos pelo usurio.
x Nmero de moderaes realizadas. So consideradas
atividades de moderao: votos dados e a marcao de
questes como favorito.
x Tempo de vida do usurio no sistema, que consiste no
intervalo de tempo entre a criao da sua conta e seu
ltimo acesso comunidade.
Mtricas de habilidade
x Guru Score: mtrica definida por Nam et al. [4], que
avalia o conhecimento de um usurio segundo o
julgamento feito pelo criador da pergunta que ele
respondeu. O seu clculo feito a partir do nmero de
respostas marcadas como melhor resposta. Alm de
incluir o nmero de melhores respostas no clculo, o
Guru Score tambm considera o contexto em que ela foi
obtida. Por exemplo, caso haja muita concorrncia para
responder uma dada questo, o Guru Score computado
do usurio ser alto.
x Utilidade mdia das respostas (UMRespostas): avalia o
conhecimento do usurio, mas diferentemente do Guru
Score, leva em considerao o julgamento da
comunidade. A utilidade mdia das respostas de um
usurio definida comparando a pontuao (diferena
entre votos positivos e votos negativos) das respostas
que o usurio gerou com a pontuao das demais
respostas para as mesmas questes. Mais precisamente,
definimos a utilidade de cada resposta de um usurio
como a pontuao da resposta normalizada (z-score)
considerando as demais respostas para a mesma
questo. Este valor representa o quanto a resposta se
destacou. Consideramos ento a utilidade mdia das
respostas de um usurio como sendo a mdia aritmtica
deste valor para todas as suas respostas.
x Utilidade mdia das perguntas (UMPerguntas): medida
atravs das pontuaes e da quantidade de favoritos
recebidos nas questes criadas por um usurio.
Consideramos a pontuao e o voto de favorito com
peso igual, logo a utilidade total de uma questo soma
destes dois valores.
x Utilidade mdia dos comentrios (UMComentrios):
medida pela pontuao dos comentrios do usurio, de
maneira anloga utilidade mdia das respostas. No
clculo desta mtrica, os comentrios que um usurio
faz nas suas prprias questes foram desconsiderados.
Observamos que estes comentrios geralmente no so
avaliados por outros usurios, porque tipicamente
apresentam um teor de conversao, requisio ou
esclarecimento, e no de informao.
O conjunto de mtricas consideradas define o espao onde a
similaridade entre os usurios ser calculada. Nosso agrupamento
feito utilizando a medida mais comum de similaridade para
agrupamento, a distncia euclidiana generalizada para um espao
multidimensional. De forma a evitar resultados distorcidos pela
escala, as mtricas foram normalizadas, calculando seu z-score.
A anlise de agrupamento envolve tambm a escolha do mtodo
de agrupamento. Na literatura, h dois tipos principais de
algoritmos: nos hierrquicos, os objetos so combinados (ou
divididos) iterativamente em grupos. Como resultado, produzida
uma estrutura similar a uma rvore (dendrograma), a qual
descreve a formao dos grupos e contm N - 1 possveis solues
de agrupamento, onde N o nmero de objetos. O segundo tipo
de algoritmo o no-hierrquico: este tipo de tcnica produz uma
nica soluo de grupo de tamanho K, onde K a quantidade de
sementes passadas como parmetro. Essas sementes so valores
iniciais para os centros do agrupamento.
O tamanho da populao da comunidade Super User cerca de 64
mil usurios torna impraticvel aplicar um mtodo hierrquico,
pois esse tipo de mtodo exige a computao de uma matriz de
similaridade NxN. Os mtodos no-hierrquicos, por sua vez, so
mais eficientes para o processamento de grandes massas de dados,
mas tm a qualidade do agrupamento final diretamente ligada s
sementes fornecidas como parmetro de entrada. Por essa razo,
tipicamente no uma abordagem segura utilizar sementes
randmicas. Considerando as desvantagens de ambos os mtodos
em nosso contexto, optamos por uma combinao dos dois que
prov ao mesmo tempo preciso e escalabilidade [7].
Essa combinao funciona da seguinte maneira: inicialmente,
selecionamos uma amostra aleatria da populao e aplicamos o
mtodo hierrquico. Com base nestes resultados, avaliamos que
soluo de agrupamento representativa para nosso estudo e a
utilizamos para gerar as sementes iniciais para um procedimento
no-hierrquico. A seguir, usamos as sementes derivadas no
mtodo hierrquico para aplicar o mtodo no-hierrquico em
toda a populao do sistema. Ao usar as sementes produzidas pelo
mtodo hierrquico, esperamos resultados mais acurados de
agrupamento.
Como mtodo hierrquico, usamos o algoritmo proposto por
Ward [10]. Neste mtodo, grupos so combinados minimizando a
soma do quadrado dos erros internos dos grupos. Esse algoritmo
se adapta bem a nosso contexto devido a sua tendncia a no
formar grupos com uma nica observao. Para o mtodo no
hierrquico, usamos o mtodo k-means clssico de Hartigan &
Wong [6].
5. IDENTIFICANDO PERFIS NA
COMUNIDADE SUPER USER
Nesta seo, aplicamos a metodologia descrita para identificar os
perfis de usurios na comunidade Super User. Esse processo est
dividido em trs etapas: deciso do nmero de grupos a serem
usados, agrupamento e interpretao dos grupos encontrados.
5.1 Deciso do nmero de grupos
Uma amostra aleatria de 11 mil usurios foi extrada dos dados
do Super User, representando aproximadamente 17% do total de
usurios. O algoritmo hierrquico de Ward foi executado nesta
amostra, utilizando as mtricas e medidas de similaridade
especificadas. Na Figura 2, observamos que ao aumentar o
nmero de grupos, ganhamos em homogeneidade, qualidade que
desejamos. No entanto, uma soluo com uma quantidade alta de
grupos torna a interpretao impraticvel. Desta forma,
consideramos os resultados de grupos com tamanhos na faixa
entre 8 e 10, onde a variao do ganho em homogeneidade
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 115 -
pequena. A soluo com 9 grupos foi determinada como a melhor
neste estudo, pois ao reduzir a quantidade de grupos para 8, um
grupo notadamente distinto desaparece; ao considerar 10 grupos,
um novo grupo sem destaque surge.

Figura 2. Anlise da heterogeneidade dos grupos em funo do
nmero de grupos utilizado.
5.2 Agrupamento combinando algoritmos
hierrquico e no-hierrquico
Em seguida, uma estimativa dos centros do agrupamento do
hierrquico foi computada atravs da mdia do valor das mtricas
em cada grupo. Estes centros so fornecidos como sementes
iniciais do algoritmo k-means, que executado com os dados de
todos os usurios da comunidade. Como resultado deste
agrupamento, obtivemos 9 centros com os valores normalizados
expostos na Figura 3 e os no normalizados na Tabela 1.
5.3 Interpretao dos grupos
Nesta etapa, examinamos o centro de cada grupo, com objetivo de
dar uma interpretao para os agrupamentos observados. Os
rtulos destes grupos, e que sero discutidos no restante do
trabalho, esto apresentados abaixo:
1. Passageiros: os usurios deste grupo participam pouco da
comunidade, passam um tempo relativamente pequeno no sistema,
cerca de um ms, e so neutros em agregar contedo de qualidade,
devido aos valores prximos zero nas mtricas de habilidade.
2. Passageiros imperitos: os usurios deste grupo so
semelhantes ao perfil Passageiros, com uma diferena que eles
respondem mais e suas respostas no so bem avaliadas, tanto
pelo perguntador (baixo Guru Score) quanto pela comunidade
(baixa utilidade mdia das respostas).
3. Ocasionais e fiis: estes usurios esto h bastante tempo no
sistema, tm uma quantidade de participao moderada e no se
destacam em nenhuma das mtricas de habilidade.
4. Bons respondedores: estes usurios contribuem com poucas
respostas, que so boas ao julgamento da comunidade em geral,
mas apresentam um guru score mdio no to alto. Por alguma
razo as respostas destes usurios no so comumente
selecionadas como a melhor pelo perguntador.
5. Gurus casuais: so usurios com um excelente desempenho na
contribuio de respostas. Eles so avaliados positivamente tanto
na mtrica Guru Score quanto na utilidade mdia das respostas, e
de maneira similar aos Bons respondedores, no so muito ativos.
6. Perguntadores cidados: a caracterstica principal deste grupo
a alta qualidade de perguntas geradas. Alm disso, estes usurios
so relativamente ativos em produzir perguntas, respostas,
comentrios, e principalmente moderaes. A combinao destas
caractersticas sugere que estes usurios esto bastante alinhados
s polticas da comunidade.
7. Comentaristas oportunos: estes usurios so moderadamente
ativos, mas se destacam pela boa avaliao dos seus comentrios.
8. Ativistas da comunidade: os usurios deste grupo esto h
bastante tempo no sistema, e se sobressaem em todas as mtricas
de motivao, principalmente na gerao de perguntas. Alm
disso, as perguntas geradas por esse tipo de usurio so
frequentemente teis. Estes valores altos nas mtricas de
motivao so indicativos de que estes usurios so altamente
comprometidos com a comunidade.
9. Hiperativos especialistas: estes usurios so to motivados
quanto o perfil Ativistas da comunidade, mas se destacam na
quantidade desproporcional de respostas (1,4 por dia, em mdia),
comentrios (2,3 por dia, em mdia) e moderaes (3,4 por dia,
em mdia) realizadas. Com relao s mtricas de habilidade, eles
se destacam por serem timos respondedores, perguntadores e
comentaristas.
O tamanho de cada um dos grupos, exposto na Tabela 1,
demonstra que grande parte dos usurios se concentra em 3 perfis:
Passageiros (~62,2%), Passageiros imperitos (~11,7%) e
Ocasionais fiis (~18,4%). Uma caracterstica comum entre estes
usurios o fraco ndice de motivao. Por outro lado, os grupos
restantes somam juntos apenas 7,7% e se destacam por serem
especializados em pelo menos um tipo de contribuio.
6. EXAMINANDO A ECOLOGIA DE
CONTRIBUIDORES
A anlise do comportamento comum dos usurios de cada grupo
no d a informao de quanto cada grupo contribuiu para a
formao da base de conhecimento da comunidade. Para tal,
examinamos a parcela de contribuio de cada grupo, utilizando
as seguintes mtricas: o nmero de respostas, perguntas, questes,
comentrios e moderao, como mtricas de motivao; alm de
representantes das mtricas de habilidade, o nmero de melhores
respostas e o nmero de votos positivos recebidos em respostas,
perguntas e comentrios.
Na Figura 4, observamos que o grupo Passageiros imperitos, em
conjunto com o grupo dos usurios especialistas (Bons
respondedores, Gurus casuais, Perguntadores cidados e
Comentaristas oportunos) agregam uma pequena parcela do total
de contribuies nas mtricas de motivao. Com relao ao seu
desempenho nas mtricas de habilidade, a parcela de contribuio
destes usurios tambm pequena, com a exceo do grupo
Perguntadores cidados, que somam 14% da quantidade de votos
positivos recebidos em perguntas. O grupo dos Passageiros
imperitos se destaca pela quantidade de respostas, cerca de 9%,
porm estas respostas no so comumente bem avaliadas pela
comunidade.
Notadamente, os grupos pouco ativos, Passageiros e Ocasionais e
fiis, juntamente com os ativos, Ativistas da comunidade e
Hiperativos especialistas, somam praticamente o total de
contribuies e quase todo o valor agregado nas mtricas de
habilidade.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 116 -

Figura 3. Z-scores dos centros dos grupos identificados. Desta forma, a mdia da populao de todos os usurios para cada mtrica
zero, e o valor representado a distncia do centro do grupo para essa mdia em unidades de desvio padro. Note que a escala nos
trs grupos de grficos diferente.

Figura 4. Proporo de contribuio agregada de cada grupo no sistema.

VIII Simpsio Brasileiro de Sistemas Colaborativos
- 117 -
Tabela 1. Quantidade de usurios e valores no normalizados dos centros de cada grupo.
Nome do
grupo
Usurios
Respos-
tas
Pergun-
tas
Comen-
trios
Mode-
raes
Tempo de
vida (dias)
Guru
Score
UMRes-
postas
UMPer-
guntas
UMCo-
mentrios
Passageiros
40.138
(62,2%)
0,33 0,41 0,50 0,45 34,00 -0,01 0,00 0,25 0,00
Passageiros
Imperitos
7.600
(11,78%)
1,77 0,45 0,97 1,48 71,32 -0,63 -0,85 0,22 -0,01
Ocasionais e
fiis
11.878
(18,4%)
4,62 2,43 6,68 14,56 453,22 -0,07 -0,08 0,87 -0,02
Bons
respondedores
2.232
(3,46%)
2,15 0,90 2,03 4,21 200,51 -0,01 1,14 0,47 -0,02
Gurus casuais
956
(1,48%)
2,10 2,17 4,02 8,49 283,76 3,48 0,77 0,96 -0,01
Perguntadores
cidados
720
(1,11%)
7,00 2,37 9,15 28,28 336,35 -0,02 0,00 10,43 0,01
Comentaristas
oportunos
659
(1,02%)
3,14 1,94 4,50 11,39 343,70 -0,05 0,03 0,89 1,19
Ativistas da
comunidade
321
(0,5%)
94,24 39,40 173,34 387,46 521,18 0,16 -0,06 2,50 0,03
Hiperativos
especialistas
30
(0,05%)
757,10 19,53 1243,67 1873,57 544,64 0,19 0,22 4,446 0,08
Populao 64534 2,3 1,06 3,37 6,63 134,21 -0,04 -0,06 0,51 0,00

Na Figura 5, comparamos o desempenho entre estes dois grandes
grupos e observamos que o grupo dos pouco ativos superam os
ativos em quase todas as mtricas, com exceo de duas mtricas
de habilidade: a quantidade de melhor resposta e o nmero de
votos positivos recebidos pelos comentrios.
No grupo dos pouco ativos, observamos que os Passageiros (62%
dos usurios) e Ocasionais e fiis (18% dos usurios) no se
destacam individualmente nas mtricas de habilidade, e se
diferenciam pelo tempo de vida na comunidade. Apesar da grande
diferena do tamanho entre os dois grupos, os Ocasionais e fiis
agregam mais contribuies tanto nas mtricas de motivao
quanto nas de qualidade.
Dentro do grupo de usurios ativos, os Ativistas da comunidade
possuem um desempenho individual inferior nas mtricas de
motivao e habilidade. No entanto, observamos que a
contribuio conjunta dos Ativistas da comunidade superior aos
Hiperativos especialistas nestas duas dimenses.

Figura 5. Comparao da contribuio agregada dos usurios
muito e pouco ativos no sistema. As barras em preto so os
intervalos de confiana, calculados para um nvel de
significncia de 5%.

7. DISCUSSO DOS RESULTADOS
A explorao da presena de grupos dentro da comunidade Super
User considerando mtricas de motivao e habilidade nos
forneceu indcios de quais grupos so mais importantes no
funcionamento de um site tpico de Q&A. Observamos que o
conjunto dos usurios de perfis pouco ativos e sem nenhuma
habilidade marcante, Passageiros e Ocasionais e fiis, juntamente
com o os usurios ativos, Ativistas da comunidade e Hiperativos
especialistas, contribuem com a maior parte dos recursos do
sistema. Com a ausncia dos usurios de algum destes perfis, a
comunidade possivelmente perderia em desempenho. Em
contraste com vrios trabalhos da literatura, os quais tipicamente
afirmam que uma pequena minoria dos usurios faz a grande
maioria das contribuies, os nossos resultados mostram a maioria
dos usurios do Super User construindo o corpo de contribuies
do sistema. Os usurios dos quatro perfis que mais contribuem
somam aproximadamente 80% da populao.
importante destacar que os usurios Ocasionais e fiis do
indcios de ter uma participao altamente intermitente no
sistema. Usurios deste grupo em geral esto ativos no sistema por
um longo perodo e participam pouco. Todavia, pelo seu tamanho,
este grupo possui ao mesmo tempo a maior contribuio agregada
dentre os grupos identificados neste estudo. A atividade conjunta
do grande nmero de usurios que no aparentam ser especialistas
no sistema supera a contribuio dos especialistas e ativistas.
Outro grupo que merece destaque so os Passageiros imperitos.
Nossos dados no permitem a anlise de porque estes usurios
no so bem avaliados, embora tenham uma quantidade
significativa de respostas. Uma hiptese que, pelo curto tempo
no sistema, esses usurios no assimilaram as polticas e costumes
da comunidade, e assim no fizeram contribuies adequadas aos
olhos dos outros usurios.
A descoberta dos grupos com um alto nvel de especialidade em
uma das mtricas de habilidade pode interessar projetistas de
comunidades. Os usurios dos perfis, Bons respondedores, Gurus
casuais, Perguntadores cidados e Comentaristas oportunos se
mantm ativos por bastante tempo na comunidade, embora
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 118 -
contribuindo quantitativamente pouco. Nossos resultados sugerem
que h uma oportunidade no desenvolvimento de mecanismos
para encorajar a participao destes usurios. Pela sua habilidade,
o aumento da atividade desses usurios contribuiria na qualidade
do contedo disponvel para a comunidade.
Ainda sobre os grupos com um alto nvel de especialidade e
participao moderada, interessante destacar que estes usurios
demonstraram apenas um tipo de habilidade, enquanto que os
usurios mais ativos, Ativistas da comunidade e Hiperativos
especialistas, apresentam mais de uma. Os Hiperativos
especialistas, em especial, so bons em todas as mtricas de
habilidade. Estas observaes do indcios de quanto maior o
comprometimento do usurio com a comunidade, maior seu
desempenho em prover contedo de qualidade.
Nam et al. [4] constatou que os usurios mais comprometidos e
consistentes so mais propensos a prover boas respostas em sites
de Q&A. Em nossos resultados, esta caracterstica observada no
pequeno grupo de usurios mais ativos. No entanto, identificamos
grupos de usurios com valores moderados nas mtricas de
motivao que so ao mesmo tempo eficientes em uma das
mtricas de habilidade. Um exemplo disso so os Gurus casuais,
que em mdia contribuem com apenas 2 respostas, mas elas so
consideradas muito boas pela comunidade.
O agrupamento tambm revelou usurios com o perfil de
respondedor, perguntador e discutidor (papel similar em produzir
perguntas e respostas). Os Hiperativos especialistas e Passageiros
imperitos tem uma participao maior na contribuio do total de
respostas do que perguntas, j os Passageiros, Ocasionais e fiis e
Gurus casuais possuem uma maior participao na criao de
perguntas. Os grupos restantes, Bons respondedores,
Perguntadores cidados, Comentaristas oportunos e Ativistas da
comunidade, tem uma participao similar nas duas atividades,
estes usurios se aproximam do perfil de discutidor. Os padres
observados confirmam os resultados de Nam et al. [4] e Adamic et
al. [3], os quais identificaram estes padres na comunidade Naver
Knowledge iN e Yahoo Answers, respectivamente.
8. CONCLUSO
Neste artigo, propomos a identificao de padres de
comportamento dos usurios segundo mtricas de motivao e
habilidade. Como forma de revelar estes padres, dois algoritmos
de agrupamento um hierrquico e outro no-hierrquico foram
utilizados sob os dados de atividade da comunidade Super User.
Neste agrupamento foram observados 4 grandes grupos: Ativistas,
Passageiros, Ocasionais e fiis e Especialistas. Em seguida,
discutimos a importncia de cada um destes grupos no
funcionamento de um site Q&A.
Nossos resultados contribuem para um retrato mais rico de sites
de Q&A e tm diversas implicaes. De forma geral, o
entendimento do Super User atravs dos perfis de seus usurios e
da atividade gerada pelo conjunto que se adequa a cada perfil
revela um sistema mantido em partes iguais por um ncleo de
ativistas e por um grande nmero de usurios de atividade
espordica e sem destaque quanto habilidade empregada.
Esse retrato ressalta a importncia dos usurios de perfis com
pouca atividade no sistema para o seu desempenho. Tal resultado
indica a relevncia de incluir o melhor uso dos recursos providos
por esses usurios na agenda de pesquisa sobre sites de Q&A.
Um resultado que observamos e carece de mais investigao a
identificao de um perfil de usurios que contribui para o sistema
mas tipicamente tm suas contribuies mal avaliadas, os
Passageiros imperitos. Entender o processo que leva esses
usurios a este estado certamente contribuir pra aperfeioar o
processo de integrao de novos usurios comunidade.
Diversos pontos limitam a generalidade de nossos resultados.
Consideramos apenas um site de Q&A. Sites com escala ou
comunidade-alvo diferentes podem revelar outros perfis e outra
composio para sua populao. Trabalhos futuros devem
estender nossos resultados considerando outros sites de Q&A.
Outra linha que complementaria o presente estudo a anlise de
perfis de usurios utilizando outros mtodos de classificao e
mtricas que capturem mais detalhadamente a participao dos
usurios na comunidade.
AGRADECIMENTOS
Este trabalho foi parcialmente financiado pelo CNPq
(480855/2010-2).
REFERNCIAS
[1] Pal, R. Farzan, J. A. Konstan, R. E. Kraut. 2011. Early
Detection of Potential Experts in Question Answering
Communities by A. International Conference on User
Modeling, Adaptation, and Personalization (UMAP '11).
[2] Minhyung Kang, Byoungsoo Kim, Peter Gloor, and Gee-
Woo Bock. 2011. Understanding the effect of social
networks on user behaviors in community-driven knowledge
services. J. Am. Soc. Inf. Sci. Technol. 62, 6 (June 2011),
1066-1074.
[3] Lada A. Adamic, Jun Zhang, Eytan Bakshy, and Mark S.
Ackerman. 2008. Knowledge sharing and yahoo answers:
everyone knows something. In Proceeding of the 17th
international conference on World Wide Web (WWW '08).
ACM, New York, NY, USA, 665-674.
[4] Kevin Kyung Nam, Mark S. Ackerman, and Lada A.
Adamic. 2009. Questions in, knowledge in?: a study of
naver's question answering community. In Proceedings of
the 27th international conference on Human factors in
computing systems (CHI '09). ACM, New York, NY, USA,
779-788.
[5] Lena Mamykina, Bella Manoim, Manas Mittal, George
Hripcsak, and Bjrn Hartmann. 2011. Design lessons from
the fastest q&a site in the west. In Proceedings of the 2011
annual conference on Human factors in computing systems
(CHI '11). ACM, New York, NY, USA, 2857-2866.
[6] Hartigan, J. A., & Wong, M. A. 1979. Algorithm AS 136: A
K-Means Clustering Algorithm. Journal of the Royal
Statistical Society, Series C (Applied Statistics) 28 (1): 100
108.
[7] Milligan, G. 1980. An examination of the effect of six types
of error perturbation on fifteen clustering algorithms.
Psychometrika 45 (September):325-42.
[8] Gazan, Rich. 2011. Social Q&A. Journal of the American
Society for Information Science and Technology, Advances
in Information Science.
[9] Aldenderfer, Mark S., and Roger K. Blashfield. 1984.
Cluster Analysis. Thousand Oaks, CA: Sage.
[10] Ward, J. H. JR. 1963. Hierarchical grouping to optimize an
objective function. J. Am. Stat. Assoc. 58, 236244.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 119 -
Content Recommendation Based on Data Mining in
Adaptive Educational Social Networks
Marcel Pinheiro Caraciolo
Informatics Center
Federal University of Pernambuco
Recife, Pernambuco , Brazil
mpc@cin.ufpe.br
ABSTRACT
Social network sites (SNS) have been advanced as poten-
tially transformative in the area of education in general and
learning in particular. The web technologies are present-
ing new opportunities for developing diverse online learning
enviroments and enhancing interactivity, participation and
feedback between students, their peer groups and teachers.
All this informal learning is accomplished by the exchange
of information among people with similar interests. Mecha-
nisms to support this knowledge acquisition processes have
been proposed, including intelligent and data mining sys-
tems. Among them, one in special are the recommender
systems, which may provide decision aid and information
ltering functions that have a great potential application
in the educational social network sites (SNS). In this pa-
per, we shall describe a personalized recommender system
that uses web mining techniques for recommending a stu-
dent useful content such as new friends, peer groups and
classes within an adaptable educational social network site.
We present a specic recommender engine that we are devel-
oping in the social network AtePassar, a popular brazilian
educational network, in order to help the students to im-
prove their learning process by exploring new relationships
and content discovery.
Categories and Subject Descriptors
D.2.8 [Data Mining]: Recommender Systems; H.4 [Social
network sites]: Miscellaneouscommunity; learning; data
mining
General Terms
Recommender Systems; Social Network Sites; e-learning
Keywords
social network sites; recommender systems; community; learn-
ing; data mining
Adaptive and intelligent web-based educational systems pro-
vide an alternative to the traditional push approach in the
development of web-based educational courseware [1]. With
the advent of the social networks, its role in the students
learning experience has become increasingly relevant in re-
cent years. Several educational social networks exist which
employ students stored prole data, identifying matches for
collaboration. In fact, social interaction within an online
social network can act as a pedagogical agent, helping stu-
dents share experiences and collaborate on relevant topics.
The social software applications applied in education have
attracted researchers and industry to investigate and discuss
novel ways of providing eective web-based courses to stu-
dents, specially as a mode of delivery for distance learners [2,
3].
One of the main challenges is to provide features that can
enhance online social learning enviroment and student ex-
perience in dierent ways. One particular area where those
social softwares oers values is within recommendations for
learning material and sources of information. Recommender
systems help users nd and evaluate items of interest. Such
systems have become powerful tools in many domains from
electronic commerce to digital libraries and knowledge man-
agement [4]. Some recommender systems have also been
applied to web-based educational systems for recommending
lessons (learning objects or concepts) that students should
study next [5] or for providing course recommendation abou
courses oered that contribute to the students progress to-
wards career goals [6]. In the educational context, its main
objective is to adapt and personalize learning to the needs
of each student by deliverig personalized content.
Recommender systems can use data mining techniques for
making recommendations using knowledge learnt from the
action and prole information of users on such educational
social networks [4]. Using machine learning and data min-
ing techniques such as prediction, classication, clustering
and association rule mining it is possible to discover and
extract novel and useful knowledge from all the available in-
formation about users/students on the social network site
in order to learn user models and to use these models for
personalization.
Currently, there is a particular interest in applying articial
intelligence and data mining on educational systems, making
them a new and growing research community [7], [8]. Our
research focuses on methodologies and techniques for rec-
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 120 -
ommending friends, study groups and educational resources
(books, video classes, etc.) to students in a social envi-
ronment. We are currently developing a recommender en-
gine framework that may incorporate dierent recommenda-
tion techniques for general recommendation called Crab [15].
This framework can be used in several domains, including
the educational context which is to suggest online learn-
ing activities to students, based on their preferences, knowl-
edge of other students with similar interests. The system is
already deployed in a brazilian educational social network
called AtePassar, which connects students, helping them to
get approved in the public exams [9]. The innovative aspect
of our approach is the use of data mining on social networks
as also the incorporation of explanations at the given rec-
ommendation which will bring the student more condence
on the recommendations and better learning understanding.
Only a few other recommender systems use data mining and
explanations in the recommendations [5].
This paper is arranged as follows: rst we describe the re-
lated background about recommender engines and their use
in educational social learning. Then, we describe the recom-
mender framework that we are developing, integrated into
the Atepassar social network. Finally, we will describe our
current results that we have performed, our expected results
based on the experiments that we will carry out, conclusions
and future works.
2. RECOMMENDER SYSTEMS
Recommender systems are applications that oer personal-
ized suggestions and provide to users information for facil-
itating the decision process by incorporating the user char-
acteristiscs [10]. These systems implicitly assume what the
user wishes by using appropriate recommendation algorithms,
converting in item recommendations. Although recommen-
dation approaches were rst proposed and applied in e-commerce
web sites to sugest products, there are also several works
about the application of recommender systems in E-learning
[11], [6].
The recommendation algorithms can be classied into three
dierent categories: rule based ltering systems, content
ltering-based systems and collaborative ltering systems [12].
The rule-based systems rely on a generated set of rules that
are used to recommend items to users. Content-based l-
tering systems recommend items according to the similarity
between the item features and the content description in
the user prole. Collaborative ltering systems can be de-
scribed as techniques that match the rating of a current user
for items with those of similar tasted users (neighborhood)
in order to produce recommendations, for items not yet seen.
In our work we have developed a recommender system frame-
work to support machine learning researchers and develop-
ers in order to build, evaluate and deploy customized rec-
ommender approaches. This system is called Crab and it
is open-source available for the community [15]. For testing
our recommender engine, we have integrated into the social
network AtePassar, which enables the suggestion of classes,
friends and study data groups for the resgistered users. The
system also integrates explanations, which can enhance the
quality of the recommendations produced.
SLudenL
8ecommender
Lnglne
..
..
..
8ecommendauons
CnLlnL
CllLlnL
SLudenL's Log
lnformauon
lllLerlng
1echnlques
Figure 1: Architecture proposal for the recom-
mender system
3. CONTENTRECOMMENDATIONINED-
UCATIONAL SOCIAL NETWORKS
3.1 Objectives
The overall objective of this research project is to design
a methodology for social recommender systems that incor-
porate dierent knowledge sources from the interaction be-
tween students within a social network site. Those sources
could be structured or not. In the rst case, we consider the
students information stored in personal prole and at his
timeline, a variation of a microblog where students can post
comments, share links by simple text messages. They are
described at our recommender engine with feature vectors,
that can be easily queried with standard query languages.
In the second case, we consider the additional information
provided from the students that are generated by interact-
ing with a web site. Examples of this interaction include the
relationships with other users (friends and followers), study
groups that they participate, classes that the student has
watched and study plans created with disciplines and sub-
jects. To extract knowledge from this type of data reposito-
ries we use social-ltering algorithms.
At our current architecture illustrated at the Figure 1, we
integrate the mentioned sources of knowledge by using data
mining techniques in order to exploit the appropriate l-
tering algorithm for each available source. Additional ob-
jectives will be derive from an empirical study, that will be
performed, such as the tuning parameters of each recommen-
dation algorithm and evaluate new strategies for aggregating
results of the various algorithms.
Our recommender engine at AtePassar uses a hybrid rec-
ommendation approach which analyzes the user interaction
and produces daily recommendations with several compo-
nents available from the social network. Moreover, we also
provide an improved explanation of the recommendation to
the user. Generally, in the currently available systems, the
user only receives the recommended item together with an
overall score indicating the appropriateness of such recom-
mendation [13]. We improved this explanation by provid-
ing detailed explanations, increasing the recommendation
acceptance rate. The educational social networks are pow-
erful source of knowledge and provide many features that
can serve the learning sector in dierent ways. In distance
learning and virtual universities , the recommendation can
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 121 -
user role
user Soclal
lnLeracuon


Content 8ased I||ter|ng

lrlends [101,102]
Locauon: 8eclfe
Scholarshlp: CraduaLed



Co||aboranve 8ased I||ter|ng

5elect stoJy qtoops ftomqtoops
tbot slmllot osets ote lo

MeLa 8ecommender
arameLers
8ecommendauons
Figure 2: Meta Recommender Components Interac-
tion
be highly benecial given that students do not meet phys-
ically. It may result in their becoming more socially con-
nected, thereby enhancing their social learning environment
and student experience.
3.2 The Methodology
In order to design our recommender engine for an adaptative
learning environment, we investigated the user behavior in a
educational social network, in our scenario the AtePassar so-
cial network and incorporated our own ideas into the system
design. We have concluded that the knowledge data shared
between students in the learning context are quite dierent:
likeness, text messages, social graphs, etc. For this reason,
we have adopted an meta recommender system architecture
[14].
A meta recommender approach provides users with cus-
tomized control over the generation of a single recommen-
dation list, generated from a aggregation of rich data. This
personalized control can be implemented analyzing the na-
ture of a specic data source. In our approach, for instance,
if the item to be recommended is a new friend, where for
privacy concerns, in term of attributes, only the relation-
ships (list of friends) are available, then the system relies
more on collaborative ltering. In other hand, if the item to
be recommended has a rich structured description such as a
course, then the system tends to use more the content-based
approach. The nal recommendation score is computed by
aggregating the results of both recommenders. The Figure
2 illustrates an overview of our approach.
For new users at the social network, which can suer from
the cold start problem, that is a common problem in rec-
ommender systems for new users that dont have historical
records in the system, we provide popular recommendations
which were accepted from another users registered in the
network. We hypothesize that popular items recommended
for the new users would help the users to even interact more
within the social network, as the system learns from his ini-
tial interests.
At this moment, we are still studying dierent approaches in
Figure 3: AtePassar Recommender System Inter-
face
how to compute the nal score for the recommendation. The
current approach takes either the nal scores of each recom-
mender as input to a weighted average function, where the
weights can be derived for implicit or explicit user prefer-
ences for a certain recommender.
3.3 The Atepassar based Mining and Recom-
mender System
We have developed a recommendation framework called Crab,
which is a recommender framework that aims to provide a
rich set of components from which you can build a personal-
ized recommender system from a set of algorithms. It is writ-
ten in Python, which is a popular programming language
designed for scability, exibility and performance, making
use of scientic optimized packages in order provide ecient
and easy-to-use solutions in several contexts [15].
We have integrated this engine with easy-to-use interface for
students into the popular brazilian social network AtePas-
sar, an educational virtual learning environment with more
than 70.000 students registered interested at studying for
the public examinations in order to get a civil job. The
Figure 3 presents a screenshot of our recommender system
at AtePassar. Each recommendation comes with a explana-
tion, allowing the student to better understand the reason of
the given suggestion by the system. Another functionality
is that the user can accept or refuse the recommendation,
and in this processs the feedback and result obtained can be
directly applied to future recommendations.
3.4 The Current Results
In the current recommender system, we are providing friends,
study groups and products (e.g. video classes) to the active
users at AtePassar. The recommender engine is running
since January 2011 and recommended more than 100.000
items to over than 60.000 users. We are currently devel-
oping new features by recommending another components
present in the social network such as studyplans, disciplines
and questions.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 122 -
In March 2011 we also performed a questionnaire with the
feedback of the users about the current recommender en-
gine. From 83 users who lled out, 67 said that liked the
suggestions provided by the recommender. This brought
us condence to keep developing and ehancing the quality
of the recommendations, pushing it into more personalized
content discovery.
3.5 The Expected Results
3.5.1 Improve the Learning Proccess
Those collective intelligence tools enable social networking
to take place. Our idea is to analyze how the recommen-
dations can increase the learning process by providing to
users new learning resources to maintain the interaction of
students in online educational networks. We believe that
mining those knowledge rich data provided in online educa-
tional networks in forms of recommendations will improve
the student learning experience.
3.5.2 Explore the Hidden Knowledge
We hypothesize that there are several knowledge sources in
a educational social network. For instance, the hours of the
day where the user is logged in or even the location of the
user. All this information could be used to improve the
recommendation process. Explore this hidden information
would serve as basis for discovery of novel content and ex-
plore more the learning resource materials, one of the goals
of the e-learning system.
3.5.3 Better Recommendation Understanding
The explanations can be quite helpful for users to better
understand if the given resource is (or is not ) suitable for
them. Those explanations can be benecial in how to for-
mulate a better learning interaction and hence to simply and
shorten the human/computer interaction.
4. CONCLUSIONS
In this paper, we presents a personalized recommender sys-
tem that incorporate dierent types of sources of knowledge
in a adaptative educational social network by using a meta-
recommender approach. We believe that this technique will
bring more personalized and better recommendations for the
students.
Although we have integrated the system in the AtePassar, it
can, in principle, also be used in other web-based educational
systems. More research need to be conducted in the area
of the recommendation systems in social learning and how
they can inuence the student satisfaction, motivation and
learning process.
Bringing machine learning and articial intelligence to edu-
cational social networks is one of the main contributions of
this work, which is resulting on a new generation of web-
educational systems. The task of recommendation in web-
based education can be considered as special type of col-
laborative learning, due to the fact that they help student
with similar interests to nd an optimal path through the
learning material and facilitate the social network design to
be eectively be used to achieve these targets. We provide
a video demonstrating the recommender system in action at
AtePassar, which can be accessible at [16].
5. REFERENCES
[1] Brusilovsky, P., Peylo, C.: Adaptive and Intelligent
Web-based Educational Systems. International Journal
of Articial Intelligence in Education. 13, 2003, 156 -
169.
[2] Conole, G. & Culver, J.: The design of Cloudworks:
Applying social networking practice to foster the
exchange of learning and teaching ideas and designs In:
Computers & Education , Vol. 54 , Nr. 3 Elsevier, 2010
, S. 679-692 .
[3] Gogoulou, A., Gouli, E., Grigoriadou, M., Samarakou,
M., and Chinou, D.: A Web-based Educational Setting
Supporting Individualized Learning, Collaborative
Learning and Assessment. In Proceedings of
Educational Technology & Society. 2007, 242-256.
[4] Schafer, J.B.: The application of data-mining to
recommender systems. In J. Wang (Ed.), Encyclopedia
of data warehousing and mining. Hershey, PA. Idea
Group 2005 44 - 48.
[5] Farzan, R., Brusilovsky, P.: Social Navigation Support
in a Course Recommendation System. In proceedings of
4th International Conference on Adaptive Hypermedia
and Adaptive Web-based Systems. Dublin, 2006.
91-100.
[6] Ksristoc, A.: Recommender System for Adaptive
Hypermedia Applications. In Proceeding of Informatics
and Information Technology Student Research
Conference, Bratislava, 2005. 229-234.
[7] Romero, C., Ventura, S.: Educational Data Mining: a
Survey from 1995 to 2005. Expert Systems with
Applications. Elsevier 1:33, 2007. 135-146.
[8] Romero, C., Ventura, S.: Data mining in e-learning.
Wit Press, 2006.
[9] Atepassar. Available at: http://atepassar.com
[10] J. B. Schafer, J. A. Konstan, and J. Riedl.:
E-commerce recommendation applications. Data Mining
and Knowledge Discovery, 2001.
[11] Shen, L.P., Shen, R.M.: Learning Content
Recommendation Service Based-on Simple Sequencing
Specication. In Proceedings of Advanced in Web-based
Learning 2004 363-
[12] M. Montaner, B. Lopez, and J. Rosa.: A taxonomy of
recommender agents on the internet. In Articial
Intelligence Review, volume 19, pages 285-330. Kluwer
Academic, 2003.
[13] J. Herlocker, J. Konstan, and J. Riedl.: Explaining
collaborative ltering recommendations. In In
proceedings of ACM 2000 Conference on Computer
Supported Cooperative Work, 2000.
[14] B. Schafer, J. Konstan, and J. Riedl.:
Meta-recommendation systems: user-controlled
integration of diverse recommendations. In Proceedings
of the 11th conference on Information and knowledge
management, pages 43-51. ACM Press, 2002.
[15] Crab. Available at: http://muricoca.github.com/crab
[16] AtePassar Video. Available at:
http://www.youtube.com/watch?v=gzn7I1EJmb4
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 123 -
Social Tag Collaborative Recommendation:
Mining the Meaning
Angelina Ziesemer
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
angelina.ziesemer@acad.pucrs.br
Joo Batista S. de Oliveira
FACIN, PUC-RS
Av. Ipiranga, 6681
Porto Alegre - RS, Brazil
oliveira@inf.pucrs.br
ABSTRACT
Social media systems such as Flickr, Youtube and Picasa
have become very popular as they provide a collaborative
environment to share photos and videos supporting tags,
ratings and comments. This kind of interaction includes
a lot of content provided by the users, which may bring
meaningful information to recommendation systems. The
aggregation of tags is also a way to cluster items and provide
a tag-based search content. In this paper we investigate how
to support tag recommendation by ranking the popularity
and relevance of commonly-used tags in similar items and by
similar users. We developed a tag recommendation system
to make automatic suggestions of possibly relevant tags. We
use Flickrs dataset to analyze our algorithms behavior and
present the preliminary results.
Categories and Subject Descriptors
H.3.3 [Information Search and Retrieval]: Information
Filtering
General Terms
Algorithms
Keywords
tag recommendation; collaborative tagging; folksonomies
1. INTRODUCTION
In everyday life, people rely on recommendations from other
people by spoken words, reference letters, news reports, gen-
eral surveys, travel guides, and so forth [14]. With the ad-
vent of Web 2.0, the room for user interaction has increased
and sources of information began to be explored in order
to generate recommendations. Among those are included
the attribution of tags to items like photos to improve their
context and be used by search engines to nd results in the
web [9, 11]. Tags provide freedom for users to classify their
content and add meaning to shared resources.
In general, the taxonomical categorization of subjects or
things is made by experts. However on the Web environ-
ment, it is made by common users, and is known as folk-
sonomy. Each resource is submitted as a posting containing
the resource, the identication of the user posting it and a
set of tags [8]. More than one tag may be assigned to each
resource and that set of tags is a hint to the meaning of
the resource. This practice allows for self-organization and
clustering of content by the meaning of the attributed tags.
Despite all advantages of the folksonomy, tagging is a repet-
itive, tedious work and sometimes the users do not tag when
there are many resources to classify. Moreover, typograph-
ical errors in the tagging process may also aect the result
of tag-based search.
To workaround these issues we developed a tag recommender
system to improve the tag aggregation. Recommender sys-
tems [1] have recently become very popular [5, 7, 13, 3] due
to the advent of social media networks and the rich content
provided by user interaction. Our approach relies on the
collaboration of other users to suggest relevant tags. We
use the Flickr social media dataset to show the system re-
sults and the ranking of tag recommendations perform by
our algorithm.
2. RELATED WORKS
Manual insertion of tags allows for resource classication
by common users on social media systems such as Flickr
1
,
Youtube
2
and Picasa
3
. This freedom to classify may require
a signicant amount of work when there are too many re-
sources to be tagged. Moreover, there is a bias on each tag
provided by the user, causing noise in the cluster tag search
result to community users. Sigurbjornsson et al. [12] ana-
lyzed how users tag photos and the tags they provide and
concluded that most photos have only few tags, mostly hints
to where, who/what and when the photo was taken. Their
investigation made a substantial contribution to understand-
ing the long tail [2] on tags distribution. Also, there are col-
laborative tag recommendation systems that use resource
metadata associated by users to analyze the tags relevance.
For example, AutoTag [10] uses information retrieval mea-
sures to estimate the similarity between weblog posts and
then weigh each associated tag based on its frequency to
recommend a list of tags for new content. However, it is not
1
http://www.ickr.com
2
http://www.youtube.com
3
http://picasaweb.google.com
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 124 -
a personalized tag recommendation [4] as personalized tag
recommendation systems are being developed to rate the tag
relevance considering the current user tag preferences. In [6]
a neighbor voting algorithm was developed to estimate tag
relevance by counting votes on tags. Shepitsen et. al. [11]
show that hierarchical agglomerative clustering of tags is an
eective way to personalize navigational recommendations
in collaborative tagging systems. Gemmell et. al. [5] use
the K-nearest neighbor approach to recommend tags. In our
approach, however, we estimate the tags relevance and pop-
ularity by the ternary relationship between users, resources
and tags.
3. THE ALGORITHM
The tagging process on social media systems consists mainly
in two steps: selecting resources and assigning a set of tags
to each resource or to set of them. We intent recommend
a set of relevant tags during the tag assignment process, to
ease the folksonomy task. In order to recommend relevant
tags to users we developed a tag recommendation system
that uses hints given by the active user to nd the most
popular and relevant tags by the analysis of the aggregated
tags on Flickr community.
Each new post in a social tag system is a ternary relation-
ship, for which exists a set of posts P =< P1
, P
2
, P
3
, ...P
n
>
of triples P
i
=< u
i
, r
i
, T
i
> where T
i
= {t
1
, t
2
...t
n
} is a set
of tags attributed to some resource r
i
posted by some user
u
i
. For instance, a user u posting a picture r from London
on Flickr, and adding a set of tags like: england, uk, tele-
phone and others. The folksonomy can indicate the picture
context helping other users to nd resources by the set of
tags.
Our model has three measures for recommendation: co-
occurrence, relevance and popularity. We use the main tag
t provided by the user as a hint to take the context of the
resource and suggest other similar tags. For example, if a
user is posting a set of photos from some city, in general
the tags will indicate who/what, where and when the photo
was taken. Figure 1 shows some examples of photos tagged
by distinct users where the main tag is eiel. The search
results on Flickr showed other photos that have the main
tag eiel (t) and a set of tags (Ti
) for each photo. Such as
in the tags resulting by the Flickr search, we intend use the
tags association like in Figure 1 to suggest similar others to
the users. Observing the folksonomy on Flickr, we model
our algorithm as follows:
P(t) = {P
i
|t T
i
}
where P(t) represents all the triples that contain t in T
i
.
Using the main tag given by the active user we take the co-
occurrence, relevance, and popularity to compute values, in
order to obtain a geometric mean to show better result on
the ranking of recommend tags.
3.1 Preliminary Ranking
Before calculating co-occurrence, popularity and relevance
we must rank the tags that will be analyzed by frequency in
the dataset. To obtain the ranking of k-most co-occurrence
Figure 1: Group of photos and set of tags result by the
search on Flickr, using the tag eiel as t.
tags in the set P(t), we dene
exist(t, T
i
) =

1, t T
i
0, t / T
i
This function will signal the existence of t in the set T
i
from
each resource on the dataset. Once we have all the resources
which have t and the number of exist(t, T
i
), we get the pairs
(t, t
j
) where
t
j

P
i
P(t)
T
i
and rank the set of k-most t
j
that appears in pair with t by
ranking(t, t
j
) =

P
i
P(t)
exist(t, T
i
) exist(t
j
, T
i
)
The result of k-most co-occurrence tags will be use to cal-
culate the next measures.
3.2 Measures
Since the frequency of tags is not a good measure to rank
and suggest tags due to the presence of tags with personal
signicance, we present in this section the measures dened
to our recommender system in order to tune the preliminary
tag ranking and improve the nal ranking of tags.
3.2.1 Co-occurrence
To obtain the measures of the previous ranking of tags we
calculate the number of resources containing both t and t
j
and divide by the number of resources with t.
coo(t, t
j
) =
ranking(t, t
j
)

P
i
P
exist(t, T
i
)
The coo(t, t
j
) value for each tag t
j
will result between [0, 1].
This measure will allow us to calculate the nal ranking
when the weight to each t
j
is calculated and then sorted.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 125 -
3.2.2 Relevance
Considering the tags relevance becomes necessary once the
number of times that it occurs does not mean that it is the
best choice to be in the top of the ranking.
We have observed in the dataset a users category that we
will refer to inuencer users (i-users). In general i-users add
the same set T
i
of tags to a set of resources even when some
words do not have contextual links with some of the items. It
produces noise in the co-occurrence list, showing no relevant
results to the community on the ranking of candidate tags.
To x it, we use the item-based and user-based tag frequency
to compute the relevance of t
j
. We model the relevance of
tags by the number of users that have at least one resource
r with both t and t
j
and divided it by the total number of
resources r which have t and t
j
:
rel(t, t
j
) =
|users(t)

users(t
j
)|
ranking(t, t
j
)
The rel(t, t
j
) will give low values to less relevant tags and put
them on the bottom of the ranking since there are several
resources tagged with t
j
but only by few users.
3.2.3 Popularity
Tag popularity is related to the frequent use of tags to the
users community. The result will measure how popular t
j
is to the set of users which use t in their resources. The
popularity measure is given by the number of users with
both tags divided by the number of users with t:
pop(t, t
j
) =
|users(t)

users(t
j
)|
|users(t)|
Furthermore, to analyze the opposite relationship among
tags, we calculate how popular t is in the universe of users
using t
j
as main tag. For example, for the taglovewe have
a set of co-occurrence tags such as: hand, couple, ower, dog.
The opposite analysis will show the popularity of love to
user owners of resources using the tag dog. That is, now
the tag dog is treated as t and love as t
j
. If love is not
a popular tag in resources using mainly dog, the pop value
will be low. We combine both values pop(t, t
j
) and pop(t
j
, t)
by the arithmetic mean, producing the popularity result:
pop =
1
2
(pop(t, t
j
) + pop(t
j
, t))
3.3 Final Ranking
The co-occurrence, relevance and popularity values are im-
portant measures to produce good results to the nal tag
ranking. However, we need to combine these results and
give to the user the most relevant tags based on history of
community tag aggregations. To merge the results we take
the preliminary ranking and get the co-occurrence, relevance
and popularity values. Through theses measures we dene
the nal ranking of tags by the geometric mean:
mean(t, tj
) =
3

coo(t, t
j
) rel(t, t
j
) pop
The mean(t, t
j
) will set the position of t
j
on the nal tag
ranking.
4. DATASET
Our recommendation system takes into account the distri-
bution of tag frequency and the number of tags per photo
to dene the minimum and maximum number of tags per
resource to receive a relevant feedback in the tag ranking. In
[12] they discovered how users usually tag photos on Flickr.
They indicated that in 52 million of photos the long tail
consists of more than 15 million photos with only a single
tag annotated and 17 million photos having only 2 or 3 tags.
They dened classes showing that photos with one tag rep-
resent 29.82% of the total, photos with 2-3 and 4-6 tags in
the same class represent 56.72% and photos with more than
6 tags represent 13.46% in the dataset. We take a repre-
sentative number of tags assigned to photos submitted on
Flickr social media. We ltering the dataset
4
to comprise
resources tagged between 2-6 tags. After ltering and clean-
ing the dataset we have restricted to 87.454 of tags given by
users to analyze the space and recommend tags in real-time.
The details of the dataset are described in Table 1.
Table 1: Flickr Dataset with total of tags, resources and
users.
tags users resources
distinct total distinct total
17.463 87.454 11.700 19.859
5. PRELIMINARY RESULTS
This section presents the experiment performed by our algo-
rithm to recommend tags. To calculate the co-occurrence,
relevance and popularity measures on the dataset, we take
the 10 top tags by the preliminary ranking using the tag
brazil as main tag t. In Table 2 the values of each measure
and the geometric mean are shown, in order to obtain the
nal ranking by sorting the mean value.
Table 2: Results from the tag recommender algorithm show-
ing the relevance, popularity, co-occurrence and geometric
mean values to sort the nal ranking and suggest to the user.
Preliminary
Ranking
coo pop
rel
mean
Final
Ranking
airplane 0.21 0.06 0.50 0.18 brasil
brasil 0.21 0.45 1.00 0.45 curitiba
driver 0.15 0.06 0.66 0.18 brasilia
trip 0.15 0.04 0.33 0.13 bus
bus 0.10 0.09 1.00 0.21 stop
stop 0.10 0.08 1.00 0.20 airport
curitiba 0.10 0.56 1.00 0.39 driver
brasilia 0.10 0.53 0.50 0.30 airplane
airport 0.10 0.06 1.00 0.19 highway
highway 0.10 0.06 0.50 0.15 trip
The measures are being computing by the algorithm and
each tag on the preliminary ranking is being sorted by the
4
Systems Lab Amsterdam, University of Amsterdam.
http://sta.science.uva.nl/xirong/index.php?n=Main.Dataset
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 126 -
geometric mean value. The new tag position on the ranking
will be present to the user, showing better order results of
tags based on his/her hints.
5.1 Discussion
The results showed that the calculated values provide an
accurate representation of the actual relationships on the
dataset, such as i-user using the same tags and giving in-
uential results on ranking of top tags. This behavior has
been observed when a tag on the top of the ranking has
high values to the co-occurrence measure but low relevance
and popularity values. As an example we use the tag trip
shown on Table 2 to analyze how some tags could have a
high co-occurrence value but low popularity and relevance
values. This behavior means that there are many resources
using some tag but to the community in general the tags are
not relevant or popular to the users, since there are many
resources using the tag trip but only by few users. The ge-
ometric mean takes the tag trip to the bottom ranking and
put relevant tags on the top given better options of tags to
aggregation. We perform the algorithm to other tags, and
the results present similar behavior, putting irrelevant tags
on the bottom of the ranking as shown in Table 3 and 4. In
the Table 3 we observe the tag 08 initially positioned on
the top of the rank and after computing the measures this
tag is on the bottom of the ranking.
P. Ranking F. Ranking
zoo zoo
08 safari
stages statue
safari king
park cub
statue park
king stages
seaview seaview
the 08
cub the
Table 3: result from lion
tag hint.
P. Ranking F. Ranking
barns lamb
vermont farm
farms schaf
lamb animal
animal wales
schaf barns
nici nici
farm uk
wales farms
uk vermont
Table 4: result from sheep
tag hint.
6. CONCLUSIONS AND FUTURE WORKS
In this paper we have shown that collaborative tag recom-
mendation can produce good results when the preliminary
ranking of tags given by tag co-occurrence is improved by
measures that take into account the popularity and the rel-
evance value to each tag on the ranking. Preliminary exper-
iment show the result of our algorithm to each measure and
the nal ranking to recommend tags to resources based on
the history of community tag aggregations on Flickr social
media network. We intend to evaluate a completely new
dataset using this algorithm and calculating the acceptance
of each tag before and after the recommendation to analyze
the homogeneity and clustering results by tags suggested.
7. REFERENCES
[1] G. Adomavicius and A. Tuzhilin. Toward the next
generation of recommender systems: A survey of the
state-of-the-art and possible extensions. IEEE Trans.
on Knowl. and Data Eng., 17:734749, June 2005.
[2] C. Anderson. The Long Tail: Why the Future of
Business Is Selling Less of More. Hyperion, New York,
2006.
[3] S. C. Cazella, E. Reategui, and L. O. C. Alvares.
E-commerce recommenders authority: applying the
users opinion relevance in recommender systems. In
Proceedings of the 12th Brazilian Symposium on
Multimedia and the web, WebMedia 06, pages 7178,
2006.
[4] A. Dattolo, F. Ferrara, and C. Tasso. The role of tags
for recommendation: a survey. In Proc. of the 3rd
International Conference on Human System
Interaction, HSI2010, pages 548555, Rzeszow,
Poland, May 2010.
[5] J. Gemmell, T. Schimoler, M. Ramezani, and
B. Mobasher. Adapting K-nearest neighbor for tag
recommendation in folksonomies. In S. S. Anand,
B. Mobasher, A. Kobsa, and D. Jannach, editors,
ITWP, volume 528 of CEUR Workshop Proceedings.
CEUR-WS.org, 2009.
[6] X. Li, C. G. M. Snoek, and M. Worring. Learning
social tag relevance by neighbor voting. IEEE
Transactions on Multimedia, 11(7), 2009.
[7] H. Liang, Y. Xu, Y. Li, R. Nayak, and L.-T. Weng.
Personalized recommender systems integrating social
tags and item taxonomy. In Proceedings of the 2009
IEEE/WIC/ACM International Joint Conference on
Web Intelligence and Intelligent Agent Technology -
Volume 01, WI-IAT 09, pages 540547, 2009.
[8] M. Lipczak and E. E. Milios. Learning in ecient tag
recommendation. In Proceedings of the fourth ACM
conference on Recommender systems, RecSys 10,
pages 167174. ACM, 2010.
[9] P. Lops, M. de Gemmis, G. Semeraro, P. Gissi,
C. Musto, and F. Narducci. Content-based ltering
with tags: The rst system. In ISDA, pages 255260.
IEEE Computer Society, 2009.
[10] G. Mishne. Autotag: a collaborative approach to
automated tag assignment for weblog posts. In
Proceedings of the 15th international conference on
World Wide Web, WWW 06, pages 953954. ACM,
2006.
[11] A. Shepitsen, J. Gemmell, B. Mobasher, and R. Burke.
Personalized recommendation in social tagging
systems using hierarchical clustering. In Proceedings of
the 2008 ACM conference on Recommender systems,
RecSys 08, pages 259266, 2008.
[12] B. Sigurbjornsson and R. van Zwol. Flickr tag
recommendation based on collective knowledge. In
Proceeding of the 17th international conference on
World Wide Web, WWW 08, pages 327336. ACM,
2008.
[13] E. M. Silva, E. R. Pinto, R. A. Costa, L. R. B.
Schmitz, and S. R. L. Meira. Recommending domain
experts in a social network. In Proceedings of the 2009
Simposio Brasileiro de Sistemas Colaborativos, SBSC
09, pages 184192, 2009.
[14] X. Su and T. M. Khoshgoftaar. A survey of
collaborative ltering techniques. Adv. in Artif. Intell.,
2009:4:24:2, January 2009.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 127 -
Proposta de Uso de Modelos de Objetivos na Engenharia
de Requisitos de Sistemas Colaborativos
Mariana Maia
DCE/CCAE
Universidade Federal da Para ba
58.297-000 Rio Tinto PB Brasil
mariana.maia@dce.ufpb.br
Carla Silva
DCE/CCAE
Universidade Federal da Paraba
58.297-000 Rio Tinto PB Brasil
carla@dce.ufpb.br
Stephany Vitrio
DCE/CCAE
Universidade Federal da Paraba
58.297-000 Rio Tinto PB Brasil
stephany.vitorio@dce.ufpb.br
ABSTRACT
Requirements Engineering (RE) is the activity of understanding
user needs in the context of the problem to be solved, as well as
the discovery and specification of the solution characteristics. A
system based on the Collaboration principle is an environment
that offers a set of features that enables communication,
coordination and cooperation among users. This paper proposes
the use of the i* framework as a RE approach for Collaborative
Systems.
RESUMO
A Engenharia de Requisitos (ER) corresponde atividade de
entendimento das necessidades do usurio no contexto do
problema a ser resolvido, bem como da descoberta e especificao
das caractersticas da soluo. Um Sistema que se baseia no
princpio da Colaborao um Ambiente que oferece um
conjunto de funcionalidades para ocorrer a comunicao,
coordenao e cooperao entre usurios. Este artigo prope o uso
do framework i* como uma abordagem de ER para o
desenvolvimento de Sistemas Colaborativos.
Categories and Subject Descriptors
D.2.1 [Software Engineering]: Requirements/Specifications
methodologies.
General Terms
Human Factors, Theory, Verification, Experimentation,
Performance.
Keywords
Requirements Engineering, Collaborative Systems, i*.
1. INTRODUO
Um dos principais objetivos da Engenharia de Requisitos (ER)
entender e modelar os requisitos desejados pelas partes
interessadas (stakeholders) e garantir que tais requisitos sejam
satisfeitos pelo sistema de software [3]. Requisitos
so caractersticas que um dado sistema deve possuir e, portanto, a
qualidade da especificao dos requisitos de um software pode ser
responsvel pelo sucesso ou fracasso de um projeto de software.
Espera-se que uma abordagem de requisitos considere os
objetivos dos stakeholders de forma a resultar no
desenvolvimento de um software que satisfaa estes objetivos,
contribuindo positivamente para a realizao das tarefas dos
usurios do software, de forma efetiva e eficiente.
Esta preocupao est presente tambm no contexto de
desenvolvimento de ambientes de trabalho cooperativo apoiado
por computador (do ingls, Computer Suported Cooperative Work
- CSCW) [2], que se baseiam nos princpios de comunicao,
coordenao e cooperao. A comunicao se realiza por meio da
troca de mensagens; a coordenao se realiza atravs do
gerenciamento de pessoas, atividades e recursos; e a cooperao
se realiza por meio de operaes num espao compartilhado para
a execuo das tarefas [4].
Os sistemas CSCW proporcionam aos usurios a possibilidade de
realizar um trabalho colaborativo, pois os indivduos tm que
trocar informaes (comunicar-se uns com os outros), organizar-
se (coordenar entre si) e operar em conjunto num espao
compartilhado (cooperar entre si) [1]. Para elicitar de forma
adequada os requisitos de sistemas de ambientes colaborativos,
preciso entender, sobretudo, o contexto das atividades realizadas
pelas pessoas envolvidas na utilizao do software.
Uma abordagem de Engenharia de Requisitos que permite realizar
anlises scio-organizacionais do domnio do problema atravs do
uso de modelos de objetivos o framework i* [6]. Os modelos
definidos neste framework servem para o engenheiro de requisitos
relacionar o ambiente organizacional do sistema com seus
usurios, compreender o seu contexto e, a partir da, projetar o
sistema. Este artigo prope o uso do framework i*, para elicitar e
modelar os requisitos de sistemas CSCW, por ser uma abordagem
capaz de capturar, em um mesmo modelo, os objetivos dos
stakeholders, os requisitos funcionais e os requisitos no-
funcionais (RNFs) do sistema.
2. UMA ABORDAGEM DA ENGENHARIA
DE REQUISITOS PARA CSCW
Para desenvolver o trabalho apresentado neste artigo, realizou-se
um estudo do trabalho realizado por Teruel e outros [5] sobre a
modelagem em i* do sistema Google Docs. Aps este estudo,
percebeu-se que o framework i* no havia sido utilizado de forma
adequada na modelagem deste sistema. Isto nos motivou a utilizar
o Google Docs como exemplo para ilustrar o uso correto do i*
como abordagem adequada de ER para o desenvolvimento de
sistemas CSCW. De fato, o Google Docs um sistema bastante
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference10, Month 12, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010$10.00.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 128 -
popular e torna evidente a ideia de colaborao entre usurios. Ele
inclui servios de processador de texto, planilha, apresentao de
slides, formulrio e desenho, que permite aos usurios
compartilhem e colaborem uns com os outros, em tempo real, na
web.
Usurios que compartilham o mesmo documento cooperam entre
si, editando este documento ao mesmo tempo. Para tanto, cada
editor possui um cursor com cor nica e nome prprio, que podem
ser visualizados por outro editor em tempo real. Isto permite que
todos percebam onde a alterao est sendo feita e por quem.
Usurios tambm podem comunicar-se utilizando um bate papo,
que fica fora do documento, quando acharem necessrio. O bate
papo possui a lista de editores que esto online visualizando o
documento. A coordenao das tarefas pode ser realizada tanto
por meio do uso do cursor como pelo histrico de revises e
discusses. O primeiro recurso diz respeito uma lista de todas as
alteraes no documento e de quem as executou. A segunda uma
lista de discusses que os usurios podem utilizar para possveis
comentrios no documento e que tambm possibilita observar
uma estatstica, na forma de grfico, das visualizaes e
discusses referentes ao documento.
O i* uma abordagem orientada a objetivos que permite
descrever tanto dependncias sociais e intencionais no ambiente
organizacional, como tambm atributos de qualidade e
funcionalidades do software [6]. O i* tem dois nveis de
abstrao: o modelo SD (Strategic Dependency Dependncia
Estratgica) e o modelo SR (Strategic Rationale Raciocnio
Estratgico).
O modelo SD apresenta os atores e suas dependncias, enquanto
que o modelo SR apresenta os detalhes internos dos atores. No
modelo SD um ator (representado por crculo) pode depender de
outro para satisfazer um objetivo, para executar uma tarefa,
fornecer um recurso ou satisfazer um softgoal. Os softgoals
(representados por nuvens) esto relacionados a RNFs, enquanto
objetivos (representados por elipses), tarefas (representados por
hexgonos) e recursos (representados por retngulos) esto
relacionados a funcionalidades do software [6]. Na Figura 1
aparece o ator GoogleDocs, que representa o software, e os atores
Dono do Documento e Colaborador, que representam as pessoas
que iro editar o documento colaborativamente. Observe que o
Dono do Documento uma especializao do ator Colaborador
Relacionados atravs do link Is-A). O Dono do Documento
depende do GoogleDocs para realizar a Edio Colaborativa de
Documento e para alcanar o Compartilhamento de Documento.
Ele tambm depende do Colaborador para alcanar a Realizao
de Trabalho Colaborativo. J o Colaborador depende do
GoogleDocs para ter a Visualizao as Aes do Outro Usurio
do documento, para ter o Conhecimento da Autoria das
Mudanas, para obter a Visualizao de Quem est Online e para
ter o Conhecimento da Lista de Participantes. Cada uma destas
dependncias sero alcanadas por tarefas internas ao ator
GoogleDocs, conforme ilustrado na Figura 1.
Figura 1. Modelo SR Parcial para o Google Docs.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 129 -
O modelo SR usado para descrever como as dependncias
externas e os softgoals so alcanados por elemento internos ao
ator expandido. Neste modelo aparecem novos tipos de
relacionamentos, tais como decomposio-tarefa e contribuio.
Um relacionamento de decomposio-tarefa existe entre uma
tarefa e suas partes, mostrando como uma tarefa executada.
Na Figura 1, o ator GoogleDocs apresenta a tarefa raiz Gerenciar
Trabalho Colaborativo que refinada, nas tarefas Disponibilizar
Bate-papo Colorido, Apresentar Cursor Colorido de Edio,
Armazenar Histrico de Revises, Disponibilizar Lista de
Discusso e Compartilhar Documento. O relacionamento do tipo
contribuio descreve uma contribuio de um meio (tarefa) para
a realizao de um fim (softgoal), atravs de um raciocnio
qualitativo (e.g., Help e Hurt significam Ajuda e Prejudica,
respectivamente). Como o Google Docs um sistema atravs do
qual as pessoas pretendem realizar um trabalho colaborativo, os
softgoals que precisam ser alcanados so Comunicao,
Coordenao e Cooperao. Na Figura 1, as tarefas Apresentar
Cursor Colorido de Edio, Armazenar Histrico de Revises e
Disponibilizar Lista de Discusso ajudam a alcanar o softgoal
Coordenao. As tarefas Disponibilizar Bate-Papo Colorido e
Disponibilizar Lista de Discusso ajudam a alcanar a satisfao
do softgoal Comunicao. Por fim, a tarefa Compartilhar
Documento contribui para a satisfao do softgoal Cooperao.
Em [5], o i* foi usado para modelar sistemas colaborativos, porm
a linguagem de modelagem do i* foi utilizada de forma
inadequada, sem respeitar a sua sintaxe e semntica. Na Figura 2,
apresentado um fragmento desta modelagem, no qual se observa
que RNFs de Colaborao, Comunicao e Coordenao foram
modelados como tarefas. Tarefa um elemento de modelagem
usado para representar requisitos funcionais.
Os requisitos funcionais do Google Docs (Cursor Remoto, Lista
de Participantes e Bate-Papo, Histrico de Reviso) esto
representados como recursos, quando deveriam ser tarefas.
Recurso um elemento de modelagem usado para representar
informaes manipuladas. Alm destes maus usos dos elementos
de modelagem do i*, tambm encontramos o uso de dependncias
de objetivos sem a presena de nenhum ator no modelo. Uma
dependncia s pode existir de um ator para outro, conforme
mostrado na Figura 1.
Figura 2. Modelo orientado a objetivos apresentando em [5].
3. CONCLUSO E TRABALHOS
FUTUROS
Neste artigo, propomos o uso de uma abordagem de modelagem
scio-organizacional chamada de framework i*, para o
desenvolvimento de ambientes colaborativos. O trabalho
apresentado ainda est em desenvolvimento, mas a partir da
modelagem parcial do Google Docs, apresentada na Figura 1,
observamos vrios benefcios do uso dos modelos i* no
desenvolvimento de sistemas que visem a colaborao. Por
exemplo, os modelos i* representam como o sistema pretendido
atende aos objetivos dos seus usurios, como os requisitos no-
funcionais so alcanados, alm de modelar os relacionamentos
entre os atores e entre o ator e o sistema. Neste artigo, foi
apresentado o uso correto do i* para modelar os requisitos de
sistemas colaborativos, indicando o mau uso do i* na modelagem
apresentada em [5]. Como trabalhos futuros, pretende-se propor
um conjunto de diretrizes para construir modelos i* voltados para
sistemas CSCW e para guiar a identificao dos requisitos
funcionais que o sistema precisa ter para alcanar os RNFs de
comunicao, coordenao e cooperao.
4. AGRADECIMENTOS
Este trabalho financiado pelo CNPq e pela CAPES.
5. REFERNCIAS
[1] Fuks. H., Raposo. A. B., Gerosa. M. A. 2003. "Do Modelo
de Colaborao 3C Engenharia de Groupware". In: IX
Simpsio Brasileiro de Sistemas Multimdia e Web
Webmidia 2003, Trilha especial de Trabalho Cooperativo
Assistido por Computador, 03-06 de Novembro, Salvador-
BA, pp. 445-452.
[2] Neto. G. G. C., Gomes, A. S., Tedesco. P. 2003. Elicitao
de Requisitos de Sistemas Colaborativos de Aprendizagem
Centrada na Atividade de Grupo. In: XIV Simpsio
Brasileiro de Informtica na Educao - NCE - IM/UFRJ
2003.
[3] Neto. G. G. C. 2008. Estudos qualitativos para elicitao de
requisitos: Uma abordagem que integra anlise scio-cultural
e modelagem organizacional. In: Tese de Doutorado,
Universidade Federal de Pernambuco - Centro de
Informtica Ps-Graduao em Cincia da computao.
[4] Pimentel. M., Gerosa. M. A., Filippo. D., Raposo. A., Fuks.
H., Lucena. C. J. P. 2006. Modelo 3C de Colaborao para o
desenvolvimento de Sistemas Colaborativos. In: Anais do III
Simpsio Brasileiro de Sistemas Colaborativos, pp. 58-67.
[5] Teruel. M. A., Navarro. E., Lpez-Jaquero. V., Montero. F.,
Gonzlez. P. 2011. An Empirical Evaluation of
Requirement Engineering Techniques for Collaborative
Systems,. In : 15th Int. Conf. on Evaluation and Assessment
in Software Engineering, Durham, UK: 2011.
[6] Yu, E. Towards modelling and reasoning support for early-
phase requirements engineering, Proceedings of the 3rd IEEE
International Symposium on Requirements Engineering (RE
97), Annapolis, USA, IEEE Computer Society, p. 226-235,
1997.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 130 -

S E S S O 6
Disseminao de Conhecimento
Sensemaking na Passagem de Servio em Centros de
Terapia Intensiva
Jivago Medeiros
ADDLabs Instituto de Computao
(IC) UFF Universidade Federal
Fluminense
Av. Gal. Milton Tavares de Souza, s/n
Campus da Praia Vermelha, Niteri,
RJ
jmedeiros@ic.uff.br
Rodrigo Andrade
ADDLabs Instituto de Computao
(IC) UFF Universidade Federal
Fluminense
Av. Gal. Milton Tavares de Souza, s/n
Campus da Praia Vermelha, Niteri,
RJ
randrade@ic.uff.br
Ana Cristina Bicharra Garcia
ADDLabs Instituto de Computao
(IC) UFF Universidade Federal
Fluminense
Av. Gal. Milton Tavares de Souza, s/n
Campus da Praia Vermelha, Niteri,
RJ
bicharra@ic.uff.br
RESUMO
Ambientes mdicos e hospitalares necessitam da cooperao entre
varios proIissionais de saude para garantir a continuidade dos
processos atravs dos diIerentes turnos. Para manter a qualidade e
eIicincia das tareIas apos varias trocas de turno (hanaoff)
necessario no apenas a gerao, manuteno e disponibilizao
de inIormaes para os proIissionais que assumiro os proximos
turnos, mas tambm a utilizao de Ierramentas que auxiliem na
tomada de sentido (sensemaking) das inIormaes geradas e
Iornecidas a esses proIissionais. Este trabalho investiga as
diversas variaveis existentes por tras dos processos de hanaoff e
sensemaking Iocando em ambientes mdicos e hospitalares com o
objetivo de desenvolver uma Ierramenta capaz de apoiar o
sensemaking durante o hanaoff mdico em centros de terapia
intensivo.
ABSTRACT
In medical and hospital environment it is imperative that
physicians cooperate with each other across several shiIts to
ensure existing processes continuity. In order to maintain the
eIIiciency oI this processes aIter many handoIIs it is necessary not
only the creation, maintenance and provision oI the inIormation to
the in-shiIt proIessionals, but also the need oI technological tools
to assist them in the Sensemaking process in order to better
understand the inIormation and data that has been provided. This
work investigates the many variables behind the handoII and
sensemaking process Iocusing on medical and hospital
environment in order to developing an technological tool to
support and improve the awareness during medical handoII in a
pediatric intensive care .
Categories and Subject Descriptors
H.4.2 |Decision Support|
General Terms
Experimentation, Human Factors.
Keywords
passagem de servio, hanaoff, sensemaking, cti pediatrico, sistema
de suporte a deciso
1. INTRODUO
Atividades em hospitais so executadas por grupos distintos de
proIissionais que revezam seguindo turnos objetivando garantir a
continuidade dos processos ali existentes.
Os proIissionais que participam desses processos so treinados
para serem capazes de dar continuidade as tareIa em andamento
quando o seu turno iniciado e de repassar essas tareIas para os
agentes de saude dos proximos turnos. Ha tambm proIissionais
que atuam no auxilio a construo de modelos mentais
compartilhados das tareIas com o objetivo de minimizar a
ocorrncia de mal-entendidos.
Mesmo assim, ainda registra-se ocorrncias de Ialhas nos
processos realizados dentro de hospitais. Sendo que muitas dessas
Ialhas esto relacionadas a problemas de comunicao ou perda
de inIormao durante trocas de turno. ConIorme citado por
Flanagan et al. |1| ao relatar que dois teros dos erros mdicos
nos Estados Unidos no periodo de 1994 a 2004 Ioram causados
por Ialhas na comunicao, sendo o hanaoff troca de turno /
passagem de servio uma Iase critica e com grande propenso a
perda de inIormaes. Hanaoffs so tidos como processos
colaborativos assincronos e serial, estando presente em diIerentes
cenarios e por diIerentes razes |2|.
Problemas decorrentes da comunicao, e.g. documentao
mdica imprecisa e Ialta de dados clinicos, so apontados por
Arora et al. em |3| como um dos principais empecilhos na
realizao de hanaoff satisIatorio. Esses problemas trazem
incertezas durante o processo de tomada de deciso mdica, e
essas incertezas por sua vez acarretam repetio de exames,
pedidos exames adicionais e retrabalho na investigao clinica; e
que, alm de incrementar os gastos de recursos e de tempo, podem
culminar em danos diretos e indiretos aos pacientes.
Dowing |4| aponta o hanaoff como o principal evento na garantia
de continuidade do tratamento dos pacientes. A Ialta de
inIormao ou inIormao com pouca qualidade durante o
hanaoff comprometem a capacidade de determinar o estado dos
pacientes e de planejar aes e tareIas necessarias no tratamento e
recuperao dos mesmos. Tornam-se necessarias Ierramentas que
auxiliem a troca e a percepo de inIormaes entre os agentes
para garantir um tratamento eIetivo.
Fazer sentido sobre o que esta ocorrendo, sensemaking |7|,
Iundamental para garantir continuidade num trabalho em grupo
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 132 -
assincrono. Ferramentas para dar suporte a este trabalho
colaborativo podem enIatizar a percepo e a colaborao
assincrona, mitizar os desaIios do hanaoff.
Este artigo tem por objetivo apresentar uma Ierramenta para
apoiar o sensemaking durante o hanaoff mdico em centros de
terapia intensiva.
Para tal, sera necessario entender os problemas relacionados a
perda de percepo durante a passagem de servio e as
necessidades dos diversos proIissionais de saude que colaboram
em diIerentes etapas e diIerentes turnos nos processos que
mantm a continuidade dos servios prestados nos centros de
terapia intensiva.
O dominio de aplicao da nossa pesquisa sera a passagem de
servio em um centro de terapia intensiva de um hospital da rede
SUS do Rio de Janeiro. A escolha deve-se ao interesse da
instituio na participao dos experimentos, dando-nos acesso
aos dados necessarios.
Na proxima seo do trabalho sera apresentada Iundamentao
teorica reIerente ao sensemaking e ao hanaoff em ambientes
hospitalares. Na sequencia apresentaremos o dominio no qual o
trabalho esta sendo realizado juntamente com uma ontologia que
descreve a realizao das tareIas atravs dos turnos no dominio.
Por Iim, Ialaremos sobre a Ierramenta que esta sendo
desenvolvida com o andamento da pesquisa.
2. FUNDAMENTAO TERICA
De acordo com Klein et al. em |5|, a noo de sensemaking
emerge na computao na dcada de 90, com o aparecimento de
algumas deIinies e alguns modelos, como os propostos por
Dervin, Russell et al. e Weick, respectivamente em |6|, |7| e |8|.
Weick deIine o sensemaking como sendo um processo de
entender uma determinada situao, em um determinado contexto
por meio do preenchimento de lacunas cognitivas.
Em |7|, sensemaking descrito como sendo um processo iterativo
de busca pela representao mais adequada para responder
questes especiIicas de determinada tareIa. Como ilustrado pela
Figura 1, o modelo de Russell et al. |7| uma abordagem
centrada na realizao de tareIas.
Figura 1. Modelo de sensemaking proposto por Russell et al.
em 7]
ConIorme nota-se pela Figura 1, a realizao de uma tareIa o
evento motivador do sensemaking. Cada tareIa a ser realizada
possui uma srie de requisitos que devem ser levados em
considerao durante o sensemaking. Durante o processo,
representaes so criadas e testadas iterativamente, at que seja
obtida a representao que se considere como a mais adequada na
resoluo da tareIa.
Weick apresenta o sensemaking como a tentativa natural de
criao de expectativas do que vai acontecer a partir de estimulos
externos. Essas expectativas so geradas a partir de um
enquadramento temporal e espacial especiIico.
Em nosso trabalho abordaremos o sensemaking com um enIoque
cognitivo, buscando entender os motivos que Iazem com que
inIormaes indispensaveis para o processo de hanaoff no sejam
reportadas ou mesmo quando essas inIormaes so reportadas ha
ocorrncia de casos relacionados a no-percepo ou ainda a
percepo errnea dessas inIormaes por parte dos agentes
envolvidos nos processos.
ConIorme citamos ao longo do trabalho, o hanaoff em ambientes
mdicos e hospitalares esta sujeito a diversas Ialhas que levam a
perda de percepo, principalmente a Ialhas relacionadas a
manuteno de inIormaes relevantes para a continuidade dos
processos. Sarcevic e Burd apresentam em |9| um estudo que
demonstra a perda de inIormao em um ambiente de resgate e
emergncia mdica no qual a equipe de emergncia que eIetua o
resgate; transIere o paciente e as inIormaes necessarias a
continuidade nos processos de tratamento desse paciente para a
equipe de emergncia mdica do hospital que dara continuidade
ao tratamento. O primeiro Iato apontando por Sarcevic e Burd
para a ocorrncia na Ialha da transmisso de inIormaes a
inexistncia de estrutura e modelos para a criao de relatorios
pela equipe de resgate. E em segundo lugar, o Iato do hanaoff do
paciente ser executado em paralelo ao hanaoff das inIormaes o
que acaba Iazendo com que a equipe mdica que recebe o
paciente tenha maior ateno pelas inIormaes que sero
necessarias em um primeiro momento, no tomando sentido de
inIormaes que so necessarias em um segundo momento. O
objetivo de Sarcevic e Burd apoiar o desenvolvimento de
tecnologia para transIerncia de inIormao identiIicando os
desaIios especiIicos enIrentados pela equipe de resgate e de
trauma durante o hanaoff.
O hanaoff em ambientes hospitalares, bem como a gerao e
manuteno de inIormaes a serem utilizadas nesses processos
tambm so estudados por Goldsmith et al. em |11|. Eles
apresentam um estudo realizado no Brigham ana Womens
Hospital (BWH) em Boston, onde mesmo ocorrendo cerca de dois
milhes de hanaoffs anualmente, a padronizao das inIormaes
necessarias para um hanaoff (eIiciente) mostrou-se bastante Ialha
por parte do departamento de enIermagem do hospital. O que
aumenta o risco de aIunilamento e perda de inIormaes e
consequentemente gera Ialhas no tratamento aos pacientes.
Goldsmith et al. |11| levantam os requisitos para o
desenvolvimento de um sistema baseado em plataIorma web que
seria capaz de evitar problemas relacionados ao hanaoff da
enIermagem no BWH como: impreciso na transIerncia de
dados, Ialta de inIormao critica, aIunilamento de inIormaes,
erro na transcrio dos dados para preparao e entrega dos
relatorio durante o hanaoff.
ConIorme apresentado por |9| e |11|, a Ialta de padronizao na
gerao e manuteno de inIormaes contribui negativamente
para a continuidade dos processos atravs dos hanaoffs em
ambientes mdicos e hospitalares. Porm, apenas manter e
apresentar inIormaes no o suIiciente para que as atividades
continuem a serem executadas de maneira satisIatoria apos as
trocas de turno. E necessario tambm que a tomada de sentido
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 133 -
dessas inIormaes pelos agentes participantes dos eventos seja
apoiada por Ierramentas que auxiliem o sensemaking das
inIormaes. O Apolo uma Ierramenta que que tem por objetivo
guiar o usuario de maneira incremental e interativa na explorao
de um grande volume de inIormaes por meio da combinao de
visualizao, interIaces ricas e aprendizado de maquina,
auxiliando assim o usuario no sensemaking dessas inIormaes
|12|. O Apolo trabalha com uma abordagem bottom-up do
sensemking, o que signiIica dizer que o usuario vai Iazendo
sentindo das inIormaes de maneira incremental a medida com
que interage com elas. A Ierramenta Ioi inicialmente desenvolvida
para trabalhar com citaes da literatura cientiIica e apresentou
um melhor desempenho em um teste de laboratorio do que outras
Ierramentas tradicionalmente utilizadas para esse Iim |12|.
Em complemento a Ierramentas de sensemaking como por
exemplo o Apolo |12|, ha tambm propostas que abordam a
utilizao de arteIatos cognitivos para apoiar a tomada de sentido.
Norman deIine arteIatos cognitivos como sendo dispositivos
artiIiciais que conservam, exibem ou operam sobre inIormaes
com o objetivos de Iornecer meios de modelar ou representar
essas inIormaes de tal maneira que incremente a perIormance
cognitiva humana |13|.
Ha varias propostas de desenvolvimento e utilizao de arteIatos
cognitivos em ambiente mdicos, como por exemplo Bossen,
Wears et al. e Xiao et al., que exploram o uso do quadro branco
como arteIato cognitivo no suporte a comunicao, na
colaborao entre os diversos agentes de saude em e na resoluo
de problemas de problemas e tareIas respectivamente no
departamento de hematologia em |14|, salas de emergncia em
|15| e salas de operao em |16|.
ConIorme vimos nessa seo, ha uma grande necessidade de se
realizar trabalhos que apresentem mtodos, modelos e Ierramentas
que sejam capazes no apenas de padronizar, gerar e manter
inIormaes atravs dos hanaoffs em ambientes mdicos e
hospitalares, mas tambm necessario que essas mesmas
Ierramentas apoiem o sensemaking das inIormaes.
3. DOMINIO DE APLICAO: CTI
PEDITRICO DE UM HOSPITAL
PBLICO FEDERAL
O Ioco do estudo se da no dominio do Centro de Tratamento
Intensivo Pediatrico (CTI-PEDIATRICO) de um hospital Iederal
localizado no Rio de Janeiro. A seguir, descreveremos a dinmica
do cenario hospitalar e suas caracteristicas.
3.1 CTI-PEDITRICO
O Centro de Tratamento Intensivo Pediatrico (CTI-
PEDIATRICO) situa-se no Hospital Geral da Lagoa Hospital da
Lagoa hospital publico Iederal localizado no bairro Jardim
Botnico na cidade do Rio de Janeiro. O hospital possui um
atendimento mensal de aproximadamente 20 mil pacientes,
realizando cerca de 810 internaes e 650 cirurgias mensais.
Conta com 243 leitos e cerca de 100 mdicos atuantes na pediatria
e areas correlacionadas.
Atualmente, cerca de 20 dos mdicos so contratados, cedidos
ou do municipio gerando uma rotatividade e risco de
descontinuidade de trabalho muito maior, pois em qualquer
momento podem desligar-se. Alm disso, como a contratao de
carater temporario, medidas de inovaes podem vir a ser
prejudicadas devido a essa rotatividade do trabalhador.
O CTI-PEDIATRICO uma unidade de tratamento intensivo
inIantil que objetiva prover o cuidado ideal de pacientes
criticamente enIermos e promover a monitorao continua dos
pacientes instaveis.
A carga de trabalho organizada em turnos ocorridos duas vezes
ao dia, acompanhada com um rouna diario e troca de turno
prevista as 7h e as 13h. A equipe de trabalho atuante no CTI-
PEDIATRICO composta por dois mdicos responsaveis pelo
planto, residentes, mdicos especialistas, enIermeiros e tcnicos.
O rouna um evento realizado no CTI-PEDIATRICO durante o
hanaoff das 13h. No rouna so discutidas individualmente cada
internao sendo analisadas inIormaes de diagnosticos,
evoluo do quadro clinico, tareIas passadas e propostas de novas
tareIas, diIerentes abordagens para tratamento, entre outras.
Durante o rouna as discusses e decises so registrados em livro
ata do turno. Posteriormente ao rouna, as inIormaes pertinentes
so atualizadas no quadro branco.
A passagem de turno no CTI-PEDIATRICO apoiada por alguns
arteIatos cognitivos, tais como, quadro-branco, livro ata de turno
no qual alm de conter inIormaes discutidas no rouna, contm
o registro das atividades desenvolvidas e das intercorrncias
ocorridas durante o turno; e o prontuario do paciente.
Pretendemos no decorrer da pesquisa realizar um estudo
etnograIico no dominio da aplicao que nos Iornecera
caracteristicas e evidncias necessarias ao desenvolvimento da
Ierramenta proposta nesse trabalho.
A reviso bibliograIica at ento realizada (vide por exemplo |1| e
|9|) nos permite notar que alguns dos processos e modelos
descritos anteriormente poderiam ser modiIicados objetivando
maior eIicincia na troca de inIormaes entre os proIissionais
plantonistas. Como por exemplo a utilizao de modelos na
representao de inIormaes no livro de turno o que Iacilitaria
tambm a visualizao e tomada de sentido dessas inIormaes;
Uma vez que o grande volume de inIormaes relacionado a cada
internao registrado de maneira prolixa, diIicultando a analise
do estado corrente do paciente e consequentemente a tomada de
deciso mdica.
3.2 ONTOLOGIA
Segundo |17| Ontologia uma especiIicao explicita de uma
conceitualizao. Em outras palavras, a ontologia a
representao de um dominio em um modelo abstrato contendo
seus conceitos e suas restries inerentes, representados em um
conjunto de decises explicitas. Portanto, uma ontologia deve ser
explicita, Iormal (passivel de ser processada por uma maquina) e
compartilhada (descrever um conhecimento comum a um grupo).
A ontologia ilustrada pela Figura 2 representa o dominio para o
qual estamos propondo o desenvolvimento da Ierramenta para
apoiar o sensemaking durante o hanaoff mdico em centros de
terapia intensiva. Essa ontologia resulta da elicitao preliminar
de requisitos, reunies com a equipe mdica do CTI-
PEDIATRICO, acompanhamento da passagem de servio e
acompanhamento de rounas. Foram realizadas tambm reunies
com stakeholaers do hospital, onde validamos as inIormaes
coletadas nas reunies, nas observaes (de hanaoffs e rounas) e
na reviso bibliograIica. Espera-se no entanto que a ontologia
ilustrada pela Figura 2 soIra alteraes a medida que progredimos
com a pesquisa.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 134 -
Figura 2. Ontologia do Domnio de Aplicao
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 135 -
Figura 3. Quadro Branco - Parte da ferramenta que est sendo desenvolvida
Na ontologia vemos representada a necessidade dos agentes de
atuarem nas internaes realizando tareIas que tem por objetivo
alterar o estado de uma variavel para um novo estado considerado
ideal. Na maioria dos casos necessario que um historico
composto de: TareIas previamente realizadas, estados do paciente
ao longo da internao e os valores da variaveis a medida que
essas so alteradas, seja consultado para auxiliar os agentes a
atuarem da maneira mais eIiciente possivel. Ha tambm a
necessidade de que esse historico esteja armazenado e disponivel
em midias que Iacilitem o acesso e melhore a tomada de sentido.
4. FERRAMENTA PARA APOIAR O
HANDOFF MDICO EM CENTROS DE
TERAPIA INTENSIVA
Este trabalho ainda encontra-se em andamento e como citado
anteriormente, pretendemos realizar um amplo estudo etnograIico
no CTI-PEDIATRICO do Hospital da Lago que nos ajude a
compreender com maior exatido no apenas as peculiaridades e
caracteristicas envolvidas no hanaoff e sensemaking mas o
impacto causado por esses na continuidade dos processos ali
existentes.
Porm a Ierramenta aqui proposta esta sendo desenvolvida de
maneira iterativa a medida que avanamos com nossa pesquisa, o
que ja nos Iorneceu uma verso preliminar da Ierramenta e que em
breve devera sem implantada em nivel experimental no CTI-
PEDIATRICO do Hospital da Lagoa.
A Figura 3 representa uma parte da Ierramenta que consiste em
uma verso digital do quadro branco utilizado no CTI-
PEDIATRICO. Averiguamos que no CTI-PEDIATRICO um
angente ao iniciar o seu turno veriIica o quadro branco para ter
uma viso preliminar da situao de cada paciente internado.
Apos essa veriIicao preliminar, o agente da inicio a suas
atividades. Acreditamos que disponibilizando um quadro branco
digital que Iornea maior riqueza e clareza das inIormaes ao
mesmo tempo que Iacilite a tomada de sentido da situao
corrente do setor seria de bastante valia para os agentes de saude
no apenas no inicio do turno mas tambm no decorrer das
atividades.
As trs primeiras colunas esto relacionadas a identiIicao do
paciente. A primeira o leito associado a internao, a segunda
lista as pulseiras utilizadas pelo paciente (azul indica inIeco
resistente, amarela risco de queda e vermelha alergia), sendo que
o sistema permite que sejam adicionados comentarios a cada
pulseira, comentarios esses que podem ser visualizados quando
clicamos na pulseira. A terceira coluna contem o ultimo nome,
primeiro nome, e data de nascimento do paciente. A quarta coluna
tras o estado (Estavel, Instavel, IndeIinido) atual do paciente,
juntamente com um comentario em relao a situao do paciente,
data, hora e o agente que realizou o cadastro daquela situao. O
sistema permite tambm que um historico da situao do paciente
seja visualizado ao clicarmos na 'lupa proxima as inIormaes.
Assim sendo, o nosso objetivo apoiar o agente na tomada de
sentido dos estados dos pacientes internados nesse setor por meio
da exibio de inIormaes como o estado do paciente, o leito que
ele se encontra e a avaliao mais recentes das variaveis mais
relevantes para internao. O sistema permite que o agente
visualize um historico do estado do paciente e tambm um
historico da avaliao das variaveis da internao com o objetivo
de auxiliar o agente na tomada de deciso de suas primeiras aes
no turno. A coluna 'Avaliao lista a ultima avaliao das
principais variaveis (temperatura, presso, Irequncia cardiaca,
entre outras) associadas a internao, juntamente com a data, hora
do registro da inIormao no sistema e assim como na coluna
'Situao possivel visualizar o historico de avaliaes. Por
ultimo, a coluna 'Admisso tras a data e hora de admisso do
paciente no CTI-PEDIATRICO juntamente com um comentario
relacionado a essa admisso. Tambm possivel visualizar outras
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 136 -
inIormaes adicionais da internao clicando na 'lupa da
coluna 'Admisso.
O sistema esta sendo desenvolvido para a plataIorma web
utilizando JAVA Enterprise Eaition (EE) em sua verso 6.0 e
frameworks como Spring Framework, Java Server Faces (JSF) e
Hibernate, o que permitira maior portabilidade, manutenibilidade
e continuidade no desenvolvimento do projeto.
Um importante ponto levado em considerao no
desenvolvimento da Ierramenta a quantidade e a Iorma de
interao dos agentes com o sistema. Pois essas devem causar o
menor impacto possivel na rotina desses agentes, como por
exemplo, no criando um monte de novas tareIas que devem ser
executadas apenas para garantir a alimentao do sistema. Assim,
a arquitetura projetada nos Iaz prever um cenario onde os
diIerentes agentes podero interagir com o sistema sem um custo
maior na realizao de suas tareIas rotineiras. Os inIermeiros por
exemplo, utilizando-se de dispositivos como tablets seriam
capazes de Iazer a leitura das variaveis dos pacientes (temperatura,
presso, Irequncia cardiaca, entre outras) diretamente no sistema
e posteriormente imprimir os relatorios das avaliaes para Iins de
arquivamento, enquanto os mdicos, durante o rouna por
exemplo, tambm utilizando tablets atualizariam diretamente no
sistema inIormaes como a situao de cada paciente e tambm
tareIas realizadas e a realizar, intercorrncias e eventos adversos
ocorridos durante o ultimo turno; e posteriormente, imprimiriam
do proprio sistema um relatorio do rouna para anexa-lo junto ao
livro de turnos. Outros importantes pontos para o
desenvolvimento de uma Ierramenta que possa Iuncionar de
maneira eIiciente no ambiente pesquisado tambm Ioram
levantados, e sero amadurecidos com o andamento da pesquisa,
como por exemplo a necessidade de importar inIormaes de
sistemas ja em utilizao no Hospital da Lagoa.
5. CONSIDERAES FINAIS
De acordo com o que Ioi apresentado no decorrer do trabalho
Iicou evidente que a gerao, manuteno e disponibilizao de
inIormaes que possam contribuir para a continuidade dos
processos um ponto de suma importncia em um ambiente onde
ha colaborao entre diIerentes proIissionais. Ambientes onde ha
passagem de turno (hanaoff) a gerao e disponibilizao de
inIormaes entre os turnos um ponto critico em virtude da
necessidade dos proIissionais dos proximos turnos necessitarem
dessas inIormaes para manter com qualidade a continuidade dos
processos. A qualidade na continuidade dos processos capaz de
evitar acidentes e diminuir riscos de perdas humanas e Iinanceiras.
Porm, apenas gerar e disponibilizar inIormaes no o
suIiciente, haja vista a necessidade de Ierramentas capazes de
melhorar a tomada de sentindo dessas inIormaes (sensemaking)
por esses proIissionais.
A computao uma disciplina capaz de contribuir nos estudos e
na proposta de mtodos e modelos que possam auxiliar na
realizao de hanaoffs eIicientes auxiliando no sensemaking
durante a passagem de servios. Subareas da computao como a
Inteligncia ArtiIicial e Interao Humano-Computador podem
contribuir de maneira signiIicativa para os esIoros relacionados
ao hanaoff e ao sensemaking.
Em trabalhos Iuturos pretendemos implantar a Ierramenta de
apoio ao hanaoff proposta nesse artigo. Apos a implementao
teremos a oportunidade de avaliar os reais impactos causados pela
Ierramenta nos processos colaborativos do dominio da aplicao e
entender se ela tornara o sensemaking mais eIiciente.
AGRADECIMENTOS
Gostariamos de deixar registrado os nossos agradecimentos a
equipe do Hospital Federal da Lagoa, em especial a Dra. Alice
Eulalia, a Dra. Roberli Bicharra e a Dra. Maria Cristina Senna
Duarte.
6. REFERNCIAS
|1| Flanagan ME, Patterson ES, Frankel RM, Doebbeling BN.
(2009) Evaluation oI a physician inIormatics tool to improve
patient handoIIs.J Am Med InIorm Assoc. Jul-Aug.
16(4):509-15. Indianapolis, IN, USA.
|2| Nikhil Sharma. 2008. Sensemaking handoII: When and
how?. In Proceedings oI the American Society Ior
InIormation Science and Technology.45(1): 1-12.
DOI10.1002/meet.2008.1450450234.
http://dx.doi.org/10.1002/meet.2008.1450450234.
|3| Arora V, Johnson J, Lovinger D, Humphrey HJ, Meltzer DO.
2005. Communication Iailures in patient sign-out and
suggestions Ior improvement: A critical incident analysis.
Qual SaI Health Care. 2005;14:4017.
|4| Dowding, D. 2008. Examining the eIIects that manipulating
inIormation given in the change oI shiIt report has on nurses`
care planning ability. Journal oI advanced Nursing. 33(6):
836-46. DOI: 10.1046/j.1365-2648.2001.01723.x.
|5| Klein, G. Moon, B.and HoIIman, R.R. 'Making Sense oI
Sensemaking 1: Alternative Perspectives, Intelligent
Systems, vol. 21, no. 4, 2006, pp. 7073.
|6| Dervin, B. Sense-Making Theory and Practice: An
overview oI user interests inknowledge seeking and use.
(1998) Journal oI Knowledge Management, 2(2), 36-46.
|7| Russell, Daniel M., SteIik, Mark J., Pirolli, Peter, Card,
Stuart K. (1993) "Cost structure oI sensemaking"
Proceedings oI the CHI ' 93. 269-276.
|8| Weick, K. E. (1996). Sensemaking in organizations.
Newbury Park, CA: Sage.
|9| Aleksandra Sarcevic and Randall S. Burd. 2009. InIormation
handover in time-critical work. In Proceedings oI the ACM
2009 international conIerence on Supporting group work
(GROUP '09). ACM, New York, NY, USA, 301-310.
DOI10.1145/1531674.1531720
http://doi.acm.org/10.1145/1531674.1531720
|10| Dorrit Billman and Eric A. Bier. 2007. Medical sensemaking
with entity workspace. In Proceedings oI the SIGCHI
conIerence on Human Iactors in computing systems (CHI
'07). ACM, New York, NY, USA, 229-232.
DOI10.1145/1240624.1240662
http://doi.acm.org/10.1145/1240624.1240662
|11| Goldsmith D, Boomhower M, Lancaster D R, Antonelli M,
Kenyon M, Benoit A, Chang F, Dykes P. 2010. Development
oI a Nursing HandoII Tool: A Web-Based Application to
Enhance Patient SaIety. In Proceedings oI AMIA Annu
Symp Proc. 2010; 2010: 256260.
|12| Chau D. H. P., Kittur A., Hong J. I., Faloutso C. (2011)
Apolo: Making Sense oI Large Network Data by Combining
Rich User Interaction and Machine Learning. CHI 2011,
Vancouver, Canada.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 137 -
|13| Norman, Donald A. (1991): Cognitive ArtiIacts. In:
Carroll,John M. (Eds.) 'Designing Interaction: Psychology at
the Human-Computer InterIace. Cambridge University
Press
|14| Bossen C (2002) The parameters oI common inIormation
spaces: the heterogeneity oI cooperative work at a hospital
ward. In: Proceedings oI the 2002 ACM conIerence on
Computer supported cooperatXiao Y, Hu P, Moss J, de
Winter J, Venekamp D, Mackenzie C, Seagull F, Perkins S
(2008) Opportunities and challenges in improving surgical
work Ilow. Cogn Tech Work 10(4):313321
|15| T. R. Gruber. Toward principles Ior the design oI ontologies
used Ior knowledge sharing. Presented at the Padua
workshop on Formal Ontology, March 1993, later published
in International Journal oI Human-Computer Studies, Vol.
43, Issues 4-5, November 1995, pp. 907-928. ive work.
ACM, New Orleans
|16| Wears R, Perry S, Wilson S, Galliers J, Fone J (2007)
Emergency department status boards: user-evolved arteIacts
Ior inter- and intra-group coordination. Cogn Technol Work
9(3):163170
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 138 -
Gesto de contexto no levantamento colaborativo de
processos de negcio
Douglas Machado Silva
Programa de Ps-Graduao em Informtica
Ncleo de Pesquisa e Prtica em Tecnologia
Universidade Federal do Estado do
Rio de Janeiro UNIRIO
Av. Pasteur, 458, Rio de Janeiro RJ
CEP: 22290-240 Brazil
+55-21-3873-6400 / 2530-8088
douglas.machado@uniriotec.br
Renata Mendes de Araujo
Programa de Ps-Graduao em Informtica
Ncleo de Pesquisa e Prtica em Tecnologia
Universidade Federal do Estado do
Rio de Janeiro UNIRIO
Av. Pasteur, 458, Rio de Janeiro RJ
CEP: 22290-240 Brazil
+55-21-3873-6400 / 2530-8088
renata.araujo@uniriotec.br
Flvia Maria Santoro
Programa de Ps-Graduao em Informtica
Ncleo de Pesquisa e Prtica em Tecnologia
Universidade Federal do Estado do
Rio de Janeiro UNIRIO
Av. Pasteur, 458, Rio de Janeiro RJ
CEP: 22290-240 Brazil
+55-21-3873-6400 / 2530-8088
flavia.santoro@uniriotec.br
ABSTRACT
O levantamento de processos de negocio uma atividade
eminentemente colaborativa, de construo de conhecimento
atravs do compartilhamento de vises e inIormao sobre um
objeto comum, que o processo. O levantamento geralmente
realizado atravs de entrevistas com os envolvidos na execuo
do processo, onde o analista de processos tem como principal
Ionte de inIormao o entrevistado. InIormaes relevantes que
interessam ao levantamento podem estar dispersas em diversas
Iontes, incluindo levantamentos realizados por outros analistas, e
podem serignoradas no momento da entrevista. A diIiculdade em
se perceber oportunidades de uso e compartilhamento de
inIormaes no momento da entrevista pode tornar o
levantamento Iragmentado e levar a construo de um modelo de
processo inconsistente ou incompleto. Este artigo apresenta uma
proposta para o levantamento de processos de negocio baseada
em colaborao e orientada a contexto, visando minimizar a
Iragmentao deinIormao.
Categories and Subject Descriptors
H.4.1|Office Automation|: Groupware.
General Terms
Experimentation.
Keywords
Levantamento colaborativo de processos de negocio; gesto de
contexto.
1. INTRODUO
Modelos de processos de negocios vm ganhando cada vez mais
importncia para as organizaes, pois so considerados como
Ionte para projetos de melhoria de processos, redeIinio de
estratgias de negocios e especiIicao de requisitos de sistemas
de inIormao |1, 2, 3|. A elicitao de processos uma
atividade eminentemente colaborativa, de construo de
conhecimento comum e resoluo de conIlitos e ambigidades.
Diversas tcnicas so utilizadas para descobrir e elicitar
processos de negocios. Dentre as diversas abordagens
|1,2,4,5,6,7|, a que mais se pratica nas organizaes so as
entrevistas |1|. Durante as entrevistas, a principal Ionte de
inIormao sobre o processo o proprio entrevistado. As
entrevistas tendem a gerar resultados Iragmentados, onde os
executores do processo so entrevistados em momentos distintos,
possivelmente por diIerentes analistas.
Independentemente da tcnica utilizada, o levantamento de
processos no pode prescindir de atividades de consolidao das
inIormaes obtidas. Nesta consolidao, as inIormaes obtidas
por diIerentes analistas, utilizando-se de diIerentes tcnicas,
devem ser reunidas e organizadas, bem como possiveis conIlitos
devem ser solucionados. O resultado desta consolidao se
reIlete no modelo de processo construido, que corresponde ao
conhecimento comum obtido nolevantamento.
O Iluxo de atividades de levantamento e consolidao,
dependendo da complexidade, relevncia e abrangncia do
processo em questo, pode trazer diIiculdades tanto na
produtividade do levantamento como na qualidade Iinal do
modelo. Em relao a produtividade, a Iase de consolidao pode
apresentar conIlitos que justiIiquem o retorno as Iontes de
inIormao, consumindo tempo e podendo gerar atrasos. Em
relao a qualidade, as abordagens de maneira geral tratam parte
das inIormaes vises pessoais, registros em documentos,logs
de aplicaes etc. Mesmo que o analista reuna todas as
inIormaes disponiveis para realizar o levantamento, ele se
depara com o problema de identiIicar a relevncia das
inIormaes vindas destas diversas Iontes, podendo limitar sua
viso das inIormaes e a gerao de modelos de processo
incompletos e/ouinconsistentes.
Este artigo apresenta uma abordagem de levantamento
colaborativo de processos de negocio, orientada a contexto, que
tem como objetivo permitir ao analista acessar inIormaes
relevantes durante a realizao do levantamento de processos de
negocio, em particular durante as entrevistas. A proposta que o
levantamento seja realizado de Iorma a se construir
coletivamente um rascunho do modelo do processo. Associado a
isto, a proposta sugere que mecanismos de gesto de contexto
possam auxiliar o analista, no momento de uma entrevista, com a
apresentao de inIormaes relevantes ja obtidas no contexto do
levantamento deste mesmo processo. A proposta visa aumentar a
produtividade e a qualidade do levantamento por permitir que o
analista, no momento de uma entrevista, seja capaz de Iazer uso
e/ou complementar as inIormaes ja obtidas atravs de outras
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 139 -
Iontes no mesmo levantamento, antecipando ou Iacilitando a Iase
de consolidao.
O artigo esta organizado em cinco sees. Na Seo II so
apresentados os principais cenarios e abordagens de
levantamento de processos de negocio. A Seo III apresenta a
proposta. A seo IV apresenta os resultados de um estudo
exploratorio. A Seo V conclui o trabalho e aponta trabalhos
Iuturos.
2. LEVANTAMENTO DE PROCESSOS
BASEADO EMENTREVISTAS
As abordagens para levantamento apresentadas na literatura
podem ser classiIicadas basicamente em dois grupos: baseadas no
uso de entrevistas e baseadas em tcnicas de minerao. As
baseadas em entrevista so a maioria |1, 8, 9| e pressupe que o
levantamento se d a partir das inIormaes disponiveis na
experincia pessoal dos participantes do processo. Ja as tcnicas
baseadas em minerao usam outras Iontes de inIormao. E o
caso das abordagens propostas por |6| e |10|, que partem da
analise de interIaces, codigos-Ionte e bases de dados de
aplicaes. Outras Iazem uso apenas do codigo-Ionte, como os
trabalhos de |4, 5, 6, 11|. Propostas mais recentes combinam
estas duas vises, permitindo, por exemplo, a minerao de
processos a partir de historias narradas pelos executores dos
processos |1, 11|. Nestetrabalho, nosinteressa astcnicas que se
baseiam em entrevistas onde a necessidade de colaborao entre
analistas e entrevistados Iundamental.
As entrevistas normalmente so realizadas on site, ou seja, no
local de trabalho dos participantes, tambm sendo possivel a
realizao off site, geralmente em algumlocal proximo de onde o
participante estabelecido. Dependendo da quantidade de
participantes do processo e do distanciamento geograIico entre
eles, o levantamento pode ser realizado por uma equipe de
analistas. E necessario, ento, que os analistas se reunam para
compartilhar as inIormaes levantadas. Cada um dos analistas
pode ter Ieito registros em algum soItware, em papel, em audio
ou at mesmo em video, tendo internalizado tambm algum
conhecimento tacito. A partir dessa reunio entre os analistas
que as duvidas e as incompletudes so endereadas e um modelo
construido.
As tcnicas baseadas em entrevista tm uma srie de limitaes
inerentes a propria entrevista, como o vis na escolha dos
entrevistados, vis por parte do entrevistador e pouco
entendimento do dominio por parte do analista |1|. Outra
limitao se reIere ao problema de se levantar processos em um
ambiente distribuido, principalmente quando diIerentes
entrevistado apresentam deIinies ou vises diIerentes para um
mesmo item abordado no levantamento. Caso haja uma duvida
do analista em relao a uma inIormao coletada durante o
levantamento, qual caminho este analista deve percorrer para
sanar esta duvida? Como o analista deve proceder, caso ele no
compreenda determinados conceitos abordados durante o
levantamento?
E sabido que a existncia de varios participantes pode auxiliar
em um entendimento mais completo sobre o dominio,
principalmente se eles tiverem papis distintos na execuo do
processo. Entretanto, comum que cada participante tenha
vises limitadas ou at mesmo conIlitantes sobre as atividades.
Alm disso, os participantes, com seus varios pontos de vista,
podem induzir o analista a ter uma interpretao parcial ou at
mesmo equivocada de conceitos ou Iormas de execuo do
processo. Esses conIlitos e essas incompletudes de inIormao
so so solucionados na medida em que os analistas se reunem ou
agendam novas entrevistas.
Como a consolidao das inIormaes so acontece depois das
entrevistas, a realizao de reunies pode ter como consequncia
um atraso ou at mesmo reduo de qualidade no levantamento.
Alm do tempo gasto com as reunies em si, os analistas podem
ter que realizar novas entrevistas para poder solucionar conIlitos
eincompletudesidentiIicados na reunio.
Uma possibilidade seria o analista levar para cada entrevista,
todas as inIormaes ja levantadas por ele e pelos demais.
Entretanto, ter todas as inIormaes no momento da entrevista
pode at mesmo prejudicar a conduo da entrevista, ja que nem
todas essas inIormaes sero uteis ao levantamento. Em ambos
os casos, tem-se o problema da Iragmentao das inIormaes,
conIorme ilustrado na Figura 1. As inIormaes sobre o
levantamento Iicam dispersas, diIicultando com que o analista
acesse ainIormao que relevante para o momento.
Mesmo que o analista tivesse posse de toda a inIormao
disponivel para o levantamento, passaria pelo problema de ter
que consolida-las e analisar sua relevncia. O argumento desta
pesquisa que, se a colaborao Ior associada uma abordagem de
contexto, possivel que os analistas tenham acesso a
inIormaes compartilhadas que sejam relevantes para o
levantamento. A seo a seguir apresenta a abordagem proposta.
3. LEVANTAMENTO COLABORATIVO
DE PROCESSOS ORIENTADO A
CONTEXTO
A abordagem proposta neste trabalho tem por base o
levantamento baseado na construo de rascunhos de diagramas
de processos, na colaborao e na gesto de contexto.
Os rascunhos de diagramas de processos so compostos
basicamente por trs elementos: eventos de inicio e Iim,
atividades e desvios. Esses rascunhos no chegam a ser o modelo
do processo em si por terem um conjunto de elementos reduzido
em relao aos modelos gerados por uma Ierramenta
convencional de modelagem de processos Ieita para ambientes
desktop.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 140 -
Figura 1. Analista de negcio emmeio fragmentao das
informaes sobre olevantamento
Entretanto, permitem o registro visual do processo e tambm de
anotaes Ieitas a mo livre. A simplicidade do rascunho permite
que o analista Iaa suas anotaes com rapidez, sem prejudicar o
levantamento, alm de Iacilitar o compartilhamento.
3.1 Colaborao
No novo cenario de levantamento proposto, a equipe de analistas
compartilha rascunhos de diagramas de processos construidos
durante entrevistas, conIorme proposto em |12|. Desta Iorma, os
analistas comeam a rascunhar o processo no momento da
realizao das entrevistas delevantamento.
Atravs da colaborao os analistas compartilham os rascunhos
ja elaborados e todas as inIormaes que neles possam estar
contidas, como regras, atividades, conceitos, atores e etc., assim
como podem se comunicar diretamente com o analista
responsavel pelo rascunho que esta sendo visualizado. Desta
Iorma, um analista que estiver realizando uma entrevista e tiver
duvidas, pode consultar os rascunhos ou os proprios analistas no
mesmo instante e assim completar seu entendimento, sanar
duvidas ou descobririnconsistncias.
3.2 Gesto de contexto
Ter acesso a todas as inIormaes ja levantadas sobre o processo
pode representar um problema se no houver uma Iorma de se
identiIicar o que relevante. A abordagem de gesto de contexto
|13| pode auxiliar na identiIicao das inIormaes relevantes,
eliminando ou ao menos diminuindo a necessidade dos analistas
re-entrevistarem os participantes ou se reunirem at chegar a um
consenso.
Contexto descrito por |14| como tudo sobre toda a situao
relevante para uma aplicao e seu conjunto de usuarios ou
qualquer inIormao que pode ser usada para caracterizar a
situao de uma entidade. Uma entidade pode ser uma pessoa,
um lugar ou um objeto que considerado relevante para a
interao entre o usuario e a aplicao, incluindo o proprio
usuario e a aplicao |14|
Em |15| destacado que inIormaes sobre o contexto que
permeiam as atividades passadas de uma equipe podem ajudar a
compreender situaes atuais. Desta Iorma, a transIerncia de
conhecimento entre atores so acontece plenamente se houver um
Ioco comum deinterpretao e um contexto |15|.
A proposta apresentada neste artigo requer que a colaborao
seja apoiada pela gesto de contexto. Com inIormaes de
contexto associadas aos rascunhos, o analista pode registrar
adequadamente o contexto do levantamento. A partir desses
registros os analistas podem ampliar seu entendimento e obter
consenso durante a realizao da entrevista, solucionando
eventuais conIlitos de entendimento. Se os rascunhostiverem um
contexto associado, ento possivel sugerir recomendaes para
o analista sobre inIormaes que estejam relacionadas ao
contexto no qual o mesmo Iaz o levantamento. No caso de uma
duvida no solucionada ou um conIlito no resolvido, tambm
possivel, a partir dos registros, recorrer a Ionte da deIinio para
busca deinIormaes complementares.
Ha uma srie de elementos que caracterizam o contexto do
levantamento. Se durante o processo de levantamento surge um
termo ou um conceito cuja deIinio no seja Iamiliar para o
analista, torna-se ento necessario registrar o contexto no qual
este termo Ioi deIinido para que Iuturamente esta inIormao
possa ser recuperada de Iorma contextualizada. Se o termo
deIinido por um participante, deve ser considerado que este
participante tem papis no processo, cargos na organizao e
tempo de experincia em determinados dominios. Alm disso,
essas deIinies podem ter sido obtidas em diIerentes ocasies,
como reunies, workshops, entrevistas, emails, teleIonemas,
conversas inIormais e etc. Em qualquer um desses eventos,
possivel se determinar o assunto/pauta, os participantes, a data e
o local em que Ioram realizados, alm da situao que motivou a
duvida sobre o esclarecimento da deIinio dotermo.
Todos os elementos descritos at ento so Iortes indicadores de
se o termo Ioi deIinido de Iorma ampla, abrangente, ou se
apresenta vis de acordo com as caracteristicas do momento de
sua deIinio ou de sua autoria. Desta Iorma entende-se quetodo
termo ou atividade identiIicado durante o levantamento tem um
contexto associado, possibilitando o uso de uma abordagem
orientada a contexto para seu armazenamento e Iutura
recuperao. No caso de uma entrevista de levantamento, o
contexto pode ser representado atravs dos elementos descritos
na Tabela 1. Os autores, por sua vez, tambm tm suas
caracteristicas, como papis na atividade, cargos na organizao
e tempo de experincia no dominio. Ja as ocasies podem ser
caracterizadas de acordo com o evento que motivou a obteno
da inIormao (ex.: o autor respondeu a uma pergunta do analista
ou o autor descreveu um dia atipico detrabalho).
A partir do entendimento de contexto necessario ter
mecanismos para representao, captura, armazenamento e
recuperao do contexto |16|. Normalmente a abordagem de
gesto de contexto esta associada a alguma aplicao ou a algum
Permission to make digital or hard copies oI all or part oI this work Ior
personal or classroom use is granted without Iee provided that copies are
not made or distributed Ior proIit or commercial advantage and that copies
bear this notice and the Iull citation onthe Iirst page. To copy otherwise, or
republish, to post on servers orto redistributetolists, requires prior speciIic
permission and/or a Iee.
JII Simposio Brasileiro ae Sistemas Colaborativos, Outubro 5-7, 2011,
Rio de Janeiro RJ, Brazil.
Copyright 2011 $10.00.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 141 -
sistema, que so chamados de context-aware systems ou
aplicaes sensiveis ao contexto. Aplicaes sensiveis ao
contexto so aquelas que so capazes de adaptar suas operaes
ao contexto corrente sem a necessidade da interveno explicita
do usuario |17|.
Tabela 1. Elementos de contexto ementrevistas de
levantamento
Elemento Descrio do elemento
DeIinio Descrio dotermo ou da atividade
Contra-
deIinio
Conceitos que podem ser conIundidos
com a deIinio do termo ou atividade e
devem expressar explicitamente que no
tm relao com otermo ou atividade
Exemplos Exemplos que ilustrem a deIinio do
termo ou da atividade
Autoria Autor da deIinio
Ocasio da
deIinio
Ocasio na qual a deIinio do termo ou
atividade Ioi conseguida
Desta Iorma, uma aplicao sensivel ao contexto para o
levantamento colaborativo de processos se Iaz necessaria.
Atravs de uma Ierramenta que incorpore a gesto de contexto,
evita-se o problema do analista se deparar com uma grande
quantidade deinIormaes sem saber qual delas relevante.
4. UMESTUDO EXPLORATRIO COM
USO DE APLICAO COLABORATIVA
O problema da Iragmentao das inIormaes no levantamento,
discutido na seo II, Ioi investigado atravs de um estudo
exploratorio realizado com quatro alunos de cursos de graduao
na universidade. Neste estudo os alunos representaram analistas
de processos e entrevistaram participantes de processos no
mbito acadmico.
Para Iazer este levantamento os alunos atuaram em pares. Cada
par de alunos entrevistou uma pessoa diIerente em locais
distintos Iazendo uso de um prototipo chamado Netsketcher |12|
em umtablet.
ConIorme descrito em |12|, a abordagem proposta prev que os
analistas devem construir rascunhos de diagramas durante o
levantamento do processo. Netsketcher basicamente um
diagramador colaborativo. Acredita-se que esse tipo de
Ierramenta permite um balanceamento entre a anotao textual e
a modelagem em si. O conjunto de Iuncionalidades da Ierramenta
muito menor do que o de uma aplicao de modelagem de
processos, da mesma Iorma que um tablet normalmente tem
menos recursos computacionais do que um notebook ou um
desktop. Entretanto, esta simplicidade permite que o analista seja
eIiciente no uso da aplicao durante as entrevistas.
Atravs da realizao de gestos com um dispositivo apontador
(styllus) a Ierramenta reconhece os elementos basicos dos
diagramas de processos, permitindo que o analista elabore o
rascunho do processo com praticidade durante a entrevista. Alm
do rascunho, o analistatambm pode Iazer anotaes a molivre.
Um exemplo de rascunho de processo Ieito pelo Netsketcher
pode ser visto na Figura 2. Na seo anterior Ioi apresentada uma
deIinio sobre o que se entende por contexto no levantamento
de processos de negocio. A aplicao proposta em |12| no trata
a gesto de contexto.
Terminadas as entrevistas, os alunos Ioram reunidos em uma sala
para que pudessem consolidar as inIormaes levantadas. De
acordo com o relato dos alunos, Ioi possivel concluir que os
entrevistados no compreendiam o processo como umtodo, o que
evidencia a questo dos multiplos pontos de vista que os
participantestm do processo.
Devido a isso, os alunos disseram ter obtido vises limitadas do
processo e que precisavam levantar mais inIormaes. Nenhum
dos alunos Iicou satisIeito com a qualidade das inIormaes
levantadas. Foi possivel identiIicar que dois analistas obtiveram
uma viso conIlitante sobre o processo. Apos o compartilhamento
de todas as inIormaes levantadas, Ioi possivel esclarecer as
duvidas dos alunos e chegar a um entendimento comum do
processo. Essas concluses reIoram a necessidade do uso de
uma abordagem colaborativa.
Segundo os proprios estudantes, a mobilidade proporcionada pela
Ierramenta Iacilitou olevantamento. Entretanto, segundo eles
Figura 2. Exemplo de esboo de umprocesso
o levantamentoteria sido mais eIiciente se eles pudessemtertido
acesso asinIormaesjalevantadas pelos outros analistas antes e
durante o levantamento. Outro ponto apontado por eles Ioi o de
que a consulta ao rascunho ja elaborado no seria suIiciente para
a compreenso do processo pela Ialta de inIormaes adicionais,
como o nome e o cargo do entrevistado. Alm disso, os alunos
relataram que precisariam se comunicar para tirar duvidas sobre
o rascunho gerado, sendoideal a comunicaoinstantnea.
Desta Iorma, entende-se que a aplicao |12| Iacilitaria o
levantamento, entretanto algumas questes ainda precisam ser
endereadas. A primeira delas ainexistncia deinIormaes de
contexto do levantamento. Quando um analista acessa os
rascunhos gerados por outro analista, ele basicamente tem acesso
a todas as inIormaes ja levantadas, conduzindo ao cenario ja
exibido na Figura 1. Essas inIormaes no necessariamente so
relevantes para o levantamento que esta sendo realizado naquele
momento. Alm disso, as inIormaes se resumem ao rascunho
do processo. No ha inIormaes contextuais como deIinies de
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 142 -
termos, contra-deIinies, autoria e exemplos. Se o analista
necessitar sanar duvidas sobre um termo ou uma atividade, ele
precisa recorrer ao analista que Iez o levantamento para obter
mais inIormaes. A outra questo se reIere a passividade,ja que
o eIetivo compartilhamento de inIormaes so acontece se um
analista adotar uma postura pro-ativa de consultar os dados
obtidos pelos demais.
Na nova abordagem proposta, entende-se que as inIormaes
levantadas devem estar associadas a um contexto, para que os
analistas tenham acesso apenas as inIormaes que Iorem
relevantes para olevantamento que esta sendo realizado. Assim o
analista tera uma compreenso mais soIisticada sobre os
rascunhosja gerados.
Desta Iorma, so propostas melhorias na aplicao proposta em
|12| de Iorma que a gesto de contexto possa ser incorporada.
Um dos requisitos da nova aplicao o registro deste contexto.
Desta Iorma, durante a elaborao do rascunho o analista poderia
selecionar determinada palavra ou conjunto de palavras e
associar a este termo todos os elementos de contexto descritos na
Tabela 1.
O registro do contexto associado ao rascunho conduzira ao
requisito recomendao. No momento em que o analista Iaz
anotaes, a Ierramenta analisa cada palavra registrada e procura
correspondentes nas inIormaes de contexto dos rascunhos
armazenados. Caso haja correspondncia, a Ierramenta apresenta
para o analista uma lista com links para que esses rascunhos
possam ser consultados. Alm disso, caso o autor do rascunho
esteja on-line, possivel que os analistas se comuniquem via
chat.
Independente da recomendao da aplicao, tambm possivel
que o analista Iaa a consulta dos rascunhos relacionados ao
contexto do levantamento. Atravs desta Iuncionalidade o
analista pode Iazer pesquisas nos rascunhos usando elementos de
contexto especiIicos e assim acessar inIormaes relevantes
antes, durante ou depois da entrevista. A Figura 3 ilustra o uso
do prototipo com as melhorias a seremincluidas.
5. CONCLUSO
Este artigo apresenta uma proposta de abordagem de
levantamento colaborativo de processos de negocio orientada a
contexto, que visa tratar o problema da Iragmentao das
inIormaes no levantamento de processos de negocio atravs de
entrevistas.
A principal contribuio deste trabalho a elaborao de uma
abordagem delevantamento colaborativo de processos de negocio
orientada a contexto. Esta abordagem auxilia o analista a realizar
o levantamento municiado com asinIormaes relevantes sobre o
levantamento que ja Ioram obtidas em outras sesses de
levantamento. O acesso a essas inIormaes permite que o
analista tenha uma compreenso mais ampla do processo que
esta sendo levantado, Iacilitando a identiIicao e a resoluo de
conIlitos de levantamento. O esclarecimento de duvidas e
obteno de consenso passa a acontecer no momento da
entrevista. Alm disso, o acesso as inIormaes relevantes no
levantamento tera impacto direto na completude e na
consistncia do modelo gerado.
Como trabalho Iuturo sera Ieita a especiIicao e a validao da
gesto de contexto e das Iuncionalidades da aplicao de suporte,
assim como sero realizados estudos de caso em cenario real de
uma organizao para demonstrar a validade da abordagem.
Figura 3. Abordagemdelevantamento colaborativo de
processo de negcio orientada a contexto
6. REFERNCIAS BIBLIOGRFICAS
|1| J.C. Gonalves, F.M. Santoro, F.A Baio,Business process
mining from group stories, Proc.13th International
ConIerence on Computer Supported Cooperative Work in
Design, 2009. p. 161-166.
|2| WMP Aalst, HT de Beer, BF van Dongen,Process mining
ana verification of properties. An approach basea on
temporal logic, Proc. International ConIerence on
Cooperative InIormation Systems. Springer: Berlin, 2005;
130140.
|3| F.M. Santoro, M.R.S. Borges, J.A. Pino, Tell us your
process. A group storytelling approach to cooperative
process moaeling, In Computer Supported Cooperative
Workin Design, p.29-34, 2008.
|4| AB Earls, SM Embury, Turner NH, A methoa for the
manual extraction of business logics from legacy source
coae, BT Technology Journal, 2002, 20(4):127145
|5| H. Huang, Business rule extraction from legacy coae,
Proc. 20th ConIerence on Computer SoItware and
Applications, IEEE Computer Society: Silver Spring MD,
1996, 162
|6| H.M. Sneed, K. Erdos, Extracting Business Rules from
Source Coae, Proc. 4th International Workshop on Program
Comprehension (WPC '96), 1996.
|7| H.M. Sneed, Extracting business logic from existing
COBOL programs as a basis for reaevelopment, proc.
Ninth International Workshop on Program Comprehension,
IEEE Computer Society: Silver Spring MD, 2001, 167
|8| U.S. Bititci, D. Muir, Business process aefinition. A
bottom-up approach, proc. International Journal oI
Operations and Production Management, vol. 17, 1997, pp.
365-374.
|9| N.a Damij, T.b Damij, J.c Grad, F.d Jelenc,A methoaology
for business process improvement ana IS aevelopment, In
InIormation and SoItware Technology, vol. 50, 2008, p.
1127-1141.
|10| Y.a Zou, J.b Guo, K.C.a Foo, M.c Hung, Recovering
business processes from business applications, In Journal
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 143 -
oI SoItware Maintenance and Evolution, Vol. 21, p. 315-
348, 2009.
|11| R. S. Aguilar-Savn, Business process moaelling. Review
ana framework, In International Journal oI Production
Economics, vol 90, p. 129-149.
|12| N. Baloian, J. Pino, F. Santoro; G. Zurita, R. M. Araujo, S.
W. M. Siqueira, D. M. Silva, A Collaborative Mobile
Approach for Business Process Elicitation, In:
International ConIerence on Computer Supported
Cooperative Workin Design, Lausanne, 2011.
|13| V. T. Nunes, F. M. Santoro, M. R. S. Borges.Um moaelo
para gesto ae conhecimento baseaao em contexto, In
Simposio Brasileiro de Sistemas Colaborativos, 2007.
|14| A. K. Dey, Unaerstanaing ana Using Context, In
Personal Ubiquitous Computing, vol. 5, 2001.
|15| F.M. Santoro, P. Brzillon, Developing sharea context
within group stories, In Lecture Notes in Computer
Science, Vol. 3706 LNCS, p. 232-247, 2005.
|16| V. Vieira, P. Tedesco, A. M. Salgado, Towaras an
Ontology for Context Representation in Groupware, In
Lecture Notes in Computer Science, 2005, Volume
3706/2005, 367-37.
|17| M. BaldauI, S. Dustdar, F. Rosenberg, A survey on
context-aware systems, In Int. J. Ad Hoc and Ubiquitous
Computing, Vol. 2, No. 4, pp.263277, 2007.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 144 -
MEK: Uma abordagem oportunstica para disseminao
colaborativa do conhecimento
Diego S. Souza
Programa de Ps-Graduao em
Informtica - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
diessouza@ufrj.br

Jonice Oliveira
DCC/ Programa de Ps-Graduao
em Informtica - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
jonice@dcc.ufrj.br


Guilherme Fogaa
Programa de Ps-Graduao em
Informtica - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
guilherme.fogaca@ufrj.br
Pedro C. Silveira
DCC - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
pedrosilveira@ufrj.br


Jano M. de Souza
COPPE-Programa de Eng. de
Sistemas e Computao - UFRJ
Universidade Federal do Rio de
Janeiro, Rio de Janeiro, Brasil
jano@cos.ufrj.br
ABSTRACT
ThispaperpresentsanapproachIordata disseminationin mobile
P2P network, in order to Ioster collaboration among users.
Objects are transmitted in a proactive manner with others via
short-range radio Irequency. The spread data is based on context
inIormation and user proIile Ieatures. A user, who has certain
inIormation interesting to someone else, can send it, helping to
increase knowledge oI the interested. The data can exchanged
short texts, videos, sounds, images, links and documents in their
diIIerentIormats.Thisapproach,calledMEK
1
,isbeingdeveloped
inpartnershipwithMicrosoItResearch.

RESUMO
Estetrabalhoapresentaumaabordagemdedisseminaodedados
emumaredep2pmovel,aIimdeestimularacolaboraoentreos
usuarios. Os objetos so transmitidos de uma maneira pro-ativa
com os demais via Ireqncia de radio de curto alcance. A
disseminao dos dados baseada em inIormaes de contexto e
caracteristicas do perIil do usuario. Um usuario que possui uma
determinada inIormao interessante para outra pessoa pode
envia-la, contribuindo para o aumento de conhecimentos do
interessado. Os dados trocados podem ser textos curtos, videos,
sons, imagens, links` e documentos em seus diIerentes Iormatos.
Esta abordagem, chamada MEK
1
, esta sendo desenvolvida em
parceriacomaMicrosoItResearch.

CategoriesandSubjectDescriptors
Implicit Subject Descriptors: J.3 -Cellular computing ; C.2.1-
Peer-to-peercomputing
GeneralTerms
Algorithms;HumanFactors
Keywords
CSCW,KnowledgeDissemination,P2P,CSCL.
1. INTRODUO
Desdeaantiguidadeohomemtemcomomeiodesobrevivnciaa
organizao em sociedade, para juntos desempenharem as mais
variadas tareIas. Porm como no passado havia apenas meios de
comunicao simples, a interao das pessoas se dava atravs da
presenaIisica,havendonecessidadedelocomoo.Comopassar
dotempoastareIasrealizadaspelosindividuosIoramsetornando
mais complexas, havendo assim uma grande interatividade das
pessoas de varias areas proIissionais e das mais diversas areas
geograIicas. IssocontribuiuparaoaperIeioamentodos meiosde
comunicao permitindo a realizao de tais tareIas e para o
'surgimento dos mtodos colaborativos.
Com o avano de tecnologias 'wireless, nossa Iorma de se
comunicarcomomundomudaacadadia.Osdispositivosmoveis
tais como celulares, note/netbooks`, e mais recentemente os
tablets`, permitem que estejamos conectados permanentemente
comaspessoas.EstanecessidadedeinteraocomaspessoasIaz
com que troquemos inIormao de maneira constante. Pessoas
conversam ao celular onde quer que estejam, Iotos de lugares
interessantessocompartilhadas,mensagensdetextosotrocadas
para continuar uma discusso. Contudo, uma vez que essas
interaes terminam, muita inIormao se perde por no ser
armazenada.
Esta atual revoluo nas tecnologias sem Iio nos traz novas
perspectivasdecomunicaoeinteraosocial.Podemossalientar
duas diIerentes caracteristicas de como as pessoas interagem, no
trabalho ou em seu tempo livre. Primeiramente, tempo e espao
nosomaisumproblema.Pessoaspodemtrabalharousedivertir
em qualquer lugar, em qualquer instante, necessitando apenas de
uma conexo a Internet para isso. A segunda diIerena que as
interaeshumanas estomaisIaceis(dese conseguir)doqueno
passado, embora possam ser muito mais curtas. Voc pode
procurar, encontrar e interagir com algum para lhe ajudar a
resolverumproblema especiIico,ouapenasparajogar,masestas
interaessoIracasepodemserperdidasaoIinaldatareIa,jogo
ou conexo da Internet. Ou seja, o mais importante o que Ioi
aprendido,coletadoouusuIruidopelainterao,doqueosagentes
dacomunicaoemsi.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 145 -
Estes pontos so relacionados a uma nova Iase de vida, chamada
cybercultura`|7|. Cybercultura` comea a envolver pessoas e
objetos em um imenso ambiente conectado: no mais pontos de
acessos, mas lugares`. Com o desenvolvimento da computao
movel,estetipodeculturaeseusespaosnospermitiramaentrar
em uma era caracterizadapelocoletivo e distribuido`, sendoque
o coletivo a agregao parcial e temporal de muitos itens. Este
cenario altamente conectado esta mudando a maneira como as
pessoas interagem com os espaos e o mundo toma novas
dimenses|8|.
Seguindo as observaes acima, surge o conceito do MEK
1
. As
pessoassoconsideradas comopotenciaiscentrosde inIormao,
pelos quais quaisquer recursos de inIormao podem ser
disseminados, para quem o considere importante, de maneira
colaborativa e oportunistica. Nesta abordagem, a troca de
conhecimentos
3
no se limita a um grupo de pessoas, onde a
inIormao estaria 'restrita, mas expande as possibilidades de
troca e compartilhamentoatodosaoseuredor. Adisseminao
realizada de maneira oportunistica, de maneira que seja
selecionado e propagado apenas o que possa ser util ou de
interessedoIuturoreceptor.
Segundo Zhang (2006), o modelo de colaborao oportunistica
nosguiaa umnivelde colaborao maisresponsavel, pervasiva,
Ilexiveledistribuida,possuindomaioresvantagensparaadiIuso
dainIormaoeconhecimento.
Sera apresentado, a seguir, de Iorma mais detalhada, o aplicativo
desenvolvido, alm das instncias de seu Iuncionamento, o
IormatodesuaarquiteturaeasIuncionalidadesjaimplementadas.
Dessa Iorma teremos uma viso geral sobre a aplicabilidade do
MEK
1
esuaspossiveisutilizaesemambientesreais.
2. OB1ETIVODOTRABALHO
Uma rede p2p
2
movel Iormada por um conjunto de objetos em
movimento que se comunicam atravs de tecnologias sem Iio de
curto alcance. Neste tipo de rede, os objetos recebem dados de
seus vizinhos ou de objetos remotos que utilizam elementos
intermediarios para auxiliar na comunicao. Como descrito
acimaedetalhadonaproximaseo,oprincipalobjetivodoMEK
capturar etransmitir dadosdo interessedo usuario,levando em
considerao o local, o perIil do usuario (principalmente seus
interesses), os conhecimentos
3
que possui os vizinhos existentes
naquela localidade e naquele instante de tempo, o perIil destes
vizinhos, os conhecimentos que os vizinhos possuem, os
assuntos/temas do conhecimento (do usuario e de seus vizinhos).
A partir de tais inIormaes que a disseminao de
conhecimentos para possiveis interessados Ieita. Essa
transmissoseletivapodeserutilemalgunscenarios,como:
x IdentiIicao de demandas e oIertas Por exemplo,
lojas podem colocar suas promoes e os interessados
podem receber tal inIormao ao passar proximo da
lojaouproximo deoutrapessoaquejarecebeuaquela
inIormao.Pessoasinteressadasemconheceracidade
podem receber inIormaes sobre o local que esta
visitandoaopassarporoutrostranseuntesouturistas.
x Emergncias ou desastres Para a localizao de

1
MEK Este o acrnimo do nome desta abordagem, que se
chama 'Mobile Exchange oI Knowledge.
2
P2Ppeer-to-peer` ou ponto-a-ponto.
3
Nesta abordagem, todos os recursos trocados dados em seus
diIerentesIormatosso chamados de conhecimento`
vitimas ou para a identiIicao de especialistas, que
estejamnasproximidades,equepossamauxiliar.
x Troca de opinies entre usuarios - Por exemplo,
pessoas que Ireqentam determinados lugares podem
expressarsuasopinies(dizersegostou,doquegostou
ou se no gostou) e essa inIormao podera ser
compartilhada entre outros individuos que estiverem
nessemesmolugar

Existem outros cenarios colaborativos para a utilizao de uma


redep2pmovel.OMEKseraaplicadono cenario de healthcare`
para tratamento intensivo e de longa durao (como o cncer).
Este um projeto realizado atravs de uma parceria com a
MicrosoIt Research, INCA, Universidade do Chile e CICESE. A
idia que, atravs do uso dos celulares e de uma maneira
proativa, os atores do cenario de healthcare` possam colaborar,
trocando conhecimentos sobre a doena, inIormaes gerais,
noticiaseelementosdeentretenimentoquesejamdeinteresseem
comum,comomostradonaFigura1.
Comousuarios,vislumbramos:
x Hospitalizados Aqueles que esto em tratamento,
muitas vezes imobilizados em leitos ou participando de
tratamento em unidades intensivas. Durante o
tratamento existe a ida constante as unidades, espera e
tratamentosprolongados.Elespodemserdivididosem:
o Adultos como qualquer usuario, o unico
requisitoquesaibamler e escrever,alm de
possuiremumaparelhocomBluetooth.
o Crianas Apesar do MEK trabalhar com
qualquer tipo de midia, como som, video e
Iigura, necessario que a criana ja seja
alIabetizada para que possa categorizar os
conhecimentos. Por trocar qualquer elemento
de inIormao, as crianas podem trocar
conteudo de entretenimento e, desta maneira,
tornar o tratamento menos doloroso`.
o Idosos A Iacil interIace` do MEK permite
que idosos, desde que saibam ler e no
tenham problemas de viso, consigam operar
oambiente.
x PessoasEnvolvidas
o Mdicos, EnIermeiros e ProIissionais de
Saude tais usuarios podem esclarecer
duvidassobreadoena.Suasopiniessobrea
doena possuem maior conIiabilidade do que
adosdemais.
o Recuperados, mas em monitoramento
pessoas que ja passaram pela doena podem
incentivar, esclarecer e apoiar os que esto
passandopelotratamento.
o Amigos e Parentes podem tanto possuir
duvidasquantoexperinciasaseremtrocadas.

Para a realizao das trocas de conhecimento


3
de maneira
oportunistica, utilizamos o cruzamento de inIormaes
contextualizadas sobre o perIil do usuario e dos conhecimentos
cadastrados de demais usuarios ao redor. Tais inIormaes
contextuaisso:
x Localidade Raio de alcance ou proximidade. Local
ondeocorreuacolaborao.
x Tempo Instante da colaborao ou idade` do
conhecimento
x Areas de interesse do usuario e Areas/assuntos do
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 146 -
conhecimento
x Tipoougrupoqueousuariopertence

Figura1-CenriodeUtilizaodoMEK

Neste cenario, a idia que as pessoas de cada grupo possam


trocar duvidas, inIormaes sobre a doena ou qualquer tipo de
inIormao entre as demais pessoas que participam do seu grupo
ou entrepessoasdeoutrosgrupos,Iormando uma granderedede
conhecimento. A descrio detalhada desta abordagem encontra-
senaproximaseo(3).
3. MEK
1
DESCRIODA
ARQUITETURA
A plataIorma escolhida para desenvolver o MEK Ioi o JME|2|,
devido sua grande portabilidade e por estar presente na maioria
dosdispositivosmoveis.ApesardeoIocoatualserautilizaode
celulares, ja que este o dispositivo movel mais utilizado
atualmente,oaplicativoIoiprojetadoparasersuportadoportodos
os dispositivos que utilizem JME. A seguir sera explicado o
IuncionamentodoMEK.
O MEK possui quatro modulos principais, como mostrado na
Figura2:
x Viso - Modulo responsavel pela interIace, insero e
visualizaodosdados.
x Controlador Geral - Modulo responsavel por todas as
operaeslogicasecomandosdadospelousuario.
x Controlador de Requisies - Modulo responsavel
pelospedidosenviadosporoutrossistemasMEK.
x Centro de Conhecimento - Modulo responsavel pelo
armazenamento de todos os conhecimentos e as
associaes destes conhecimentos as suas respectiva
categorias.

4. FUNCIONALIDADES
As Iuncionalidades podem ser acionadas pelo usuario a partir da
tela inicial (Figura 3) ou por rotinas internas. As principais
Iuncionalidadessodescritasaseguir.

4.1 CriaodoPerfil
Apos o aplicativo ser instalado no dispositivo, o usuario devera
cadastrarumperIil.EsteperIil iraconteralgunsdadosdousuario
como nome, ocupao e ainda as areas de seu interesse, como
mostrado na Figura 4 e na Figura 5. Os interesses so
representados por conceitos em uma taxonomia. Uma area de
interesse podera abranger diversas subareas. Exemplo: ao utilizar
a taxonomia de areas de conhecimento do CNPq|4|, se o usuario
escolher a opo Cincias da Matematica e da Natureza como
uma area de seu interesse, ele podera receber conhecimentos
classiIicados nesta area especiIica ou de qualquer subarea, como
Matematica,GeograIiaeOceanograIia.

Conhecimento sobrea doena


Informao sobre interesses em comum,
Notcias, Entretenimento
Crianas Hospitalizadas
MEK
Idosos Hospitalizados
MEK
Adultos Hospitalizados
MEK
Pessoas Envolvidas
Figura2.ArquiteturadoMEK.
Figura3.TelaInicial.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 147 -

4.2 CadastramentodeConhecimentos
Aetapaseguinteocadastramentodeconhecimentos(Figura 6e
Figura 7), ou seja, dados que o usuario detm e considera
relevante para distribuir a outros usuarios. O conhecimento
qualquer recurso que possa ser disseminado, podendo ser um
documento (texto ou em qualquer Iormato), imagem, video, som
oulink.OsassuntosquedescrevemoconhecimentosodeIinidos
pela taxonomia de interesses. Desta maneira, o usuario devera
classiIicar cada documento utilizando uma ou mais areas de
interesse.
4.3 ConexoeTransmisso
Enquantoativa,aaplicaoprocurarapor outros dispositivosque
possuam outras instncias ativas do MEK. Essa procura
realizada mediante a tecnologia do Bluetooth, por sua utilizao
ser mais comum nos aparelhos celulares. Como no ha um
servidor central,armazenando diversosconhecimentos, atrocade
inIormaes realizada mediante uma rede peer-to-peer. Deste
modo, cada dispositivo podera ter Iunes de servidor
(Iornecendo conhecimentos, se este existir) e de cliente
(adquirindo conhecimento). A troca das inIormaes entre os
celularestambmrealizadautilizandooBluetooth,comomostra
aFigura8.

Como cliente, o MEK procura outros dispositivos executando o


aplicativo. Caso encontre, conecta-se e encaminha o conjunto de
interesses do usuario. O servidor veriIica se possui
conhecimentos que sejam classiIicados nas mesmas areas de
interesse do clienteouareasdo mesmogrupo(ouseja, subareas).
Caso haja, o servidor sinaliza o que possui e o MEK cliente ira
solicitar o Iornecimento deste conhecimento para o MEK
Figura4.Cadastrodeperfil.
Figura5.Perfilcadastrado.
Figura6.Cadastrodeconhecimento.
Figura7.Conhecimentocadastrado.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 148 -
servidor, como ilustrado na Figura 9. Existe uma veriIicao por
parte do cliente para no pedir conhecimentos que ja possui. Por
sua vez, o conhecimento adquirido pelo cliente agora Iica
disponivelparatroca.
Outro Iator que contribui para que essa troca de conhecimento
ocorra a utilizao do padro XML (eXtensible Markup
Language)|3|. O MEK Iaz uso do XML para troca de perIis e
troca de conhecimentos. Exemplo: para a troca de arquivos, o
MEK envia um arquivo XML com os detalhes do arquivo e ao
receber uma conIirmao XML, o arquivo enviado pela
conexo.

4.4 Ediodeconhecimento
Os conhecimentos podem ser inseridos, alterados e removidos. E
importante ressaltar que o conhecimento removido de toda a
base de dados do MEK, dessa Iorma o conhecimento no sera
mais compartilhado com outros usuarios. Esta Iuncionalidade
pode ser util para conhecimentos que tenham prazos de validade,
como inIormaes de Iestas, ou conhecimentos que o usuario
julgueerrado.
4.5 Busca
O usuario pode buscar pelos conhecimentos arquivados em seu
dispositivo. A busca Ieita por palavras-chave que coincidem
comotitulooutextodescritivodeumconhecimento(Figura10e
Figura11).

Figura8.Comoocorreaconexo.
Figura9.TransmissodeConhecimento.
Figura10.Teladebusca.
Figura11.ResultadodaBusca.
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 149 -

5. EXEMPLODEUTILIZAO
Como demonstrado no video enviado em anexo e tambm
disponibilizado em
http://www.cos.uIrj.br/~jonice/sbsc2011/MEK.html (observao:
clique em CC para aparecer a legenda no video), ao iniciar o
MEK pela primeira vez, sera necessario a criao de um perIil.
Este perIil ira conter dados do usuario e suas areas de interesse,
que sero utilizadas para a troca de conhecimentos. Logo apos a
criaodoperIil,deveraserescolhidoumdiretorioqueiraconter
osarquivosutilizadospeloMEK.
Depois de concluida esta etapa, o usuario podera cadastrar
conhecimentos que ele possui. Para isso ele devera escolher a
opo Cadastro Know na tela inicial do MEK. Nesta etapa
deveroser inseridosalgunsdadosbasicosdoconhecimento e,se
necessario,umarquivocorrespondente.
A partir deste ponto o MEK esta pronto para ser um receptor de
conhecimento e um possivel emissor. A aplicao procurara de
Iorma pro-ativa por outros aparelhos que possuam o MEK, caso
seja encontrado, uma busca nos conhecimentos deste outro
aparelho sera realizada procurando por interesses relevantes ao
usuario.
Casosejaencontradoalgumconhecimentointeressanteaousuario
ira ocorrer a transIerncia do conhecimento, colaborando para o
aumento de inIormaes por parte do usuario. O conhecimento
transIeridoIicara contido nabasede dadosdaaplicao epodera
servisualizado.
6. AVALIAO
No processo de avaliao Ioram usados 3 celulares da marca
Nokia|1|dosmodelos:2celularesC6-00,1celularC3-00.Alm
dos celulares, Ioram utilizados 4 computadores (Intel Core 2
Duo E-8400, 4GB DDR2, 32 bit). Vale ressaltar que todos os
modelos dos aparelhos permitiam executar aplicao da
plataIormaJAVA.
Nossas avaliaes tiveram como objetivo examinar: i)InterIace e
Navegaoeii)ConIiabilidadenatransmisso.
Para a avaliao de interIace e navegao, Ioi pedido que uma
pequena amostra - composta por 4 pessoas - realizasse todas as
Iuncionalidades (descritas na seo 4). Para esta avaliao Ioram
utilizados os 4 computadores (Intel Core 2 Duo E-8400, 4GB
DDR2, 32 bit). Apos a utilizao do ambiente, os membros da
amostra eram questionados sobre a interIace e mecanismos de
navegao. Durante esta Iase, Ioram coletadas novas idias e
sugestes de Iuncionalidades. Todos os integrantes da amostra se
mostraram satisIeitos (75) ou muitos satisIeitos (25). A
amostra era composta por (2) alunos de mestrado, um de
graduao e um doutor em computao. Todos os alunos (3) ja
cursaramdisciplinasdeIHCeCSCW.Odoutoremquestoum
especialistadaareadeCSCW.
A avaliao da conIiabilidade na transmisso Ioi dividida em 3
etapas,ondeIoipossivelveriIicar:
1. A troca entre dois celulares do mesmo modelo. Um
aparelhocontendoconhecimentoseooutrosem.
2. A troca entre dois celulares de modelo diIerentes. Um
aparelhocontendoconhecimentoseooutrosem.
3. Atroca entretrscelulares. Apenasum deles contendo
conhecimento.
Para medirmos a conIiabilidade na transmisso, utilizaremos
comomtricas:
x Arquivos relevantes (AR) Arquivos que devem ser
transmitidosaousuario,isto,arquivosqueousuario
nopossui-relacionadosaosseusinteresses.
x Quantidade de arquivos a serem transmitidos (QtAR)
Quantidadedearquivosrelevantes.
x Quantidadedearquivosrealmentetransmitidos(QtRT)
Quantidade de arquivos que 'chegaram ao seu destino
comsucesso.
x Tempo de Latncia (TL) Tempo de navegao e
operao do usuario adicionado ao tempo de
transmissodoarquivo.
x Mdia do Tempo de Latncia (MTL) TL/Numero de
pares de celulares (lembrando que necessario um par
paraocorreratrocaentreconhecimentos).
x Quantidadedeconexes(QtCx).
Com tais mtricas, desejava-se calcular a preciso, erro mdio e
desviopadro,almdotempomdiodetransmisso.
AtaxonomiautilizadaIoiadoCNPq|4|.
AconIiguraodecadacelularIoi:
x Dois celulares (um C6 e um C3) tinham interesse em
Cincia da Computao, e o outro C6 em Cincias
Exatas e da Terra (superarea de Cincia da
Computao).
x Um celular C3 continha como interesses cadastrados
todasasareasdeCinciadaComputao.
OstitulosdosconhecimentoscadastradosIoram:
x RecuperaodeInIormao.
x AlgoritmosGenticos
x ProgramaoAvanada
NoprimeirotesteIoiutilizadoosdoismodelosC6-00:Umdeles
(A) possuindo 3 conhecimentos e o outro (B) sem nenhum
conhecimento.
Os conhecimentos instalados no celular (A) possuiam um anexo
que era uma Ioto no Iormato jpg. Foram realizadas 2 conexes
sendo elas: Uma conexo que Ioi iniciada pelo celular (A)
tentando se conectar no celular (B). Como no Ioi encontrado
nenhumconhecimentonoIoirealizadanenhumatransIerncia.A
segundaconexorealizadainicioudocelular(B)pedindoconexo
ao celular (A). A partir do momento de conexo passaram
aproximadamente 50 segundos (TL) at que todos os
conhecimentosdoservidorIossemtransIeridosparaocliente.
Um segundo teste Ioi realizado entre um aparelho do modelo
Nokia C3-00 e Nokia C6-00. Estes dois aparelhos Ioram
submetidos as mesmas condies do primeiro teste. Trs
conhecimentos Ioram inseridos em um celular para que Iossem
transIeridos para o outro. Assim como o primeiro teste Ioram
abertas2conexes.Foramdecorridosaproximadamente1minuto
(TL) at que todos os conhecimentos Iossem passados para o
segundocelular.
Um terceiro teste Ioi realizado utilizando 3 celulares, dois deles
do modelo C6-00 e o outro era o modelo C3-00. Apenas o
aparelho de modelo Nokia C3-00 possuia os conhecimentos que
interessavam aos outros aparelhos. Foram decorridos
aproximadamente2 minutose15segundos (TL)atquetodosos
celularespossuissem os mesmosconhecimentos.Foramabertas6
conexespararealizartodooprocesso.
Durante os testes obtivemos 100 de transIerncia dos
conhecimentos (QtRT/QtAR), porm Ioram abertas mais
conexes(QtCx)queonecessarioparaexecutaratransIernciano
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 150 -
cenarioideal.AMTLIoiproximaentreoscasos:50s(IaseI),60s
(Iase II) e 45s (Iase III). Como tivemos 100 de transmisso,
nestaavaliaonoconseguimoscalcularapreciso,erromdioe
desviopadro.
7. TRABALHOSFUTUROS
Como trabalhos Iuturos almejamos intensiIicar as avaliaes.
Inicialmente realizando testes de stress`, com transmisses de
maiornumero dearquivosentre celulares,bemcomoarquivosde
tamanhosdiIerenciados.Posteriormente,oMEKseraavaliadono
cenario real (descrito na seo 2). Uma outra avaliao sera
levando em considerao a mobilidade, ou seja, como sera a
transmissoquandoosaparelhosestoemmovimento.
Visando aumentar a colaborao entre os usuarios da aplicao e
permitir que outros meios de comunicao sejam compartilhados
entre as pessoas, visamos o desenvolvimento de um chat. Este
mecanismo ira realizar uma pesquisa nos dispositivos proximos
que contenha o MEK disponibilizando uma area para que os
usuarios interajam entresisobaIorma detrocade mensagensde
texto via Bluetooth. Com eIeito de preservar a privacidade de
algumas pessoas, iremos permitir que o usuario escolha uma
opodedisponivelounoparaserencontradoparaochat.
Uma segunda melhoria que visa aumentar a ergonomia entre o
usuario e a aplicao sera a de tornar o aplicativo conIiavel
atravs do uso de um certiIicado. Isso permitira que durante o
processodeinstalaodaaplicaoousuariopossapermitirquea
aplicaoexecuteacessosaosarquivosepastasdodispositivo.
Uma terceira melhoria a implementao de uma aplicao
desktop para dar maior mobilidade ao usuario. Com uma
aplicao desktop o usuario podera organizar e gerenciar os seus
conhecimentos a partir de seu computador pessoal e depois
transIeri-los para o seu dispositivo movel. Como mtodo de
transmisso, para seguir o padro da aplicao, sera usado o
Bluetooth.
Outra melhoria, visando aumentar o alcance da conectividade
entre os dispositivos, a realizao de um estudo para buscar
melhorias na tecnologia utilizada ou novas tecnologias que
permitemrealizartalaumento.
Pontos Iuturos a serem tratados so a conIibialidade da Ionte e
mecanismosdedenuncia.
8. CONCLUSO
Neste trabalho apresentamos o MEK, uma proposta de
disseminao oportunistica de dados. O usuario, durante o seu
percurso, pode capturar dados que possivelmente so do seu
interesse,bemcomotransmiti-losutilizandoumdispositivomovel
(por exemplo, celular). Para isto, o MEK utiliza inIormaes de
contexto.
AtravsdestetrabalhopodemosconcluirqueoMEKsetornauma
boa Ierramenta no ambiente de disseminao pro-ativa do
conhecimento. Esta abordagem esta em evoluo. Podemos
mencionar como trabalhos Iuturos o desenvolvimento de novas
Iuncionalidades e avaliao em um cenario real. O cenario
escolhido o healthcare`. Pacientes alm de seus Iamiliares e
amigos que lidam com uma doena grave que envolve
tratamentos longos (por exemplo cncer, Alzheimer ou autismo),
Ireqentemente se deparam com Ialta ou insuIicincia de
inIormao especializada para responder suas duvidas. O MEK
seraanalisadosobestascircunstncias.
9. AGRADECIMENTOS
A MicrosoIt pelo Iinanciamento ao projeto 'Temporal Social
Networks and Knowledge Dissemination Ior Healthcares
(LACCIR, R1210LAC002), a FAPERJ pelo projeto "SOMA:
Analise de Redes Sociais Complexas" (E-26/110.460/2010), ao
CNPqeCAPESporbolsasdeestudos.
10. REFERENCIAS
|1| Nokia, 'Nokia, http://www.nokia.com/, Junho 2011
|2| Sun, 'The Java ME PlatIorm - the Most Ubiquitous
Application PlatIorm Ior Mobile Devices,
http://java.sun.com/javame/,Junho2011
|3| W3C, 'XML, http://www.w3.org/XML/,Junho2011
|4| Tabelas de Areas de Conhecimento -
http://www.capes.gov.br/avaliacao/tabela-de-areas-de-
conhecimento,Junho2011
|5| GroupWareSome Issuesand experience. C.A.Ellis,S.J.
GibbsandG.L.Rein.
|6| 'Collective Knowledge Recall: BeneIits and Drawbacks -
Carminatti,N.,Borges,M.R.S.,Gomes,J.O.:
|7| L. Pierre, Cyberculture - University oI Minnesota Press,
October2001.
|8| S.Levy,MakingtheultimateMap,inNewsweek,pp.56-58,
June,2004.
|9| Zhang,J.,Scardamalia,M.,Reeve,R.,&Messina,R.(2006).
Collective cognitive responsibility in knowledge building
communities. American Educational Research Association
AnnualMeeting,2006,SanFrancisco,CA.
|10| JialuFan,YuanDu,WeiGao,JimingChen,YouxianSun-
Geography-AwareActiveDataDisseminationinMobile
SocialNetworks
http://www.cse.psu.edu/~wxg139/publications/mass10.pdI
|11| JonathanKnudsen-'What's New in the J2ME Wireless
Toolkit 2.0, Janeiro 2003 -
http://www.oracle.com/technetwork/systems/wtk20-
156271.html
|12| MoushumiSharmin,ShameemAhmedandSheikhI.
Ahamed-'MARKS (Middleware Adaptability Ior Resource
Discovery,KnowledgeUsabilityandSelI-healing)Ior
MobileDevices oI Pervasive Computing Environments
|13| GouthamKarumanchi,SrinivasanMuralidharan,Ravi
Prakash-'InIormation Dissemination in Partitionable Mobile
Ad Hoc Networks
|14| S.KrishnaMohanRao,DrA.VenugopalReddy-'Data
DisseminationinMobileComputing Environment
|15| Thomas Schwotzer, Kurt Geihs - 'Shark a System Ior
Management, Synchronization and Exchange oI Knowledge
in Mobile User Groups, 2002.

VIII Simpsio Brasileiro de Sistemas Colaborativos


- 151 -
Co-designing Collaborative Museums using Ethnography
and Co-creation Workshops
Heloisa Moura
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de So Vicente, 225,
Gvea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
moura@id.iit.edu

Wallace Ugulino
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de So Vicente, 225,
Gvea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
wugulino@inf.puc-rio.br
Dbora Cardador
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de So Vicente, 225,
Gvea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
dcosta@inf.puc-rio.br

Marcos Barbato
Be! Interactive
Av Ataulfo de Paiva, n 341, room 407
Leblon, Rio de Janeiro, RJ, Brazil
+55 21 2529-2101
barbato@be-interactive.com.br
Katia Vega
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de So Vicente, 225,
Gvea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
kvega@inf.puc-rio.br

Hugo Fuks
Pontifical Catholic University
of Rio de Janeiro (PUC-Rio)
Informatics Department
Av Marques de So Vicente, 225,
Gvea, Rio de Janeiro RJ, Brazil
+55 21 3527 1500 ext 4553
hugo@inf.puc-rio.br

ABSTRACT
The paper presents a human centered approach to co-design of
groupware and socialware for collaborative museums, using
ethnography, co-creation workshops and Blank Model
Prototyping. It discusses the concepts and processes of human
centered design, participatory design, ethnography, concept
generation and iterative prototyping - pointing their value to the
support of group systems design, in comparison to other
approaches. It also gives an overview of the state of the art of
museums around the world. Next, it describes a case study
conducted in a Brazilian Planetarium and Science Museum,
highlighting details of the context, process and results. The intent
was to implement a system for collaborative museums that
supports an integrated user experience before, during and after the
visit through groupware, socialware and cross reality
technologies for continuous engagement, co-construction of
knowledge, intergenerational interaction, multimodality, sharing
of ideas, and emergence of mentorship networks.
Categories and Subject Descriptors
J.5 [Computer Applications]: Architecture
General Terms
Documentation, Design, Experimentation, Human Factors
Keywords
Ethnography, co-creation, blank model prototyping
1. INTRODUCTION
A few centuries after the emergence of the first modern
museums, they are still considered essential to the public sphere.
Museums, by definition, are institutions dedicated to the
acquisition, preservation, study and interpretation of the tangible
and intangible inheritance of humanity and its environment,
focused on the dissemination of information, exhibition,
entertainment, and, more recently, informal education. In the past,
museums used to display cold and static collections inside glass
boxes, representing different historical moments.
Today, in contrast, the public has a growing thirst for
immersive experiences, drama, adventure, fun and engagement.
And in response, current museums need to be transformed into
something capable of capturing attention and imagination, and
stimulating collaboration amongst visitors inside and outside their
spaces. In this context, groupware, or group support systems, and
socialware, or systems that support social interaction, together
with cross reality tools and technologies, amongst others, can play
a growing role in transforming the static, dont touch the exhibit
museums into lively and sensorial collaborative spaces.
Designing truly engaging museum exhibits those that are
culturally relevant and where visitors get a real feeling of
immersion and excitement, and even interact socially with
strangers however, is a challenge. Human-centered design offers
a path towards this goal, starting with the contextual
understanding of the people that actually visit, work and interact
with the particular museum at hand. Through a process of co-
creation, it moves from ethnographic research to design criteria,
and to relevant concepts that can respond to the identified
problems and opportunities. Next, it prototypes these ideas
iteratively, while interacting with the very people that will use the
solutions, in order to continuously learn from them throughout the
development phase. As a consequence, meaningful solutions can
emerge.
This paper starts with the discussion of the concepts and processes
of human centered and participatory design, and explores some of
the methods that can support co-creation of cross reality
groupware and socialware, pointing their value, strengths and
limitations. Next, it examines the state of the art of museums that
are focused on collaboration. Finally, to bring the discussion into
context, it presents the case study of a Brazilian Planetarium and
Science Museum, exemplifying the use of selected methods to co-
create ideas that can transform the current space, exhibits,
VIII Simpsio Brasileiro de Sistemas Colaborativos
- 152 -
artifacts, interfaces and services into something collaborative,
exciting and stimulating, and integrate the user experience before,
during and after the visit. Such as described in the words of a ten
years old boy who joined one of the workshops, I want to come
here [at the Planetarium] and feel that I am the astronaut,
travelling through space, exploring the planets, stars and black
holes.
2. HUMAN CENTERED AND
PARTICIPATORY DESIGN
METHODOLOGIES AND METHODS
Design methodologies refer to systems of methods, tools,
principles and processes of the design discipline, as well as their
application. Dorst [1] proposes that design methodology includes
the development of formal models of design activities, from
which methods, techniques and computer tools can be derived
(p.8), and described in theoretical, empirical and practical terms.
The human-centered design methodology, or HCD, places
human needs, skills, creativity and potentialities at the center of
the activities of technological systems [2, 3]. According to Gasson
[4], such tradition arose as a reaction to the perceptions of
traditional approaches towards technology design which see
people simply as users of technology, focusing only on the
specific interaction, rather than questioning what, how, when,
where and why technology may be of service in supporting human
activities. And which, by focusing only on use and usability of
technology, excludes both the context of use and the richness of
human beings and their lives. As Bjorn-Andersen [5] affirms,
human beings are much more than eye and finger movements
(p. 387).
The user-centered design term, or UCD, in contrast, as
defined by the software development and design communities,
refers to an approach whose principles include early and
continuous focus on users throughout an iterative design process
[6]. John Karat [7] suggests that it is a process that sets users or
user information as a generative source of design ideas or as the
criteria by which a design is evaluated. And according to
Vredenburg et al. [8] user-centered design can be described as an
overall development process where users are taken into account,
including their active involvement for a clear understanding of
task requirements, which combines a multidisciplinary approach,
and iterative design and evaluation.
Melican [9] affirms that although the term user centered is
widely used, it is far from an ideal descriptor. And Bruce
Hanington [10] highlights the importance of using the term
human, instead of user, since it better ties design to human
needs and concerns. Another criticism to UCD is that it fails to
promote human interests because of a goal-directed focus on the
closure of predetermined technical problems [4, 11]. Bdker and
Nielsen [12] agree that relational aspects in UCD are largely
overlooked in the literature, and use this criticism to facilitate a
discussion on how discourse, activities and materials can give
shape to user involvement in design activities. The referred
authors, at Vision Lab, continuously draw experiments for
devising innovations and creative solutions with users, using the
workshop format. And by doing that, they combine user-centered
design with the participatory approach.
The Participatory Design research methodology, also known
as PD, corresponds to a set of theories, practices, and studies
related to end users as full participants in activities, leading to
software and hardware computer products and computer-based
activities [13, 14]. The field is wide and diverse, drawing
knowledge from numerous traditions, without leading to a single
theory or paradigm of study or approach to practice [15].
According to Nardi and Engestrom [16], PD is a way to
understand knowledge by doing; focused on the tacit and often
invisible ways that people perform everyday activities and how
these activities might be shaped productively. Crabtree [17]
highlights that in treating users as the experts within their own
context of activity, PD is characteristically concerned with
creating situations and environments in which users and designers
can formulate appropriate designs together. However, missing in
this approach is an in-depth analysis of current work practices a
problem that has led to the adoption of the ethnographic method
and its techniques.
Regarding the processes, methods and techniques used by
each of these different design approaches [18], there is no
agreement on how to conduct studies for gaining understanding of
human activities and needs, or on how to analyze and synthesize
data for guiding the creative process of design, or how to generate
human-centered solutions based on such research material.
Ethnography, for instance, is becoming an increasingly
widespread tool for conducting user research from the point of
view of either HCD, UCD or PD traditions. Originally developed
in the field of Anthropology, it can be seen as a set of methods for
data collection focused on understanding human beings in their
natural settings or in the context of everyday activities [19, 20].
Melican [9], however, highlights that ethnographic methods
may also be of limited value in confronting the transformational
implications of introducing new technologies due to their
concern with the analysis and description of the current situation
and practice and in supporting the process of envisioning
entirely new systems.
Suchman [21], nevertheless, points out that imagining future
solutions requires that current solutions can be articulated. On that
regard, Zeisel [22] proposes a way to resolve this seeming
paradox by locating and studying those settings, users and
problems that are representative of future ones, and generalizing
from them to the probable contexts and users. As Dourish [23]
notes on the value of ethnography: it provides reflection on,
insight into, and a broad understanding of the organization of
social settings, bringing analytic and inspirational aspects to the
design process.
For the purposes of the present research, a human-centered
approach to design is taken, understood as a process of design
informed by human needs and business objectives, using
participatory design methods: to draw the continuous involvement
of relevant participants from research to development and
implementation; and to co-create solutions that are human-driven
and contextually meaningful, and that, at the same time, can add
value to real people and be sustainable socially, economically,
environmentally and institutionally [24].

VIII Simpsio Brasileiro de Sistemas Colaborativos
- 153 -
3. COLLABORATIVE MUSEUMS AND
TECHNOLOGIES
Museums, as educational and recreational organizations,
have adopted a visitor centered approach, no longer focusing on
collections and information, but on enhancing peoples museum
experience and understanding of exhibitions. Supported by
increasingly sophisticated technologies, they offer visitors a range
of experiences, including: visual and sensory interactions,
learning, recreation, sociability, celebratory and enchanting
encounters, or a distinctive combination of exposures [25].
It is noticeable, on the one hand, that substantial effort has
been applied to designing and developing new museum exhibits
and systems in order to facilitate engagement and collaboration,
and to enhance learning opportunities of groups of visitors, since
they normally attend in social clusters such as family, friend, or
school tour groups [26]. On the other hand, research on the
dynamics of collaboration [27, 28] and on technologies that
support groups and social interaction have helped to lighten this
challenge.
On regards to collaborative museum experiences, they enable
visitors to feel like a curious group of explorers, who, by
interacting socially and collaborating with others, discovers
wonders through the exhibits. That has been the case with several
science museums, where interacting with other visitors is often
included.
Dirk vom Lehn, Christian Heath and Jon Hindmarsh [29]
highlight what they consider to be the three most relevant issues
that should be acknowledged throughout the design process when
developing collaborative museums exhibits: 1) social interaction
is fundamental to visitors experience of exhibits and exhibitions;
2) visitors need opportunities for sustained interaction both in
direct relation to exhibits and around them; and 3) visitors also
need spaces for single participation within exhibits, as well as
resources to help them individually examine and make sense of
exhibits that are designed for groups of people or multi-parties.
On that regard, the authors suggest to offer resources for
participants so that they are able to creatively shape and configure
the experiences of others. They also emphasize the need to create
exhibits that accommodate both group and individual needs and
modes of interaction.
New tools and technologies have played an important role in
creating the conditions for collaboration to occur in museums, and
enabling the development of exhibits and systems that facilitate
interactivity. Examples are groupware and socialware or
systems that support groups [30, 31] and social interaction [32,
33]. Because people normally examine and make sense of exhibits
through social interaction, socialware [34] have been used to
support during-the-visit intragroup communication and allow
clusters of visitors to share experiences and information.
Together with systems that promote an interplay of physical,
Augmented [35, 36] and virtual reality [37] technologies, known
as cross reality or mixed presence tools and technologies [38, 39],
these have shown interesting results in museums.
Mixed Presence Groupware, MPG, or software that connects
collocated and distributed collaborators, and their disparate
displays, through a common shared virtual space [40, 41], is
another similar example that has been explored in order to allow
multiple people to work together over a shared exhibit space. And
games, simulations, and mobile devices are a few of the other
technologies that have been used to engage visitors in museum
exhibitions and encourage interaction and collaboration.
Examples of collaborative exhibits using these technologies
include: the Boston Museum of Sciences game, called Mystery at
the Museum [42], where students and parents are brought in as a
team of experts to try to solve a fictitious crime at the museum
space. This groupware [40] allows players to gather clues as they
visit the museum and collaborate by both communicating and
exchanging clues with teammates using location aware pocket
computers. Another system focused on collaboration amongst
children and parents is the Lunar Surface Navigation System [43].
This MPG [40, 41] connects co-located collaborators with a
combination of tabletop Augmented Reality and virtual
environment. Children play the role of the astronauts and parents
act as the mission commanders who give instructions on
exploration activities based on real lunar exploration episodes
reported by NASA.
4. BRAZILIAN PLANETARIUM AND
SCIENCE MUSEUM CASE STUDY
In order to bring the discussion into context and exemplify the use
of a human-centered participatory approach for the design of
collaborative museums, supported by cross reality group
technologies, the case of a Brazilian Planetarium and Science
Museum is presented. Amongst the Brazilian museums, the
Planetarium and Science Museum at hand is a public institution
situated at a cosmopolitan city. Its vision is to act as a culture and
entertainment institution, with the mission to divulge astronomy
which is absent in the Brazilian K12 curricula as well as to
promote other related science fields, through the use of avant-
garde technologies and an innovative environment. And amongst
its challenges are included: to become financially independent
from the government who currently covers 60% of its
expenditures; to renew the space and exhibits in order to support
discovery and interactivity for a diverse public in terms of age,
education, socioeconomic status and interests; and to maximize its
physical capacity.
In order to collaborate with the Brazilian Planetarium and Science
Museum in this effort, the Groupware@Les research group of
Computer Science Department of the Pontifical Catholic
University of Rio de Janeiro, proposed a project to co-design
together with children, teenagers, teachers, designers, computer
scientists, and astronomers, amongst others and transform the
museum spaces, exhi