perspectiva da interao social em comunidades de prtica Fernando M. Figueira Filho 1
Paulo Lcio de Geus 2
Instituto de Computao - UNICAMP {fmarques 1 , paulo 2 }@ic.unicamp.br
Joo Porto de Albuquerque Escola de Artes, Cincias e Humanidades - USP j.porto@usp.br
ABSTRACT Social interaction mediated by information technology has been studied from several perspectives over the past years. This paper draws attention to the relevance of classification systems and categories as important mediation artifacts in human-computer interaction. In this sense, classification schemes provide meaning to information and mutual understanding between the parts in an interaction. However, studies in distributed cognition show us that classification schemes have a flexible nature and depend on the context in everyday human activity. Under this perspective, this paper analyzes three approaches to classification in the web: the semantic web, collaborative annotation and hybrid approaches. The analyses are based on the concept of communities of practice and on the perspective of context as a problem of social interaction in these communities. Based on these theoretical works, this paper derives two design principles for web classification systems: firstly, collaboration allows for participating users to be active agents in content classification. Secondly, multidimensionality permits the co-existence and management of multiple classification perspectives, which is of fundamental importance in complex, heterogeneous and large-scale infrastructures such as the web.
RESUMO A interao social mediada pelas tecnologias de informao temsido estudada a partir de diversas perspectivas ao longo dos ltimos anos. Esse artigo chama a ateno para a relevncia dos sistemas de classificao e suas categorias como importantes artefatos de mediao na interao humano-computador. Nesse sentido, esquemas de classificao provem significado informao e o entendimento mtuo entre as partes em uma interao. Entretanto, estudos em cognio distribuda nos mostram que esquemas de classificao possuem uma natureza flexvel e dependem do contexto na atividade diria humana. Sob essa perspectiva, esse artigo analisa trs abordagens para classificao na web: a web semntica, anotao colaborativa e abordagens hbridas. As anlises so baseadas no conceito de comunidades de prtica e na perspectiva de contexto como um problema de interao social nessas comunidades. Baseado nesses trabalhos tericos, esse artigo deriva dois princpios para o projeto de sistemas de classificao na web: primeiramente, a colaborao permite a participao dos usurios como agentes ativos na classificao de contedo. Como segundo princpio, a multidimensionalidade permite a co-existncia e o gerenciamento de mltiplas perspectivas de classificao, o que de fundamental importncia em sistemas complexos, heterogneos e de larga-escala como a web atual. Author Keywords Classification systems, web collaborative systems, communities of practice, social web. ACM Classification Keywords H5.3 [Information Systems Interfaces and Presentation (e.g. HCI)]: Group and Organization Interfacescollaborative computing, web-based interaction, theory and models; H5.4: Hypertext/Hypermediatheory, user issues; H5.m: Miscellaneousclassification systems. INTRODUO A web atual tem fomentado a criao de comunidades virtuais atravs de diversas ferramentas, como os wikis, os blogs e as redes sociais online. Essa tendncia ocorre no contexto do que tem sido chamado de web social. O termo pode ser compreendido como uma mudana de paradigma que observada, por umlado, no surgimento de aplicaes que incentivam a interatividade entre as pessoas e possibilitam uma maior participao do usurio como produtor de informao, em detrimento da postura exclusiva de consumidor que era dominante na Internet de alguns anos atrs. Por outro lado, o novo paradigma tem levado a um crescente interesse em explorar, de maneira explcita ou implcita, a riqueza dos elos que se firmam com a interao social mediada pelas tecnologias de informao.
Permission to make digital or hard copies of all or part of this work for personal or classroomuse is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. IHC 2008, October 2124, 2008, Porto Alegre, Brazil. Copyright 2008 ACM 978-1-60558-011-1/08/04$5.00
Na era da web social, embora observemos um crescimento no volume total de informao que gerada de forma colaborativa, a informao possui cada vez mais um escopo local, sendo produzida com o propsito de ser compartilhada entre pessoas que tm em comum uma mesma atividade: escritores de poesia, amantes de um esporte, colaboradores em enciclopdias online (e.g. Wikipedia 1 ), desenvolvedores de software ou fotgrafos amadores. Na web, cada comunidade interage independentemente das barreiras geogrficas que separam seus membros e o resultado dessa interao o desenvolvimento de um conhecimento coletivo que atrai novos membros, num processo dinmico e contnuo que mediado pelas tecnologias de informao e sofre influncia direta do design das ferramentas que promovem essa interatividade. Nesse contexto, a crescente interao entre comunidades tem motivado os pesquisadores em IHC (Interao Humano-Computador) a ampliar o foco dos estudos na rea, incorporando uma nova perspectiva do funcionamento da cognio humana que abandona uma viso estritamente centrada no indivduo e prope uma abordagem situada e coletiva, a qual abrange aspectos externos mente humana e coloca os fatores sociais no mesmo patamar de importncia para o estudo da cognio. Essa corrente, embasada nos trabalhos de pesquisadores como Hutchins [10], Star [16] e Lave [12], temsido fundamental para um estudo mais abrangente da interao humana em sistemas de informao complexos, heterogneos e de larga-escala, como o caso da web atual. Nesse artigo estamos interessados em analisar, sob essa perspectiva, as abordagens atualmente empregadas para classificao da informao disponvel na web. Os impactos da classificao em sistemas de informao tm sido explorados em um largo espectro de contextos, conforme destaca o trabalho de Bowker e Star [4]. Contudo, pouco foi revelado nesse sentido com relao ao espao informacional da web e sua infra-estrutura. O desafio que a web apresenta atualmente est evidenciado na crescente tenso entre o local o conjunto de informaes que relevante para uma determinada comunidade e o global a informao que tem permeabilidade entre diferentes comunidades e serve como base para a interao entre elas. O papel dos sistemas de classificao crucial no gerenciamento dessa tenso e o presente trabalho pretende mostrar que, embora a web e suas ferramentas apresentem novas abordagens para classificao da informao, os problemas encontrados nessas abordagens tm suas origens nos paradigmas e nas decises de projeto que so utilizados para o desenvolvimento daquelas ferramentas. Diante desse problema, o estudo aqui apresentado analisa duas tendncias aparentemente opostas no que tange classificao da informao na web: a) a estratgia proposta
1 http://www.wikipedia.org pelos adeptos de Tim Berners-Lee e da web semntica [3] (por vezes tambm chamada de Web 3.0), que baseada no uso de ontologias e de vocabulrios controlados para representao da informao; e b) a abordagemde anotao colaborativa, que vem sendo largamente empregada em diversos servios, dentre eles portais para compartilhamento de contedo (e.g. Flickr 2 ) e tambm em ferramentas de bookmarking social (e.g. del.icio.us 3 ). A anotao colaborativa se baseia na associao de termos (ou tags) aos contedos digitais, representando a informao do contedo segundo um vocabulrio no-controlado que criado livremente pelos prprios usurios de cada servio. O presente trabalho analisa essas abordagens baseado no conceito de comunidades de prtica proposto por Wenger [19] e na perspectiva de contexto como um problema de interao social nessas comunidades, proposta por Dourish [5]. Com base nesses trabalhos tericos, esse artigo deriva dois princpios para o projeto de sistemas de classificao na web: primeiramente, a colaborao permite a participao dos usurios como agentes ativos na classificao de contedo. Como segundo princpio, a multidimensionalidade permite a co-existncia e o gerenciamento de mltiplas perspectivas ou sistemticas de classificao, o que de fundamental importncia dada a heterogeneidade do conjunto de usurios da web. O restante desse artigo est organizado como se segue: primeiramente, o artigo detalha cada uma das duas abordagens citadas acima, apresentando suas caractersticas estruturais e analisando suas peculiaridades tcnicas. Em seguida, introduz os referenciais tericos relacionados perspectiva de cognio distribuda, que servem, mais frente, como base para uma nova anlise das abordagens apresentadas, sob essa outra perspectiva. A partir dessa anlise, o artigo deriva dois princpios para o desenvolvimento de sistemas de classificao na web a colaborao e a multidimensionalidade terminando com uma concluso. CLASSIFICAO NA WEB Atualmente a web apresenta duas tendncias para classificao da informao disponvel. Por um lado, a web semntica se baseia num conjunto de padres de representao (e.g. RDF [11]) e linguagens para descrio de ontologias (e.g. OWL [14]), que compem uma nova plataforma para o desenvolvimento de servios. No cerne dessa abordagem est o uso de ontologias para classificao da informao. Por outro lado, a abordagem de anotao (ou tagging) cresce bastante em popularidade nas ferramentas da web social. Trata-se de uma estratgia de classificao distribuda, com um forte carter colaborativo e que se
2 http://www.flickr.com 3 http://del.icio.us
3 sustenta atravs das contribuies de seus prprios usurios. Essa seo pretende analisar em maiores detalhes cada uma dessas abordagens e apresentar uma breve reviso de alguns trabalhos recentes que propem abordagens hbridas, com o objetivo de mesclar algumas das vantagens encontradas na abordagem de ontologias com a abordagem de anotao. Ontologias Segundo a definio de Gruber [8], uma ontologia uma especificao explcita da conceituao de um domnio. Em outras palavras, ontologias so esquemas de classificao padronizados e, nesse aspecto, se assemelham aos demais esforos de padronizao que conhecemos pela histria afora, como a taxonomia dos seres vivos na biologia, a classificao internacional de doenas (ICD) elaborada pela organizao mundial de sade, dentre outros. Ontologias so, portanto, classificaes formais, compostas de um vocabulrio controlado para representao de categorias e cujos termos devem ser avaliados pela sua preciso e acuidade. Como em outras classificaes formais, o projeto de ontologias visa estabilidade temporal, isto , interessa aos projetistas de uma ontologia que sua estrutura, vocabulrio e relaes conceituais mantenham-se estveis ao longo do tempo num dado domnio de discurso, atendendo os requisitos iniciais e evitando esforos de reestruturao que podem ser bastante custosos. Entretanto, conforme destaca Hepp [9], ontologias apresentam algumas restries, tanto em relao sua criao quanto sua atualizao, as quais so resumidas a seguir: i) Em determinados domnios do conhecimento, existe um atraso significativo entre a especificao estabelecida pela engenharia de ontologias e a dinmica conceitual, isto , novos conceitos passam a ser relevantes para um dado domnio, enquanto que outros caem na obsolescncia. Essas mudanas no so absorvidas em tempo hbil pelas ontologias correspondentes, o que dificulta o desenvolvimento de ontologias para ambientes como a web, em que a produo de informao segue em ritmo acelerado, dando lugar a novos nichos informacionais e a uma crescente diversidade conceitual; ii) tomando uma perspectiva econmica, os ganhos provenientes da automao que se torna possvel atravs de uma ontologia no superam, em muitos casos, os recursos gastos para desenvolver essas mesmas ontologias. Isso porque, no estgio atual, o desenvolvimento de ontologias se d como resultado do trabalho de um conjunto relativamente pequeno de especialistas em um domnio, sendo esse um fator limitante para a capacidade de evoluo dessas ontologias; iii) por serem desenvolvidas por especialistas, a necessidade de comunicao e entendimento entre os criadores de uma ontologia e os desenvolvedores para web se torna crucial para o sucesso da especificao da aplicao web, objetivo que no facilmente alcanado. Atualmente, a nica forma de comunicao entre essas partes atravs de especificaes escritas em linguagens especficas (e.g. RDF e OWL), cujo entendimento limita-se geralmente a poucos programadores e a profissionais especializados. Como conseqncia, mesmo entre os especialistas em um domnio de discurso, poucos esto aptos a lidar com esses formalismos, e muito embora esse problema possa ser atenuado com o uso de ferramentas grficas para construo de ontologias, ainda assim no h garantias de que o produto final ir atender aos propsitos de quem ir utiliz-lo. Embora apresentem dificuldades para se adequar ao dinamismo da web, ontologias tm o potencial de solucionar uma srie de problemas hoje enfrentados principalmente pelos mecanismos de busca de informao. Dentre esses problemas, podemos destacar a ambigidade de termos causada pela polissemia quando um s termo est associado a mltiplos sentidos (e.g. mouse pode referir- se ao dispositivo de computador, a uma espcie de roedor ou, ainda, ao sobrenome do roedor mais famoso do mundo) e pela sinonmia quando mltiplos termos representam o mesmo sentido (e.g. carro e automvel). A argumentao dos adeptos da web semntica que a linguagem hipertextual per se, composta de termos que esto dissociados de qualquer especificao formal de conceitos, leva naturalmente impreciso nos resultados de busca e a outros problemas relacionados recuperao de informao. Anotao colaborativa Em outro extremo, a abordagem de anotao colaborativa cresce em popularidade e, assim como as ontologias, tambm apresenta vantagens e desvantagens. Na web, o produto da atividade colaborativa de anotao leva o nome de folksonomia 4 e podemos observar o uso da abordagem emdiversos servios hoje disponveis, dentre eles portais de compartilhamento de contedo (e.g. Flickr, You Tube 5 ) e ferramentas de bookmarking social (e.g. del.icio.us). Embora cada vez mais populares e abundantes, os sistemas de anotao so muito semelhantes entre si quanto s suas funcionalidades. Basicamente, uma vez autenticado no sistema, cada usurio tem a opo de associar termos (ou tags) aos contedos que compartilha ou mesmo aos contedos compartilhados por outros usurios. No h controle sobre os termos que podem ser associados (vocabulrio no-controlado), de modo que qualquer seqncia de caracteres, a princpio, pode ser utilizada. Do ponto de vista do usurio consumidor de contedo, existem hoje duas maneiras de se utilizar uma folksonomia. A primeira equivalente s tradicionais buscas por palavras-chave. Nesse caso, as palavras-chave so usadas como um filtro para selecionar os contedos previamente classificados com os termos usados na busca. A segunda
4 Termo cunhado por Vander Wal [18], a partir da juno das palavras inglesas folk e taxonomy. 5 http://www.youtube.com
atravs das chamadas nuvens de termos (ou tag clouds), que representam um subconjunto de termos de uma folksonomia com pesos que variam de acordo com a freqncia de associao de cada termo. Na nuvem, os termos mais freqentes geralmente possuem maior destaque (i.e. aumento da fonte). As folksonomias possuem algumas vantagens principais: i) como produto de uma atividade coletiva de classificao, o resultado de uma busca pode trazer no somente contedos classificados pelo prprio usurio que realiza a busca, mas tambm contedos classificados por outros usurios. Essa caracterstica confere maior abrangncia s folksonomias, no sentido de que os esforos de classificao podem ser distribudos entre uma gama abundante e variada de usurios; ii) as folksonomias esto relacionadas a um paradigma de organizao que apresenta algumas vantagens comrelao a outras abordagens mais tradicionais como, por exemplo, a de diretrios. Do ponto de vista estrutural, diretrios so hierrquicos e exclusivos, enquanto que folksonomias so planas e no-exclusivas [6], de maneira que, numa folksonomia, um contedo pode estar associado a diversas categorias ao mesmo tempo e no pertencer a nenhuma categoria exclusivamente. iii) os servios de anotao oferecemuma baixa barreira de entrada aos seus usurios e isso funciona como um incentivo colaborao na criao de folksonomias [1]. Em particular, sistemas de anotao so fceis de usar, podem ser integrados aos navegadores na forma de plug-ins gratuitos (e.g. del.icio.us) e seus usurios no so obrigados a usar nenhum vocabulrio controlado para classificar um contedo, ao contrrio da abordagem de ontologias. Entretanto, folksonomias tm em comum com a web tradicional as mesmas caractersticas que so alvo de crticas por parte dos defensores do emprego de ontologias e da web semntica. Particularmente, os termos de uma folksonomia no possuem nenhuma relao explcita entre si, ao contrrio de umesquema de diretrios, no qual os nomes apresentam uma relao hierrquica. Alm disso, os termos tambm no possuem nenhuma relao com conceitos formalmente especificados e, dessa forma, no possvel estabelecer nenhum tipo de relao semntica entre termos (e.g. no existe nenhuma regra que relacione os termos carro e automvel). Essas caractersticas levam a ambigidade que, do ponto de vista da recuperao de informao, responsvel pela gerao tanto de problemas de preciso (i.e. recuperao de informao irrelevante), quanto de problemas de revocao (ou recall, i.e. a omisso de informaes relevantes). A seo seguinte revisa alguns trabalhos que procuram solucionar esses problemas atravs de abordagens hbridas. Abordagens hbridas Folksonomias so estruturalmente planas, isto , no h relaes de qualquer natureza entre os termos que as compem. Extrair relaes semnticas entre os termos de uma folksonomia possibilitaria, por exemplo, a extenso de consultas para termos relacionados ao contexto da pesquisa, bem como a desambiguao de consultas, quando necessrio. Nas nuvens de termos, destaques poderiam ser dados no somente aos termos mais freqentes, mas tambm a termos semanticamente relacionados. Com esse objetivo, algumas abordagens hbridas procuram integrar a estratgia de anotao com a abordagem da web semntica, na tentativa de, com isso, aumentar a capacidade de inferncia sobre o espao folksonmico. Nessas abordagens, a folksonomia complementada por estruturas de dados auxiliares que estabelecem relacionamentos entre os termos de uma folksonomia. Alguns trabalhos tm aplicado mtodos estatsticos com esse objetivo. [13, 20, 2] exploram a co-ocorrncia de termos na classificao de diferentes contedos. Begelman et al. [2] extrai do espao folksonmico um grafo no- direcionado, com termos em vrtices e com arestas ponderadas unindo termos relacionados, cujo peso indica o nmero de vezes que os termos co-ocorremna folksonomia. Wu et al. [20] apresenta um modelo probabilstico, tambm com o objetivo de gerar agrupamentos (ou clusters) de termos relacionados semanticamente. Schmitz [13] extrai relaes do tipo pai-filho entre pares de termos baseado no clculo de probabilidades de um termo x ocorrer dado um termo y em contraste com a probabilidade de y ocorrer dado x. Semntica como um problema de representao O que h em comum entre a abordagem de ontologias e as abordagens hbridas recm-apresentadas que ambas enxergam a semntica como um problema de representao. Nessa viso, categorias (ou termos) so relacionadas semanticamente a partir de estruturas de dados que, no caso das ontologias, so construdas a priori atravs do trabalho e da reviso de um grupo de especialistas, e no caso das abordagens hbridas, so automaticamente extradas do espao folksonmico a partir de mtodos estatsticos. Ao relacionar duas categorias dessa maneira num esquema de classificao, estabelecemos uma ligao esttica que independente do contexto da atividade em que aquelas categorias foram usadas de fato. Segundo Dourish [5], ver o contexto como um problema de representao apenas uma das maneiras de enxergar a contextualidade. Nesse ponto de vista, o contexto ou as relaes semnticas so um tipo de informao que pode ser representada atravs de estruturas de dados, como grafos, vetores etc. As relaes descritas nessas estruturas so estveis e, dessa forma, so aplicveis em qualquer situao. Por essa razo, contexto e atividade, sob essa perspectiva, so completamente separveis. Seguindo a mesma linha argumentativa de Dourish, a seo seguinte analisa o conceito de comunidades e sua relao com uma prtica regular. Essa concepo ser fundamental para a crtica dessa perspectiva de semntica como um problema de representao e servir como base para
5 introduzirmos uma nova concepo, na qual a interao tem um papel central no conceito de semntica e de contextualidade para a atividade de classificao em sistemas de informao complexos, como o caso da web atual. COMUNIDADES E CLASSIFICAO Comunidades virtuais so estudadas em diversas disciplinas, e embora haja uma noo intuitiva do que elas representam, no h um consenso quanto sua definio. Nesse artigo estamos particularmente interessados em comunidades virtuais cujos membros esto de alguma forma envolvidos em uma prtica regular. Essa seo visa apresentar o conceito de comunidade de prtica e sua relao com os sistemas de classificao. Essa noo fundamenta a anlise das abordagens de classificao para web sob a perspectiva da interao entre membros de uma mesma comunidade e entre membros de diferentes comunidades. Comunidades de prtica e semntica Segundo Wenger [19], comunidades de prtica so grupos de pessoas que compartilham um interesse ou uma paixo por algo que fazem e aprendem como faz-lo melhor atravs da interao regular entre os membros do grupo. Esses grupos no esto necessariamente associados a uma organizao, podem no apresentar uma hierarquia definida entre seus componentes e emgeral no so regidos por regras ou normas formais como nas organizaes tradicionais. Nesse aspecto, os conceitos desenvolvidos por Wenger a partir da observao dos processos informais de aprendizagem podem ser aplicados ao estudo da interao entre comunidades que se d mediada pelo aparato tcnico das redes de informao e seus softwares. Cabe aqui entender o conceito de prtica, na concepo de Wenger. Para ele, prtica primeiramente e acima de tudo um processo atravs do qual ns podemos experimentar o mundo e nosso envolvimento com ele de modo compreensvel [19]. Em outras palavras, o mundo se torna compreensvel para ns medida que adquirimos experincia atravs do nosso envolvimento em atividades que realizamos regularmente. Como um exemplo, suponha que uma pessoa que queira aprender a tocar um instrumento e participe de ensaios regulares com uma banda, mas no tenha nenhum conhecimento preliminar em msica. No primeiro contato com o grupo essa pessoa talvez tenha dificuldades de distinguir os instrumentos, salvo pelo reconhecimento de caractersticas como cor, formato ou tamanho. Nesse estgio da interao com o grupo, a pessoa pouco sabe sobre a funo desempenhada por cada instrumento na banda. Entretanto, medida que a pessoa vai se familiarizando com o seu prprio instrumento e praticando com os demais, outros aspectos passam a fazer sentido e ela se torna capaz de diferenciar, por exemplo, um som agudo de umgrave ou um timbre metlico de um aveludado. Mais do que isso, a partir da interao gradual com os demais membros da banda, a pessoa reconhece a funo do seu instrumento dentro da msica. No s os seus conhecimentos tcnicos evoluem, mas tambm o seu vocabulrio (i.e. o membro passa a usar os jarges usados pelo grupo) e suas preferncias musicais e artsticas (i.e. msicos trocam lbuns entre si, recomendam artistas). Ao se tornar um msico experiente, a pessoa no domina apenas a tcnica, mas, acima de tudo, passa a olhar o mundo sob a perspectiva de um msico. Nesse sentido, a participao em uma comunidade de prtica, seja em sua periferia, ainda como aprendiz, ou em seu ncleo, como praticante envolvido e experimentado, revela novos aspectos do ambiente e possibilidades de ao que passam a ser relevantes para as atividades que o membro realiza no seu dia-a-dia. Isso inclui os sistemas de classificao e suas categorias. Segundo Bowker e Star [4], medida que uma pessoa ganha envolvimento numa comunidade de prtica, categorias at ento consideradas estranhas ou diferentes passam a ser familiares ao membro, num processo chamado de naturalizao. Por exemplo, o msico que antes estranhava os termos aveludado ou metlico para classificao de um timbre sonoro, passa a entender o significado dessas categorias atravs do seu envolvimento e participao em comunidades de prtica formadas por msicos. A prtica, portanto, o processo pelo qual as coisas e as aes ganham significado. Membros de uma mesma comunidade de prtica interagem em um mesmo processo e, por isso, desenvolvem esquemas de classificao prprios que refletem suas crenas, interpretaes e vises de mundo. Dessa forma, uma categoria no possui um significado em si prpria. Antes, a associao entre informao e uma categoria s possui sentido ou evoca significado no contexto de uma prtica. O local versus o global Na introduo apontamos a tenso entre o local a informao que tem significado e relevante para uma comunidade especfica e o global a informao que pode ser utilizada na interao entre diferentes comunidades. Na web, o gerenciamento dessa tenso para veiculao da informao apresenta diversos desafios em vrias reas da computao. Nesse artigo, estamos interessados em contextualizar o problema com o conceito de comunidade de prtica. At ento discutimos a interao entre os membros de uma mesma comunidade, processo que fundamental para o desenvolvimento de um conhecimento coletivo e para elaborao de esquemas de classificao locais comunidade. Nessa seo analisaremos, sob essa perspectiva, como se d a interao entre diferentes comunidades de prtica e qual o papel dos sistemas de classificao nesse processo. Em uma comunidade de prtica, membros no so legitimados como tal de maneira abrupta, mas atravs de um processo contnuo de participao. O envolvimento de uma pessoa em uma comunidade de prtica parte de uma participao perifrica e, nesse estgio, o membro ainda no
est familiarizado com os objetos e com os esquemas de classificao daquela comunidade (i.e. o membro ainda no totalmente um membro, ele no fala como um membro, no age como um membro e no interpreta o mundo como um membro). Do ponto de vista da comunidade, a pessoa ainda um estranho no ninho, algum de fora. Do ponto de vista do participante, tudo o que vem daquela comunidade parece estranho, ambguo ou incompreensvel. Entretanto, com a participao ativa na comunidade e com o crescimento dos laos de relacionamento com seus membros, os objetos e as categorias peculiares quela comunidade passam a ser familiares. Ningum determina que uma pessoa seja membro de uma comunidade. Isso ocorre atravs de um processo gradual e informal que tem como base o conceito de prtica. At agora tratamos do conceito de local sob a perspectiva de uma comunidade de prtica singular. Mas o que ento corresponderia ao global? O global o que permite a interao entre comunidades, o que d permeabilidade informao entre diferentes contextos. No processo dinmico de formao de novas comunidades, o global confere um grau de abertura imigrao de novos membros [4]. O global alivia a tenso do estranho versus o familiar, do naturalizado versus o incompreensvel. Em outras palavras, o global faz a ponte entre o que local a diferentes comunidades de prtica, aproximando essas comunidades. Eventualmente, membros exclusivos de uma comunidade, atravs desse processo de mediao, passam gradualmente a fazer parte de outras comunidades. Ns, como membros de mltiplas comunidades de prtica, somos agentes na construo de um contexto global entre elas. Fazemos isso, por exemplo, ao convidar os amigos do laboratrio de computao a participar de um coral e ao ajudar os colegas do coral a resolver problemas com o computador de casa. A importncia desse trabalho de articulao j havia sido reconhecida por socilogos como Granovetter em [7], trabalho no qual ele destaca a importncia dos elos fracos na interao entre grupos sociais distintos. Nesse sentido, o conceito de objetos de fronteira (ou boundary objects) central nessa discusso e vem enriquecer o papel do contexto global na interao entre comunidades de prtica. Durante estudo de caso realizado em um museu de histria natural com cientistas membros de diferentes comunidades de prtica, Star e Griesemer [17] perceberam que os mesmos espcimes de pssaros mortos tinham significados bem diferentes entre bilogos especialistas e amadores apreciadores de pssaros. A cooperao entre diversas partes, no entanto, faz-se atravs da negociao de um significado comum que permita a comunicao e o trabalho emconjunto. Por outro lado, essa negociao no implica na imposio da perspectiva de uma comunidade sobre a outra, nem no uso de uma fonte externa de padronizao. O papel dos sistemas de classificao nessa negociao o de estabelecer categorias que sejam de comum entendimento entre diferentes comunidades de prtica. Na interao entre especialistas e amadores no caso do museu, a categoria pssaro suficientemente adequada para promover a comunicao, mas provavelmente no o seria na interao entre bilogos com diferentes especialidades. Nesse sentido, categorias e suas fronteiras precisam ser elsticas o suficiente para se adaptar s necessidades locais e robustas o suficiente para manter uma identidade global entre comunidades de prtica diferentes, isto , as categorias se tornam objetos de fronteira. Esse aspecto d origem a esquemas de classificao que devem ser fortemente estruturados no escopo local e fracamente estruturados no escopo global. Semntica como um problema de interao Na web, comunidades e informao habitam mltiplos contextos. Nesse sentido, prover a semntica adequada para a informao atravs de diferentes contextos tem se tornado uma preocupao crescente na rea de IHC. Conforme vimos anteriormente, a semntica por vezes colocada como um problema de representao, concepo que fruto da idia de que o contexto pode ser capturado, representado e modelado. Essa concepo motivou a crtica de pesquisadores como Dourish em [5], no qual o conceito de contexto dividido entre uma concepo mais positivista contexto como representao e outra mais fenomenolgica contexto como interao. Se o contexto tem um carter representacional, atividade e contexto so separveis. Nessa viso, a semntica da informao definida a priori e sua representao permanece relativamente estvel com o tempo. Em oposio a essa perspectiva, Dourish prope uma viso alternativa da contextualidade que considera a interao como insumo primrio para determinao da semntica da informao. Nessa nova perspectiva, a contextualidade uma propriedade relacional que se firma entre a informao e a ao. Uma informao no possui um significado pr- determinado ou est em uma categoria pr-definida. Ao contrrio, a informao pode ter um significado ou pode estar associada a uma categoria, dependendo da atividade que est em considerao. Por essa razo, contexto e significado so caractersticas determinadas dinamicamente, e no a priori. O contexto uma conseqncia, no uma premissa. Dourish encontra a relao entre ao e significado no conceito de prtica explorado anteriormente nessa seo. Essa unificao, segundo ele, central para questo do contexto, uma vez que o contexto est essencialmente relacionado s maneiras segundo as quais as aes podem ser compreendidas [5]. Nessa concepo, questes como o que constitui o contexto, como a relevncia da informao pode ser gerenciada, como a semntica da informao pode ser levada atravs de diferentes contextos etc. so questes relacionadas ao conceito de prtica. A prtica, nessa viso, o processo atravs do qual ao e significado podem ser relacionados. Nesse aspecto, a semntica da
7 informao no algo a ser representado, mas sim negociado a partir da interao entre membros de uma mesma comunidade de prtica no escopo local da interao ou entre membros de diferentes comunidades de prtica no escopo global da interao. Outro fator importante nessa concepo, destaca Dourish, considerar a prtica como um processo dinmico, que evolui e se adapta. Dessa forma, apenas representar formas particulares de prtica seria voltar concepo representacional de contexto. Nesse aspecto, uma abordagem de classificao para web deve suportar a evoluo dos esquemas de classificao e a adaptao desses esquemas no nvel de interao, permitindo a emergncia de novas relaes entre ao e significado. A seo seguinte se baseia no referencial terico apresentado nessa seo e na perspectiva de contextualidade proposta por Dourish para analisar, sob outra lente, as abordagens de classificao na web. CLASSIFICAO NA WEB: UMA NOVA PERSPECTIVA Na anlise inicial das abordagens de classificao na web foram considerados os seus aspectos tcnicos e detalhes operacionais. Aqui pretendemos aprofundar aquela anlise e rever cada abordagem sob a tica do conceito de prtica, da tenso entre o local e o global nos sistemas de classificao e da perspectiva de contexto como problema de interao. Web semntica e a padronizao Ontologias Ontologias so produzidas atravs de esforos de padronizao, estabelecendo uma especificao da conceituao sobre um domnio de conhecimento particular. Nesse sentido, ontologias procuram solucionar o problema da tenso entre o local e o global, impondo um padro nico de representao. Entretanto, estudos anteriores sobre o uso da padronizao em sistemas de informao de larga-escala revelam que os padres no se sustentam como tal por muito tempo e que o padro para alguns, pode se tornar a confuso de outros [15]. Em uma infra-estrutura distribuda e heterognea como a web, o uso da padronizao dificulta ou mesmo impossibilita a interao entre diferentes comunidades de prtica. Um requisito primrio para que haja a interao nesse nvel o compartilhamento de estruturas de categorizao de escopo global. Categorias, nesse sentido, so objetos de fronteira com um importante trabalho de articulao, permitindo a compreenso mtua entre as partes de uma interao e veiculando a semntica da informao atravs das fronteiras de cada comunidade. Entretanto, tais estruturas no emergem de um esforo unilateral de uma comunidade particular, mas da negociao entre diferentes comunidades. O problema das ontologias est na estratgia de padronizao que est por trs da abordagem. Um esquema de classificao padronizado reflete a crena em um estilo particular de classificao ou, ainda, uma viso particular de umdomnio de discurso de acordo com a prtica de seus criadores. Em outras palavras, ontologias tm o objetivo de funcionarem globalmente, mas no escondem a parcialidade, que o reflexo da perspectiva de uma minoria de especialistas que as produzem. A imposio de um padro por uma minoria de especialistas em um domnio automaticamente exclui a perspectiva de uma maioria que tambm interage emum mesmo sistema de informao. Por essa razo, a web semntica e o uso de ontologias para classificao da informao no oferecem apenas desafios tcnicos e econmicos como sugere Hepp [9], mas tambm importantes desafios de carter social a serem transpostos. Abordagens hbridas No contexto da web semntica, as abordagens hbridas procuramunir as vantagens dos sistemas colaborativos com a capacidade de inferncia das ontologias. Os trabalhos nessa direo tm o objetivo de extrair relaes semnticas entre os termos de uma folksonomia, construindo estruturas de dados que representam essas relaes. Diferentemente da estratgia de ontologias, a representao aqui no elaborada e gerenciada por um conjunto de especialistas, mas extrada automaticamente atravs de mtodos estatsticos baseados na co-ocorrncia de termos em diferentes anotaes. A estratgia no deixa de ter uma relao com a padronizao. Em vez de padres serem elaborados como no caso das ontologias, nesse caso padres so extrados, de modo que as estruturas de dados so construdas automaticamente a partir do reconhecimento de padres (i.e. co-ocorrncia de termos). Nessa estratgia, a relao semntica entre termos avaliada quantitativamente, a partir de distribuies das freqncias dos termos numa folksonomia e sem levar em considerao o contexto de classificao. Dessa forma, nada revelado com relao aos diversos esquemas locais de classificao, uma caracterstica em comum com a estratgia de ontologias. Em ressalva, a abordagem de ontologias ao menos considera uma perspectiva real de classificao aquela formada pelos especialistas que constroem a ontologia. No caso das abordagens hbridas, no existe uma perspectiva definida e a confiabilidade dos esquemas produzidos estar sempre sujeita aos erros inerentes ao mtodo estatstico empregado. Anotao colaborativa e a multiplicidade O resultado da atividade de anotao a produo de folksonomias, que so esquemas de classificao produzidos colaborativamente e, por isso, representam um lugar comum para o acmulo de mltiplas perspectivas de classificao. Nesse sentido, folksonomias apresentam uma importante e decisiva vantagem sobre a estratgia de padronizao empregada pela web semntica.
Entretanto, folksonomias tambm apresentam problemas. Os mais salientes esto relacionados ausncia de relacionamento entre os termos e a falta de estrutura, o que leva a uma baixa capacidade de inferncia e aos problemas relacionados ambigidade. Conforme foi analisado anteriormente, esse conjunto de caractersticas traz problemas de recuperao de informao, diminuindo a eficincia da abordagem. Porm, ao mudarmos de perspectiva, percebemos problemas de outra natureza. Em primeiro lugar, uma folksonomia no representa um nico esquema de classificao, mas diversos deles. Dessa forma, o problema da ambigidade no est apenas no nvel lxico, mas num nvel mais abstrato, relacionado aos esquemas de classificao. Diversas perspectivas de classificao encontram-se miscigenadas no espao folksonmico, no sendo possvel escolher qual delas a mais adequada para uma determinada ocasio. Nesse ponto, voltamos ao problema do contexto. Quando realizamos uma busca em uma folksonomia utilizando, por exemplo, o termo A como palavra-chave, poderamos traduzir a consulta para a seguinte pergunta: Quais contedos foram classificados com o termo A?. Entretanto, sabemos que, pelo problema da ambigidade, o sistema poder trazer resultados irrelevantes. Agora suponhamos uma situao hipottica, em que a semntica do termo A pudesse ser especificada atravs do contexto no qual o termo foi usado para classificao. Isso eliminaria os resultados ambguos, aumentando a eficincia da busca. Ento uma forma de melhorar os resultados da pesquisa seria refinar a pergunta: Quais contedos foram classificados com o termo A no contexto X?. Dessa forma, estaramos especificando a semntica exata do termo, atravs da indicao explcita do contexto em que o termo se aplica. Porm, essa abordagem hipottica nos revela dois problemas. Em primeiro lugar, a composio das folksonomias atuais s capaz de armazenar o relacionamento entre trs entidades: contedo, termo e usurio. Consultas devem levar em conta apenas os relacionamentos dessas entidades e, dessa forma, a especificao de um contexto exigiria a incluso de uma quarta entidade no espao folksonmico, que hoje no existe. Em segundo lugar, ao indicar o contexto na pergunta, estamos tratando o contexto como uma forma de informao. Dessa maneira, independentemente do aparato tecnolgico e dos sistemas de software envolvidos, o contexto requereria uma forma de representao, o que permitiria comunicar ao sistema de busca qual o contexto que nos relevante para aquela dada consulta. Isso significa tratar a semntica do termo A como um problema de representao, o que tem sido alvo de crtica em toda argumentao apresentada nesse artigo. Ainda que as folksonomias comportassem o contexto como uma quarta entidade, o contexto no algo que possa ser representado, conforme argumentamos ao longo desse artigo. COLABORAO E MULTIDIMENSIONALIDADE Entre as trs abordagens de classificao analisadas na seo anterior, pudemos confrontar a estratgia de padronizao empregada pelas ontologias e abordagens hbridas, e a estratgia de colaborao dos sistemas de anotao. Em outras palavras, traamos um paralelo, no que tange s abordagens para classificao da informao, entre duas tendncias encontradas na web atual: a web semntica e a web social. Nessa anlise, mostramos que a estratgia de colaborao empregada nas ferramentas da web social permite o acmulo de mltiplas perspectivas de classificao na forma de folksonomias e que essa caracterstica representa um aspecto positivo com relao abordagem de padronizao defendida na web semntica. Entretanto, a estratgia de colaborao que d origem s folksonomias no apenas caracterizada por um conjunto de funcionalidades que incentivam a participao dos usurios como classificadores de informao. Mais do que isso, a estratgia de colaborao tem suas origens em uma mudana de paradigma no desenvolvimento de aplicaes para web. Ao interpretar a estratgia de colaborao como um novo paradigma, podemos expandir a nossa compreenso do problema e, assim, desvincul-lo de uma particular ferramenta ou aplicao. Nesse sentido, o objetivo dessa seo concluir a linha argumentativa defendida nesse artigo, elevando-a ao nvel dos princpios utilizados no projeto de aplicaes. A vantagem disso poder enxergar o problema da classificao da informao na web segundo princpios bsicos que podem ser aplicados no desenvolvimento de qualquer servio ou aplicao. Dessa maneira, podemos tratar as folksonomias no apenas como o resultado da atividade de classificao em sistemas de anotao, mas como fruto de um novo paradigma, que privilegia o papel do usurio como agente classificador da informao. Dando continuidade a anlise feita na seo anterior, as folksonomias, por outro lado, sofrem de problemas relacionados ambigidade, uma vez que o contexto da classificao perdido no ato da colaborao ou anotao. Foi argumentado que tais problemas no podem ser resolvidos atravs da representao do contexto, mas pela contnua negociao da semntica atravs da interao no nvel das comunidades de prtica. Nessa nova abordagem, uma folksonomia passaria de uma estrutura unidimensional, na qual mltiplas perspectivas esto miscigenadas em um nico espao, para uma estrutura multidimensional, na qual cada contedo classificado segundo mltiplas perspectivas ou sistemticas de classificao. Em vez de se misturarem em uma nica dimenso, essas mltiplas perspectivas co-existem no mesmo espao folksonmico, de modo que a classificao de um contedo tambm se torna multidimensional: h uma dimenso comum ou global que compartilhada por diversas comunidades de prtica; e diversas outras dimenses particulares ou locais a cada comunidade de
9 prtica. A diferena para abordagem convencional de folksonomias que, com o emprego da multidimensionalidade, sistemas de classificao podem separar uma perspectiva de classificao da outra, permitindo o gerenciamento da multiplicidade e o uso da multidimensionalidade estrutural para soluo do problema da perda do contexto no ato da classificao. Dessa forma, o problema do contexto tomado sob a perspectiva da interao e, assim, podemos definir um novo conjunto de funcionalidades para o desenvolvimento de abordagens de classificao de contedo na web, de modo que novas aplicaes passem a suportar, almda atividade colaborativa, a multidimensionalidade na atividade de classificao. Em primeiro lugar, essas aplicaes devem oferecer um espao compartilhado para interao entre membros de uma mesma comunidade de prtica, disponibilizando recursos como fruns de discusso, visualizao de perfis dos membros, troca de mensagens etc. Como exemplo, muitos servios para formao de redes sociais (e.g. Orkut 6 ) oferecem suporte a formao e ao gerenciamento de comunidades. Nesses servios, usurios podem filiar-se a diversas comunidades, sendo algumas delas moderadas e outras abertas ao pblico. Nesse contexto, cada comunidade teria um espao informacional prprio, que poderia ser privado (para acesso exclusivo dos membros de uma mesma comunidade) ou pblico (disponvel tambm para usurios externos). Nesse espao prprio, cada membro poderia compartilhar um contedo e classific-lo com as categorias (ou termos) de sua escolha, no escopo local comunidade. Outros membros da mesma comunidade poderiam complementar ou at mesmo corrigir determinadas classificaes (i.e. num funcionamento similar ao dos wikis). Alm dos espaos locais a cada comunidade, haveria um espao compartilhado que permitiria a interao entre comunidades no escopo global. Nesse espao, cada contedo seria representado por categorias de articulao, que teriam a funo dos objetos de fronteira explorados anteriormente nesse trabalho. Essas categorias poderiam ser estabelecidas automaticamente pelo sistema, a partir da escolha das categorias mais comuns utilizadas para classificao de um dado contedo nos diversos escopos locais (i.e. o sistema poderia escolher, por exemplo, as categorias com maior freqncia de associao para um mesmo contedo). Alternativamente, essas categorias de articulao poderiam ser estabelecidas colaborativamente, atravs de uma classificao compartilhada por membros de diferentes comunidades de prtica. O sistema poderia oferecer uma interface de navegao na qual fosse possvel visualizar mltiplas perspectivas de classificao em simultneo. Essa funcionalidade orientaria
6 http://www.orkut.com o usurio novato a encontrar comunidades de prtica afins e o auxiliaria na atividade de recuperao de contedo. Do ponto de vista da atividade de recuperao de contedo, os algoritmos fariam uso da estrutura multidimensional, dando maior relevncia s categorias e aos contedos compartilhados no escopo local do usurio, diminuindo, com isso, a ambigidade no nvel dos esquemas de classificao. CONCLUSO Nesse artigo apresentamos uma anlise das abordagens de classificao atuais para web, primeiramente sob uma perspectiva mais conservadora, e depois utilizando um referencial terico fundamentado em estudos na rea das cincias sociais e na rea da psicologia cognitiva. Atravs dessa nova perspectiva multidisciplinar, pudemos revelar problemas nas abordagens de classificao analisadas que, at ento, eram pouco explorados na literatura em computao. A linha argumentativa utilizada defende que o espao informacional da web no deve ser categorizado segundo estratgias de padronizao. Sistemas de informao de larga-escala como a web precisam estar preparados para gerenciar mltiplas perspectivas de classificao, dando suporte a um grupo cada vez mais heterogneo de usurios. O problema que surge : quando escolher uma perspectiva emdetrimento das outras? Essa pergunta nos levou para uma discusso aprofundada sobre a contextualidade nos sistemas de classificao e como tratar o problema nos sistemas de informao. Nesse sentido, o conceito de comunidades de prtica promove o elo entre o aprendizado e a prtica. Novos esquemas de classificao surgem para promover o significado da informao entre membros de uma mesma comunidade no escopo local da informao. Ao mesmo tempo, a interao entre diferentes comunidades se d atravs da negociao de estruturas de articulao que promovem o entendimento mtuo entre as partes no escopo global da informao. A compreenso do carter distribudo da cognio humana [10] nos faz repensar as decises de projeto e os modelos para o desenvolvimento de software atuais. Com esse objetivo, o presente artigo relaciona o problema da classificao com os atuais paradigmas usados para o desenvolvimento de aplicaes na web. Aps anlise baseada no conceito de comunidades de prtica proposto por Wenger [19] e na perspectiva de contexto como um problema de interao proposta por Dourish [5], o artigo prope dois princpios que devero fundamentar uma abordagem de classificao na web: o primeiro da colaborao fundamental na formao das folksonomias e no acmulo de mltiplas perspectivas de classificao. Entretanto, a identificao de cada perspectiva em uma folksonomia prejudicada pela mistura dessas diversas perspectivas em uma estrutura unidimensional. Nesse
sentido, o artigo prope o princpio da multidimensionalidade, atravs do qual mltiplas perspectivas de classificao podem co-existir e ser gerenciadas em sistemas de classificao. Nesse artigo, propusemos a relao dessa multidimensionalidade com a interao social em comunidades de prtica e, por fim, sugerimos a incorporao de novas funcionalidades nos servios atuais que permitam a formao de comunidades de prtica e a classificao multidimensional de contedo. REFERNCIAS 1. AMES, M., AND NAAMAN, M. Why we tag: motivations for annotation in mobile and online media. Proceedings of the SIGCHI conference on Human factors in computing systems (2007), 971980. 2. BEGELMAN, G., KELLER, P., AND SMADJA, F. Automated Tag Clustering: Improving search and exploration in the tag space. Collaborative Web Tagging Workshop at WWW2006, Edinburgh, Scotland (2006). 3. BERNERS-LEE, T., HENDLER, J ., AND LASSILA, O. The semantic Web. Scientific American 284, 5 (2001), 28 37. 4. BOWKER, G., AND STAR, S. Sorting Things Out: Classification and Its Consequences. MIT Press, 1999. 5. DOURISH, P. What we talk about when we talk about context. Personal and Ubiquitous Computing 8, 1 (2004), 1930. 6. GOLDER, S. A., AND HUBERMAN, B. A. Usage patterns of collaborative tagging systems. J. Inf. Sci. 32, 2 (2006), 198208. 7. GRANOVETTER, M. The Strength of Weak Ties. American Journal of Sociology 78, 6 (1973), 1360. 8. GRUBER, T. Toward principles for the design of ontologies used for knowledge sharing. International Journal of Human-Computer Studies 43, 5/6 (1995), 907 928. 9. HEPP, M. Possible Ontologies-How Reality Constrains the Development of Relevant Ontologies. IEEE INTERNET COMPUTING (2007), 9096. 10. HUTCHINS, E. Cognition in the Wild. Bradford Books, 1995. 11. LASSILA, O., SWICK, R., ET AL. Resource Description Framework (RDF) Model and Syntax Specification. W3C Recommendation 22 (1999), 200403. 12. LAVE, J . Cognition in Practice: Mind, Mathematics and Culture in Everyday Life. Cambridge University Press, 1988. 13. SCHMITZ, P. Inducing ontology from flickr tags. Collaborative Web Tagging Workshop at WWW2006, Edinburgh, Scotland, May (2006). 14. SMITH, M., WELTY, C., AND MCGUINNESS, D. OWL Web Ontology Language Guide. W3C Recommendation 10 (2004). 15. STAR, S. Power, Technologies and the Phenomenology of Standards: On Being Allergic to Onions. J, Law, ed. A Sociology of Monsters (1991), 2757. 16. STAR, S. The trojan door: Organizations, work, and the open black Box. Systemic Practice and Action Research 5, 4 (1992), 395410. 17. STAR, S., AND GRIESEMER, J . Institutional Ecology,Translations' and Boundary Objects: Amateurs and Professionals in Berkeley's Museum of Vertebrate Zoology, 1907-39. Social Studies of Science 19, 3 (1989), 387. 18. WAL, T. V. Folksonomy :: vanderwal.net. Disponvel online: http://www.vanderwal.net/folksonomy.html. ltimo acesso: 26/06/2008. 19. WENGER, E. Communities of Practice: Learning, Meaning, and Identity. Cambridge University Press, 1999. 20. WU, X., ZHANG, L., AND YU, Y. Exploring social annotations for the semantic web. Proceedings of the 15th international conference on World Wide Web (2006), 417 426.