Você está na página 1de 4

INFERNCIA DE CONFIANA EM REDES SOCIAIS WEB

D. O. RODRIGUES1; E. M. SILVA2 Acadmico do Curso de Sistemas de Informao. Bolsista no Programa de Iniciao Cientfica do CEULP/ULBRA, E-mail: diegopso2@gmail.com 2 Mestre em Cincia da Computao e Professor adjunto do Centro Universitrio Luterano de Palmas, E-mail: dedemilhomem@gmail.com XI Jornada de Iniciao Cientfica do CEULP/ULBRA RESUMO: Os mecanismos de colaborao existentes na web tm causado um aumento no volume de informao disponvel na rede mundial. Esse volume de informao, fundamental para o desenvolvimento do conhecimento sobre os mais diversos temas, traz consigo problemas, como a disseminao de informaes no confiveis na web. Neste contexto, so levantados questionamentos sobre como identificar a confiabilidade de uma informao e sua autoria. Uma forma de responder a este questionamento a partir da utilizao de anlise de confiana. Anlise de confiana uma rea em evidncia na literatura, principalmente no que tange identificao de confiana dos usurios em redes sociais web, pois estes so ambientes que fornecem vrios elementos fundamentais para a anlise de confiana. Neste sentido, este trabalho tem como objetivo propor um algoritmo de anlise de confiana em redes sociais web. PALAVRAS CHAVE: CONFIANA; REPUTAO; REDES SOCIAIS WEB. INTRODUO: Nos ltimos anos a Web sofreu grandes expanses principalmente no que tange ao volume de informao disponvel aos usurios. Esse volume de informao tem originado alguns problemas como o information overload excesso de informaes que dificulta a tomada de decises (TOFFLER, 1970). Como alternativa para minimizar este problema, surge rea de recuperao inteligente da informao, que busca maneiras eficientes de recuperar as informaes que os usurios necessitam (BRUSILOVSKY, 2001), (BAEZA-YATES e RIBEIRO-NETO, 1999). Uma vez que estas informaes so recuperadas, fundamental identificar a confiabilidade da origem dessas informaes de acordo com a autoria. Para isso, podem ser utilizadas tcnicas que possibilitam a anlise de confiana. A rede social de uma pessoa, atravs dos seus relacionamentos, oferece importantes elementos que auxiliam no processo de identificao de confiabilidade de uma pessoa. O conceito de rede social foi introduzido no ambiente virtual atravs das Redes Sociais Web, que, segundo Golbeck (2005) so comunidades online que possuem quatro caractersticas: esto acessveis na web a partir de um navegador web; permitem a descrio dos relacionamentos entre os usurios; possuem um sistema claro e integrado para que os usurios criem seus relacionamentos; apresentam os relacionamentos de forma navegvel. De acordo com Golbeck (2005, p. 1, nossa traduo) A proliferao das redes sociais web tem levado a muitas inovaes, uma destas inovaes a possibilidade que os usurios tm de descreverem seus relacionamentos. Esta possibilidade de descrio de relacionamentos pode ser realizada de diferentes maneiras, tais como, identificao explcita do relacionamento (e. g. amigo ou namorado) ou atribuio de valores que caracterizam a relao entre dois usurios (e. g. popularidade, inteligncia, ou confiana). A descrio explcita desses relacionamentos oferece parmetros primordiais para inferir o grau de confiana de um usurio. Neste sentido, existem na literatura algoritmos especficos que tratam esta inferncia de confiana em redes sociais web. Um dos principais algoritmos disponveis na literatura o TidalTrust (GOLBECK, 2005), j que este ofereceu sustentao para o desenvolvimento de vrios outros algoritmos com maior qualidade. Este algoritmo calcula o valor da probabilidade de haver confiana entre dois usurios, utilizando da informao de confiana atribuda pelos usurios a seus relacionamentos. importante ressaltar que existem algoritmos que consideram noes discretas de confiana entre usurios, por exemplo, valores no numricos, assim como o algoritmo FuzzyTrust desenvolvido por Lessani e Bagheri (2006), que considera os seguintes valores: Low, Medium Low, Medium, Medium High, High, uma vez que, segundo os autores, so muito mais naturais para os usurios do que valores numricos. Tanto o TidalTrust quanto o FuzzyTrust, perdem valiosas informaes no processo de inferncia de confiana, pois deixam de considerar alguns elementos. Por exemplo, o TidalTrust considera apenas o menor caminho de um usurio A em relao a um usurio B na inferncia de confiana enquanto que o FuzzyTrust considera, alm do menor caminho, apenas valores discretos de confiana. Diante destas limitaes, o algoritmo RN-Trust desenvolvido por Taherian, et. al. (2008) baseia-se em conceitos de resistividade eltrica para realizar os clculos de confiana. Esta caracterstica garante ao algoritmo um desempenho que possibilita a anlise de uma maior quantidade de dados em uma menor quantidade de tempo, j que tem complexidade de tempo polinomial (TAHERIAN, AMINI
1

e JALILI, 2008). Existem ainda vrios outros algoritmos com diferentes metodologias de anlise de confiana que sero omitidos por causa do carter resumido deste trabalho. O presente trabalho tem como propsito o desenvolvimento de um algoritmo de anlise de confiana. Para o desenvolvimento deste algoritmo, foi necessrio um estudo aprofundado na literatura a fim de selecionar o melhor conjunto de elementos considerados pelos diferentes algoritmos existentes na literatura para tornar os resultados de inferncias de confiana mais precisos. O trabalho est organizado da seguinte forma: Material e Mtodos, evidencia os mtodos empregados na concepo e desenvolvimento do algoritmo; Resultados e Discusso, apresenta os elementos selecionados e a maneira como so considerados no algoritmo; e, por fim, so as Concluses e as referncias bibliogrficas. MATERIAL E MTODOS: Foi realizado um levantamento bibliogrfico sobre anlise de confiana em redes sociais web. Este levantamento permitiu a seleo dos documentos, artigos, teses, monografias, dentre outros, que serviriam de base para o referencial terico. O referencial terico possibilitou a avaliao de diversos algoritmos de anlise de confiana, que consideram diferentes elementos em seus mecanismos. Com o estudo destes algoritmos foram obtidas condies de definir os elementos que poderiam melhorar o desempenho da anlise de confiana no que tange a preciso dos resultados. Alm disso, o estudo foi essencial para definio de novos elementos que fornecero subsdios para obteno de melhores resultados. Uma vez que os elementos foram definidos, foi possvel definir um algoritmo de anlise de confiana que apresentado neste trabalho. Para possibilitar o funcionamento do algoritmo necessrio um ambiente adequado. Este ambiente deve possuir a estrutura de uma rede social web, onde as pessoas possuem relacionamentos umas com as outras, o que possibilita a iterao natural entre elas. A maneira de iterao entre as pessoas disponvel neste ambiente deve originar algumas informaes bsicas que sustentem a anlise de confiana - o ambiente deve possuir funcionalidades especficas que propiciem o surgimento destas informaes. Algumas destas funcionalidades so: permitir que os usurios se relacionem na rede social e atribuam valores de confiana a estes relacionamentos; permitir que os usurios disponibilizem contedos na rede social e avaliem contedos disponibilizados por outros usurios; permitir que os usurios enviem feedbacks quanto a possveis ajudas prestadas a eles por outros usurios. Durante o desenvolvimento do algoritmo foi necessria a realizao de testes para a avaliao dos mecanismos de anlise de confiana. Para execuo destes testes foi criado um prottipo de rede social que disponibilizava todas as informaes necessrias para o funcionamento do algoritmo. Em seguida, este prottipo foi alimentado com dados aleatrios para oferecer sustentao aos testes de anlise de confiana. Foram gerados os seguintes dados: 260 usurios; 5750 relacionamentos; 5000 Documentos; 24786 Avaliaes aos documentos, e 2493 feedbacks de usurios sobre ajudas recebidas. RESULTADOS E DISCUSSES: Utilizando as informaes disponibilizadas na rede social, como avaliaes, relacionamentos e contedos, possvel tirar-se concluses a respeito da confiabilidade dos usurios. Para realizar essa anlise de confiana foi criado um ambiente virtual que simula uma rede social. Neste ambiente foram inseridos vrios dados aleatrios que possibilitam a realizao dos clculos pelo algoritmo, que apresentado neste trabalho. Com o propsito de desenvolver um algoritmo de anlise de confiana eficiente foi realizado um amplo estudo sobre quais elementos devem ser considerados para que resultados satisfatrios possam ser obtidos. Para determinar estes elementos foram avaliados outros algoritmos, de mesmo objetivo, existentes na literatura: TidalTrust (GOLBECK, 2005); FuzzyTrust (LESSANI e BAGHERI, 2006); RN-Trust (TAHERIAN, AMINI e JALILI, 2008); etc. Alm de selecionar os elementos a serem considerados, este estudo inicial foi premissa fundamental para oferecer sustentao definio de novos elementos, ainda no considerados na literatura, que podem acrescentar informaes relevantes a anlise de confiana. Ao finalizar a fase de estudos foram estabelecidos quatro elementos a serem considerados para a anlise de confiana: Trust (confiana); Reputao; Correlao de opinies de usurios; Contribuies de usurios. Trust segundo Golbeck (2005, p.1, nossa traduo) uma varivel que informa o quanto uma pessoa em uma rede social deve confiar em outra a qual ela no est relacionada. Os relacionamentos de uma rede social, por si s, tm a natureza de um grafo onde os usurios so os ns e os relacionamentos so arestas. Neste grafo, os usurios so relacionados de forma direta ou indireta. No relacionamento direto, os usurios possuem arestas que os conectam no grafo. J o relacionamento indireto, so os possveis caminhos no grafo que relacionam usurios que no possuem relaes diretas. Utilizando estes relacionamentos e a atribuio direta de confiana de um usurio em relao a outro, Golbeck (2005) desenvolveu um algoritmo para inferir o grau de confiana entre os usurios que esto relacionados de forma indireta. Golbeck assume que estes

valores atribudos pelos usurios representam a probabilidade de que um usurio A confie em um usurio B. Porm, quando usurios no possuem relaes diretas na rede social ainda possvel inferir a probabilidade de confiana entre eles admitindo que essa falta de informao possa ser suprida com as informaes contidas nos relacionamentos indiretos da rede social. Neste contexto, se existe um grafo simples do tipo: A-B-C, ento a probabilidade de A confiar em C dada pela probabilidade de B confiar em C dado que A confia em B. A aplicao do conceito de transitividade no possui restries quanto a quantidade de relacionamentos. Reputao segundo Taherian, et. al. (2008, p. 233, nossa traduo) uma variavel que informa um valor universal de confiana para cada usurio da rede social.Este valor universal permite uma viso geral sobre o grau de confiana que um usurio possui em relao a rede social como um todo, ou em parte. O valor de reputao de um usurio independe da forma que ele consultado e da maneira pela qual ir ser utilizado, o que caracteriza sua universalidade. Para o desenvolvimento deste trabalho, foram considerados os relacionamentos diretos dos usurios para a inferncia do nvel de reputao de um usurio. O clculo da reputao pode ser relizado de diferentes formas, por exemplo, podem ser considerados todos os usurios de uma rede social, assim como apresentado por (TAHERIAN, AMINI e JALILI, 2008). Correlao de Opinies, este elemento considera o conjunto de opinies dos usrios sobre determinados contedos. Assim, possvel verificar o quo as opinies dos usurios so semelhantes. Esta anlise de semalhana importante, pois as pessoas tem uma tendncia natural a confiar em outras que possuem opinies similares. Por exemplo, quando uma pessoa procura um filme para assistir, natural que esta pessoa seja influenciada por outras pessoas que possuam interesses similares. Para verificar o quo semalhantes so as opinies dos usurios, so utilizadas as avaliaes dos usurios nos contedos e aplicadas ao fator de correlao de Pearson fator utilizado para calcular o grau de relao entre dois conjuntos de variaveis. Contribuies dos usurios, este elemento contabiliza e normaliza as contribuies dos usurios nas rede sociais. Essas contribuies so os conteudos disponibilizados pelos usurios e as ajudas prestadas por eles. Com informaes a respeito das contribuies dos usurios possivel prever a predisposio deste usurio a colaborar com outros membros da rede. Usurios com uma maior predisposio colaborao so melhores para serem recomendados. Estes usurios so melhoresa ser recomendados, pois so maiores as chances deste usurio colaborarem com outros. A Figura 1 retrata -a maneira como so anlisados os elementos no algoritmo SUPRACITADOS.

Figura 1 - Representao geral do algoritmo de anlise de confiana em redes sociais

A parte A da Figura 1 ilustra a inferncia de confiana entre usurios que no possuem conexes diretas na rede social. Na parte B representada a anlise da reputao de an, onde so avaliados todos os seus relacionamentos para chegar-se ao valor de reputao. A parte C mostra a correlao de opinies entre os usurios, onde so consultadas todas as notas atribudas por eles a documentos em comum, isto , que os dois avaliaram. A parte D retrata o calculo da probabilidade de cooperao entre os usurios, com base nas contribuies anteriores de an. Os quatro elementos considerados pelo algoritmo foram selecionados de modo a, manter algumas caracteristicas desejveis dos outros algoritmos de anlise de confiana estudados e suprir algumas necessidades encontradas nestes algoritmos. Mas, para o funcionamento do algoritmo no suficiente a definio dos elementos a serem considerados, tambm necessrio estabelecer amaneira como estes elementos so aplicados na anlise de confiana. A Figura 2 representa a maneira como os quatro elementos so aplicados no algoritmo objeto deste trabalho.

Figura 2 - Representao Bayesiana do problema de anlise de confiana em redes sociais abordada por este trabalho.

Foi adotado o conceito de rede bayesiana no desenvolvimento da Figura 2, pois se trata de um modelo probabilistico que pode ser representado como um grafo direcionado. A partir do grafo represtnado na Figura 2 possivel estabelecer uma melhor compreenso da maneira como os elementos se influenciam mutuamente e influenciam o processo de anlise de confiana. Essa compreenso acontece, pois redes bayesianas so modelos grficos que representam de forma simples as relaes de causalidade das variaveis de um sistema (MARQUES e DUTRA, 2003, p. 7). De acordo com o modelo grfico, os trs elementos: Trust, Reputao e Correlao de opinies influenciam a probabilidade de um usurio A confiar em outro B - Conf(a,b). Para recomendaes de usurios, a fim de melhorar os resultados, feita uma anlise da probabilidade de um usurio B cooperar com outro A Help(b,a). Para analisar esta probabilidade de cooperao so levados em considerao a inferncia de confiana entre os usurios e as contribuies do usurio B. Alm de contribuir com o modelo grfico, as redes bayesianas podem contribuir neste trabablho com a obteno de informaes probabilisticas em situaes onde no se possui total conhecimento das informaes dos elementos a serem analisados. Mesmo em um ambiente que contenha as funcionalidades para que os usurios disponibilizem estas informaes, no garante que os usurios as disponibilizem. Por exemplo, podem haver situaes onde os usurios no informaram os valores diretos de confiana, ou ainda, podem haver situaes onde no existam caminhos, diretos ou indiretos, que relacionem os usuarios na rede social. Neste contexto de falta de informaes, pode-se treinar uma rede bayesiana para que esta realize anlises probabilisticas a respeito da confiabilidade dos usurios. Estas anlises probabilisticas forneem subsidios para inferir o grau de confiabilidade dos usurios mesmo em casos onde no estejam acessiveis todas as informaes necessria para inferncia de confirna. CONCLUSES: Este trabalho evidenciou a necessidade da anlise de confiana em ambientes colaborativos. Alm disso, foi proposto um modelo para execuo desta analise em redes sociais web. O estudo dos conceitos pertinentes anlise de confiana foi essencial para o entendimento de quais poderiam ser os melhores elementos a serem considerados para a anlise de confiana. Aps a definio destes elementos foi possvel criar um modelo de representao que identifique as influencias de cada elemento em relao aos outros, o que influencia diretamente os resultados. Um ponto que poderia ser observado em trabalhos futuros seria a possibilidade de utilizao da anlise de confiana em outros ambientes, como e-commerce, fruns de discusso, Wikis, dentre outros ambientes onde informaes a respeito da confiabilidade poderiam contribuir para melhorar as experincias dos usurios nos sistemas. REFERENCIAS BIBLIOGRFICAS: BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern Information Retrieval. New York: ACM Press, 1999. BRUSILOVSKY, P. Adaptative Hypermidia. User Modeling and User-Adapted Interaction, 2001. 87-110. GOLBECK, J. A. Computing and applying trust in web-based social networks. [S.l.]: [s.n.], 2005. LESSANI, M.; BAGHERI, S. Fuzzy trust inference in trust graphs and its aplication in semantic web social networks. World Automation Congress (WAC), Budapest, 24-26 Jul 2006. MARQUES, R. L.; DUTRA, I. Redes Bayesianas: o que so, para que servem, algoritmos e exemplos de aplicaes., Rio de Janeiro, 20 Jun 2003. 22. MARSH, S. P. Formalising Trust as a Computational Concept, 1994. TAHERIAN, M.; AMINI, M.; JALILI, R. Trust Inference in Web-Based Social Networks using Resistive Networks. The Third International Conference on Internet and Web Applications and Services, Washington, 2008. 233-238. TOFFLER, A. Future Shock. 8 Edio. ed. New York: Random House, Inc., 1970. Disponivel em: < http://pt.scribd.com/doc/7000483/Alvin-Toffler-Future-Shock. >. Acesso em: 20 Jul. 2011.