Escolar Documentos
Profissional Documentos
Cultura Documentos
Trabalho apresentado ao Programa de Graduao em Cincia da Computao do Centro de Informtica da Universidade Federal de Pernambuco como requisito parcial para obteno do grau de Bacharel em Cincia da Computao.
Orientador: Co-orientador:
iii
iv
Agradecimentos
Inicialmente, agradeo aos meus amados pais por todos os esforos feitos para que eu pudesse ter timas oportunidades e experincias. Ao meu pai, garoto do interior que estudou at a 4 srie e mostrou que no s de livros que se faz o homem, no posso deixar de agradecer pela dica de que a vida um livro aberto, porque por mais clich que seja, a vida foi seu maior livro. minha querida me eu agradeo a sua preocupao, dedicao e, principalmente, pacincia demonstradas incansavelmente durante todos os dias; e, acima de tudo, aos seus ensinamentos de como cuidar das pessoas. minha av eu tenho que agradecer pela sua compreenso em minha ausncia e por sempre ter acreditado no meu potencial sem pestanejar. todos os meus familiares, tios e primos, eu agradeo todo o apoio e vivncia. Aos meus professores e amigos do Mazzarello e do CPI agradeo pelos anos de participao na minha vida e por tudo que aprendi e vivi, porque estes anos influenciam na minha vida desde ento e os eu carrego com muito orgulho. Aos meus amigos de graduao e principalmente queles que vieram comigo do CPI e me fizeram sentir em casa desde o primeiro instante que pisei na Universidade, leia-se Carol Martiniano, Edilson Ferreira, Tiago Ferreira e Filipe Wanderley, agradeo por tornarem estes anos to divertidos, agradveis e proveitosos. No posso esquecer os momentos maravilhosos que passei com o grupo PET e todos os amigos que l fiz; nossos momentos foram muito estimulantes e tornaram a minha graduao mais brilhante. A todos que fazem o Centro de Informtica agradeo por todo o trabalho e preocupao em nos oferecer uma formao de tima qualidade. Ao meu amado companheiro, Tiago Ferreira, agradeo por sua adorvel companhia no s na graduao, mas na vida, pois ele soube me compreender e aconselhar como ningum. nova famlia que ganhei, Emanuel Soares, Ivanete Ferreira, Iraci Ferreira, Tasa Ferreira e Tcio Ferreira, e nossa fiel piadista Vilma Silva, no posso deixar de agradecer pelo apoio, ensinamentos e por todos os momentos felizes que partilhamos. Aos meus irmos de sonho, Tiago Ferreira, Andr Diniz, Guilherme Cavalcanti, Alex Gomes, Cassio Melo, Anderson Duarte e Srgio Fontes, agradeo por terem me mostrado uma nova graduao e por no me deixarem fraquejar ao me inspirar todos os dias. Agradeo tambm ao meu orientador, Tsang Ing, por ter aceitado este desafio comigo e ter me guiado durante este trabalho. Ao meu co-orientador, Alex Gomes, agradeo pelo mesmo e tambm pelo seu nimo inabalvel. s minha amigas Carol Martiniano, Las Sales e Las Rodrigues agradeo por terem me ajudado de algum modo neste trabalho, seja corrigindo ou me dando foras quando precisei.
vi
Por fim, agradeo a todos por entenderem a minha ausncia em alguns momentos e por terem participado destes anos de algum modo, o apoio de todos vocs inestimvel. Claramente, no posso esquecer dos msicos que no me deixaram na mo em nenhum momento.
vii
viii
Develop a passion for learning. If you do, you will never cease to grow. ANTHONY J. D'ANGELO
ix
Resumo
Os fenmenos sociais da disseminao da informao e formao de opinio so estudados h dcadas em diversas reas do conhecimento, porm suas teorias no puderam ser confirmadas devido a dificuldade de coleta das informaes necessrias, bem como da complexidade que envolve estes fenmenos. Este trabalho visa colaborar para o entendimento destes fenmenos sociais atravs da observao do comportamento geral dos indivduos em uma rede social de informaes. Para esta anlise, foram utilizadas tcnicas de Anlises de Redes Sociais alinhadas com teorias da comunicao. Os resultados obtidos mostram que observar outras variveis do comportamento, como a passividade dos usurios, so abordagens vlidas para a identificao de usurios influentes em um determinado tpico. Palavras-chave: redes de informao; difuso de informao; influncia; word of mouth marketing; SNA
xi
xii
Abstract
The social phenomena of information dissemination and opinion formation has been studied for decades in many areas of knowledge, nevertheless, its theories could not be confirmed due to the difficulty to collect the necessary information, as well as the complexity that those phenomena involve. This work aims to help with the understanding of those social phenomena by observing the general behavior of individuals in an information social network. For this analysis, techniques of Social Network Analysis aligned with communication theories were used. The obtained results show that observing other variables of behavior, like user passivity, is a valid approach to identify influentials in a determined topic. Keywords: information networks; information difusion; influence; word of mouth marketing; SNA
xiii
xiv
Sumrio
1 Introduo
1.1. Motivao 1.2. Objetivos 1.3. Estrutura do documento 2.1. Anlise de Redes Sociais 2.2. Influncia em redes sociais 2.3. Influncia no Twitter 2.3.1. Influncia em tpico especfico
2 2 3 4 5 6 7 8 8 9 9
4 Experimentos e Resultados
12
12 13 13 13 14 18 19 20 21 21
5 Concluso
21
Referncias Bibliogrficas
24
xv
xvi
Lista de Figuras
Figura 1 - Modelo de influncia two-step flow (Watts e Dodds 2007) .................................................................. 1 Figura 2 - Modelo de rede de influncia de Watts e Dodds (2007) .......................................................................... 1 Figura 3 - Crescimento da anlise de redes sociais (Otte e Rousseau 2002) ........................................................ 5
xvii
xviii
Lista de Tabelas
Tabela 1 - Legenda das cores utilizadas nas tabelas seguintes .............................................................................. 14 Tabela 2 - Usurios mais influentes pelo IP (base-97) ............................................................................................... 14 Tabela 3 - Usurios mais influentes pelo IP (base-50) ............................................................................................... 15 Tabela 4 - Usurios mais passivos pelo IP (base-97) .................................................................................................. 16 Tabela 5 - Usurios mais passivos pelo IP (base-50) .................................................................................................. 17 Tabela 6 - Usurios mais influentes pela quantidade de retweets (base-97) ................................................... 19 Tabela 7 - Usurios mais influentes pela quantidade de retweets (base-50) ................................................... 19
xix
CAPTULO 1
Introduo
Nas dcadas de 40 e 50, a teoria da formao de opinio obteve um grande avano atravs dos estudos de Katz, Lazarsfeld, Berelson e Gaudet (Katz e Lazarfeld, 1955; Lazarfeld, Berelson e Gaudet, 1968). Estas pesquisas formularam uma nova teoria ao tentar conciliar o papel da mdia como influenciadora e a crescente percepo de que as pessoas podem ser mais influenciadas umas pelas outras do que pela mdia. Katz e Lazarfeld (1955) criaram o modelo de comunicao two-step flow (Figura 1), no qual uma pequena minoria (chamada de lderes de opinio) exerce a posio de intermedirio entre a mdia e a grande maioria da sociedade (Watts e Dodds, 2007). Deste modo, a informao passada da mdia para os seguidores dos lderes de opinio atravs destes ltimos.
O modelo de influncia two-step flow ficou em evidncia nas literaturas de difuso de inovao, marketing, entre outros durante dcadas seguintes; de tal modo que Burt (1999) afirmou que o modelo, em traduo livre: "se tornou um guia na pesquisa de difuso e marketing". Em um segundo momento, Watts and Dodds (2007) criaram um modelo de influncia (Figura 2), no qual a influncia: (1) pode fluir tanto dos influentes para os seus seguidores como na via contrria; (2) pode propagar por vrios passos (atravs de vrios indivduos). Estas caractersticas diminuem o papel dos influentes da rede e colocam como os principais fatores da influncia: a relao interpessoal entre usurios comuns e a disposio da sociedade para adotar inovao (Cha et al., 2010). Ou seja, esta nova 1
abordagem destaca a cultura a frente dos influentes, pois segundo Domingos e Richardson (2001), devido ao grande compartilhamento de informao as pessoas se baseiam na opinio de seus prximos e no na dos influentes. O fenmeno da influncia na formao de opinio ainda possui vrias lacunas, pois a rede pela qual a influncia espalha-se, na maioria das vezes, no podem ser observadas (Cha et al., 2010; Bakshy et al., 2011). Porm, com a Era da Informao e o surgimento de redes sociais, a observao do processo de difuso de informao se tornou mais palpvel, porque estes ambientes virtuais so permeados de relacionamentos interpessoais reais. O Twitter (2011) entitula-se, em traduo livre: "uma rede de informao em tempo-real que conecta voc s ltimas informaes sobre o qu voc acha interessante". Este servio de micro-blogging associado uma rede social se mostra um ambiente promissor para a anlise de influncia (Bakshy, 2011), pois ele possibilita a disseminao de informao entre redes de contatos reais em um ambiente monitorvel.
1.1. Motivao
Online Word-of-mouth (OWOM) a transmisso online de informao de pessoa para pessoa (Jansen et al., 2009), em traduo livre: "boca-a-boca". Este processo utilizado como ttica de marketing pelas empresas com o objetivo de influenciar os consumidores. A sua efetividade se baseia no fato de que as pessoas confiam mais nos indivduos da sua rede social para opinies comerciais (Jansen et al., 2009). Portanto, OWOM utilizada pelas empresas para formao de opinio positiva com relao aos seus produtos e a sua marca, por exemplo. Segundo Milstein et al. (2010), o Twitter tambm pode ser encarado como uma plataforma de marketing. Isto tambm signifca que a estrutura do micro-blogging possibilita a constituio de uma rede de influncia, atravs das trocas de informaes, que resulta na formao de opinio. Ou seja, para ocorrer uma maior disseminao da inovao e aumento da eficincia de um campanha de marketing, interessante alcanar os usurios influentes da rede, pois isso causar o aumento os efeitos do OWOM, ao passo que estes usurios iro influenciar na opinio de outros indivduos e assim por diante (Kempe, Kleinberg e Tardos, 2005). Um melhor direcionamento da campanha pode ser feito ao visar usurios mais influentes em tpicos especficos, pois a identificao destes usurios pode melhorar as opinies coletadas (Weng et al., 2010).
1.2. Objetivos
Os objetivos principais deste trabalho de graduao so: (1) estudar as caractersticas da formao de opinio em um ambiente virtual, (2) identificar o comportamento dos usurios em uma rede de influncia, bem como quais so os usurios que iniciam a propagao da influncia sobre determinado tpico. Ser utilizada a rede de informao Twitter em conjunto com tcnicas de anlise de rede social para melhor compreender os fatores determinantes no fenmeno social complexo que a formao de opinio. Deste modo, os processos de marketing podero compreender melhor os fenmenos sociais e serem mais efetivos em suas aes. 2
CAPTULO 2
Neste captulo ser dada uma viso geral das pesquisas mais relevantes para este trabalho. Para melhor compreenso, sero apresentadas inicialmente as pesquisas relacionadas anlise de redes sociais; em seguida, aquelas relacionadas identificao de usurios influentes na rede; por fim, sero explanados os trabalhos referentes identificao de usurios influentes em tpicos especficos dentro da rede.
2010). Porm, com o aumento do uso das redes sociais, vrios estudos comearam a ser feitos com os dados destas redes, por exemplo: Sun el tal (2009) avaliou a difuso das fan pages do Facebook1, Bakshy et al. (2009) estudou o compartilhamento e adoo de contedo no Second Life (Rymaszewski, 2007) e Agarwal et al. (2008) descobriu que os blogueiros mais ativos no so consequentemente os mais influentes ao identificar os blogueiros mais influetes da blogosfera.
http://www.facebook.com/ http://www.twitter.com/ 6
atividade passada do usurio. Romero et al. (2010) tambm se utilizou de URLs para fazer um estudo da influncia dos usurios do Twitter, porm este tambm levou em conta a passividade dos outros usurios para definir quo influente um usurio . Em suma, um usurio to influente quanto mais usurios passivos ele conseguir tirar da inrcia. Esta pesquisa, assim como Cha et al. (2010), teve a pouca relao entre popularidade e influncia evidenciada. 2.3.1. Influncia em tpico especfico Algumas pesquisas foram feitas com o objetivo de identificar quais usurios so mais influentes em tpicos determinados e no de um modo geral. Weng et al. (2010) identificou os usurios mais influentes utilizando similaridade em tpicos de interesse entre os usurios e a estrutura social da rede. Isto foi feito ao adicionar a similaridade de tpicos ao PageRank (Page et al., 1999). Este trabalho fez a identificao dos tpicos de interesse dos usurios atravs da anlise de contedo dos tweets e defendeu que as medidas de retweet, reply e mention no levam em conta a estrutura global da rede entre os usurios. Um trabalho similar foi feito por Haveliwala (2003), porm este trabalho propaga a influncia de um usurio em um nico tpico para todos os usurios que o seguem em vrios tpicos com probabilidades diferentes, enquanto que Weng et al. (2010) aplica probabilidades de transies diferentes para tpicos diferentes. Com esta abordagem, Weng et al. (2010) mostrou capturar a influncia em um tpico especfico melhor do que a outra pesquisa. Romero et al. (2010) utilizou a passividade de outros usurios para calcular a influncia de um indivduo na rede. Para isso, ele se utilizou de retweets para verificar o fluxo de URLs citadas nos tweets criados. Nesta pesquisa tambm foi verificada a pouca relao entre popularidade e influncia. Apesar de no ter apresentado um experimento a respeito, Romero et al. (2010) afirmou que se o algoritmo apresentado for aplicado a um grafo que possui tweets que tratam de um tpico em especfico, os usurios mais influentes neste tpico sero determinados. A pesquisa tambm deixa em aberto se o algoritmo ser igualmente preciso em grafos, restritos a um tpico, de diferentes escalas.
CAPTULO 3
Este trabalho prope a utilizao do algoritmo Influence-Passivity (IP) (Romero et al., 2010) para a identificao dos usurios mais influentes na rede social em relao a um certo tpico ou assunto. Visto que o fenmeno da formao de opinio bastante complexo, neste captulo sero comentados alguns aspectos da transmisso de informao e quais deles sero levados em conta para a identificao dos usurios mais influentes. Por fim, ser explicada a dinmica do algoritmo IP.
Este algoritmo associa para cada usurio um grau de influncia e passividade, os quais so encontrados ao levar em conta as propriedades estruturais da rede, como tambm o comportamento de difuso de informao entre os usurios. 3.2.1. Grafo de entrada O grafo de entrada , onde so os ns, so os arcos e os pesos. Os ns so os usurios da rede social a ser analisada, j os arcos representam a taxa de influncia que um usurio exerce sobre o outro, em relao influncia total que o primeiro tentou exercer sobre o segundo. De modo mais prtico, o arco representa a taxa de mensagens de que repassou para a sua rede em relao a quantidade total de mensagens que publicou e chegou . Portanto, o peso do arco pode ser visto da seguinte forma: .
3.2.2. Premissas, mtricas e funcionamento Como dito anteriormente, a influncia de um indivduo depende da quantidade de pessoas que ela influencia e quo passivas so estas pessoas. J a passividade, depende de quo influentes so as pessoas que tentam influenciar um indivduo, mas no conseguem. O fato de uma pessoa aceitar ou no a influncia de outra, denominada taxa de aceitao e taxa de rejeio, respectivamente. Estas taxas so definidas e obtidas das seguites formas: A taxa de aceitao indica quanta considerao ou lealdade um usurio tem pelo outro, ou seja, quanta ateno um indivduo d ao outro em relao a ateno que ele despende com todos os outros. Deste modo, cada arco possui uma taxa de aceitao (ver Equao 1), a qual indica o quanto de influncia aceitou de normalizado pelo total de influncia que aceitou de todos os outros usurios; A taxa de rejeio indica quanta rejeio um usurio tem pelo outro, ou seja, quo rejeitado um membro foi por outro em relao a rejeio deste outro para com os demais indivduos. Neste caso, cada arco possui uma taxa de rejeio (ver Equao 2), a qual indica quanta influncia rejeitou de normalizado pelo total de influncia que rejeitou dos demais usurios.
Equao 2 - Clculo da taxa de rejeio
O clculo do grau de influncia e passividade de cada membro so calculados simultaneamente, visto que um depende do outro. Para efetuar este clculo, o algoritmo IP recebe um grafo no formato especificado na seo 3.2.1. Em seguida, como pode ser visto no Algoritmo 1, sero gerados valores de influncia e passividade para cada usurios, pois a quantidade de iteraes do algoritmo. Inicialmente, todos os usurios possuem valor 1 para as duas pontuaes . Em conseguinte, para cada iterao, sero calculados os valores de passividade para todos os usurios baseados nos valores de influncia calculados na iterao anterior (linha 4). Ento, na linha seguinte, os valores de influncia so calculados baseados no valores de passividade obtidos na linha anterior (Equao 3). Aps estes clculos, feita a normalizao da influncia e passividade de cada usurio em relao ao total de influncia/passividade de todos os outros. Ao final de todas as iteraes, os valores obtidos na ltima iterao so as estimativas de influncia e passividade para cada usurio .
1 2 3 4 5 6 7 8 9
10 fim fim retorne
; ;
11
Os clculos para obter os valores de influncia usurio podem ser vistos a seguir:
e passividade
para cada
10
Fica claro, portanto, a dependncia existente entre as duas medidas. Visto que a influncia de um indivduo depende da passividade e da taxa de aceitao dos demais indivduos, enquanto que a passividade do mesmo depende da influncia e taxa de rejeio de todos os outros.
11
CAPTULO 4
Experimentos e Resultados
Neste captulo, sero explicados os detalhes relativos execuo dos experimentos e apresentados os resultados obtidos. Inicialmente, a rede de informaes Twitter ser apresentada, visto que ela foi utilizada como objeto de estudo. Em seguida, ser explicado como a base foi obtida e quais so as suas caractersticas. Ento, os detalhes da implementao do algoritmo IP e os resultados obtidos com a sua aplicao sero mostrados. Por final, os resultados baseados na segunda abordagem (quantidade de repasses da mensagem) sero vistos.
12
1 2
mais rpido, pois no era mais necessrio recalcular vrias vezes as taxas citadas anteriormente para experimentar diferentes nmeros de iteraes. 4.3.2. Resultados Obtidos Os resultados sero apresentados e cada linha possuir uma colorao caracterstica para indicar a coincidncia ou no entre duas listas (sempre em relao s listas do mesmo aspecto de transmisso, por exemplo, influncia da base-97 com influncia da base-50). Isto foi feito para facilitar visualmente, a comparao entre listas. O significado de cada cor est representado na Tabela 1.
Tabela 1 - Legenda das cores utilizadas nas tabelas seguintes
Usurio coincidiu a posio nas duas listas Usurio presente nas duas listas, mas no na mesma posio Usurio ausente na outra lista Usurio removido devido a reduo da base A aplicao do algoritmo IP na base-97 gerou um valor de influncia e outro de passividade para cada usurio. Na Tabela 2, podem ser vistas as 10 posies dos considerados mais influentes no tema Startup, bem como uma breve descrio de cada.
Tabela 2 - Usurios mais influentes pelo IP (base-97)
Posio 1 2 3 4
Sobre Mdia voltada para tecnologia Evento mundial de Startups Evento de Startups no Mxico Organizadora de eventos voltados para Startups Empreendedor Blog focado em tecnologia da internet e Startups Estrategista de mdias sociais Plataforma de Crowdfunding para Stratups Evento de Startups na Romania Escritor, investidor anjo, empreendedor muito respeitado Envolvido com muitos projetos que lidam com Startups Criador de vrias Startups e mentor Startup tentando ganhar o Breakout Startup of the Year (spammer) 14
5 6 7 8 9
Algum tentando vender um domnio. (spammer) Blog referncia em inovao, marketing e comunicao Empreendedor Evento de Startups na Austrlia Empreendedor, jornalista e blogueiro. Empreendedor e blogueiro (http://onstartups.com) Startup Italiana Empreendedor Empreendedor
Como pode ser observado, as pessoas que esto entre as 10 posies esto engajadas nos movimentos de Startups de algum modo, seja por ter uma, apoiar o movimento ou ser um empresrio de sucesso. Por exemplo, o TechCrunch1, o primeiro colocado um meio de comunicao muito respeitado e abertamente dedicado a coleta de informaes sobre Startups, em sua pgina existe uma seo dedicada ao tema. O segundo e terceiro colocados so de organizaes de eventos de Startups, o Startup Weekend2. Os outros tambm possuem relao com o tema, como robin_ahn e bmull que so pessoas envolvidas no cenrio das startups e growvc, o qual um fundo para estes tipos de negcio. Em um segundo momento, o algoritmo IP foi aplicado na base-50, a lista das 10 posies dos mais influentes pode ser vista na Tabela 3.
Tabela 3 - Usurios mais influentes pelo IP (base-50)
Posio 1 2 3 4 5 6 7
Usurio techcrunch startupweekend sw_mexico growvc swvampire robin_ahn cmyworldnow bmull hightechexec
1 2
8 9 10
Nota-se que as trs primeiras posies coincidiram nas duas listas, mesmo com a reduo do conjunto. Alm disso, apenas a partir da 7 posio foi que os usurios indicados como influentes no estavam entre as 10 posies da lista gerada pelo IP aplicado base-97. A lista de passividade obtida com a base-97 pode ser vista na Tabela 4 com uma pequena descrio para cada usurio. Como pode ser observado, boa parte dos usurios representam servios voltados para startups, como coworking, marketing e programas de empreendimento. Alguns so indivduos pouco envolvidos com o assunto que apenas repassaram uma ou outra mensagem dos usurios influentes. Tambm pode ser visto que a base possui diversos usurios com a passividade muito alta, tanto que nas 10 primeiras posies esto 34 usurios. Isto provavelmente se deu devido ao curto tempo de coleta (12h).
Tabela 4 - Usurios mais passivos pelo IP (base-97)
Posio 1 2
Usurio galenmoore allthingsleads greenspacesny fritsalma theyec to2 phisab officedivvy 3dsxparis deskaway michaelmorett socialadopter entrecenter hellopirates jasonhjh 16
spbattle 3 4 5 6 7 8 9 10 tizianapollio arepavalley anca-undscr-foster aaronkwhite carlaweishale socialleslie swsanjose jonrrossi the-undscr-new-undscr-harley darionocerino pminordest 1rogerwoodward cassandrasangel scarylalla aboutourwork sageeb mickybarisciano Ao aplicar o algoritmo IP a base-50, a lista de passividade gerada est contida na tabela 5. Alguns usurios como anca_foster, arepavalley, jonrrossi, cassandrasangel e 1rogerwoodward mantiveram suas posies com relao lista gerada com a base-97. Outros 11 esto em ambas as listas e 12 apareceram na nova lista, mas no na lista da base-97. Porm, provavelmente, isso ocorreu, pois a reduo do conjunto foi feita ao remover os usurios menos ativos da base. Portanto, os mais passivos foram excludos da base, isso pode ser visto porque da lista gerada na base-97, 18 usurios que estavam nas 10 primeiras posies dos mais passivos foram removidos aps a reduo para 50 usurios (base-50) (elementos em vermelho na Tabela 5). Portanto, novos usurios passaram a fazer parte da lista dos mais passivos da base-50 no lugar dos que foram excludos.
Tabela 5 - Usurios mais passivos pelo IP (base-50)
Posio 1
3dsxparis vc4africa swinindia guykawasaki officedivvy techberlin aboutourwork rollpokercom nicklongo buildmaster allthingsleads trikro pminordest fritsalma 2 3 4 5 6 7 8 9 10 galenmoore twilli2861 anca-undscr-foster arepavalley contextio socialleslie gweber aaronkwhite jonrrossi cassandrasangel 1rogerwoodward
18
bases: base-97 e base-50, para fazer um comparativo com os resultados obtidos pelo algoritmo IP. 4.4.1. Resultados Obtidos Devido a vrios usurios terem a mesma quantidade de retweets, no foi possvel gerar uma lista com 10 posies, visto que vrios usurios ficariam na mesma posio. Deste modo os usurios mais influentes da base-97 podem ser vistos na Tabela 6.
Tabela 6 - Usurios mais influentes pela quantidade de retweets (base-97)
Posio 1 2 3 4
# retweets 10 6 6 4 3
Pode-se observar que os usurios indicados como mais influentes so eventos relacionados a Startups (sw_mexico1 e startupweekend) e um meio de comunicao muito respeitado (techcrunch). Isso se d por serem usurios populares, ou seja, por possurem uma grande audincia, porm no levada em conta a qualidade desta audincia. Tambm so indicados como usurios influentes duas pessoas (hightechexec e snowinri), as quais so um empreendedor e um strategista de marketing, respectivamente. A aplicao da mtrica de retweets na base reduzida (base-50) no se mostrou muito diferente e insto bastante intuitivo, visto que foram removidos os usurios que possuam poucos tweets e retweets. Apenas o usurio snowinri foi removido da lista de usurios mais influentes (Tabela 7), isso se deu porque a base de dados pequena (snowinri possua apenas 2 retweets).
Tabela 7 - Usurios mais influentes pela quantidade de retweets (base-50)
Posio 1 2 3
# retweets 9 6 6 2 2
http://www.startupweekenddf.com/ 19
sw_denver twilli2861
2 2
No foi gerada uma lista dos usurios mais passivos, visto que a tcnica de utilizar a quantidade de retweets no possibilita esta anlise.
20
CAPTULO 5
Concluso
de grande importncia o entendimento da formao de opinio em ambientes virtuais, pois estes so reflexos da sociedade real. Portanto, este entendimento ajudar teorias que h dcadas no puderam ser efetivamente comprovadas devido a dificuldade de se monitorar o fennemo. Este trabalho verificou a eficincia do algoritmo IP, proposto por Romero et al. (2010) na identificao dos usurios mais influentes e mais passivos de um grafo que s possui infomaes relacionadas um dado tpico (Startups). Tambm foi feita uma classificao baseada na mtrica de retweets, a qual se mostrou menos efetiva e corroborou com as concluses de Romero et al. (2010) em sua pesquisa.
21
portncia aplicar este modelo de anlise, baseado na passividade dos usurios, em outras redes sociais como Facebook e LinkedIn1.
http://www.linkedin.com/ 22
23
Referncias Bibliogrficas
AGARWAL, N.; LIU, H.; TANG, L.; YU, P. S. Identifying the influential bloggers in a community. Proceedings of the international conference on Web search and web data mining. Anais..., WSDM 08. New York, NY, USA: ACM. Disponvel em: <http://doi.acm.org/10.1145/1341531.1341559>. Acesso em: 22 nov. 2011. , 2008 ARAL, S.; MUCHNIK, L.; SUNDARARAJAN, A. Distinguishing influence-based contagion from homophily-driven diffusion in dynamic networks. Proceedings of the National Academy of Sciences, v. 106, n. 51, p. 21544 -21549, 22 dez 2009. ASUR, S.; HUBERMAN, B. A.; SZABO, G.; WANG, C. Trends in Social Media: Persistence and Decay. arXiv:1102.1402, 7 fev 2011. BAKSHY, E.; HOFMAN, J. M.; MASON, W. A.; WATTS, D. J. Everyones an influencer: quantifying influence on twitter. Proceedings of the fourth ACM international conference on Web search and data mining. Anais..., WSDM 11. New York, NY, USA: ACM. Disponvel em: <http://doi.acm.org/10.1145/1935826.1935845>. Acesso em: 19 nov. 2011. , 2011 BAKSHY, E.; KARRER, B.; ADAMIC, L. A. Social influence and the diffusion of user-created content. Proceedings of the 10th ACM conference on Electronic commerce. Anais..., EC 09. New York, NY, USA: ACM. Disponvel em: <http://doi.acm.org/10.1145/1566374.1566421>. Acesso em: 22 nov. 2011. , 2009 BURT, R. S. The Social Capital of Opinion Leaders. Annals of the American Academy of Political and Social Science, v. 566, p. 37-54, 1 nov 1999. CHA, M.; HADDADI, H.; BENEVENUTO, F.; GUMMADI, K. P. Measuring user influence in Twitter: The million follower fallacy. IN ICWSM 10: PROCEEDINGS OF INTERNATIONAL AAAI CONFERENCE ON WEBLOGS AND SOCIAL, 2010. DOMINGOS, P.; RICHARDSON, M. Mining the network value of customers. Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining. Anais..., KDD 01. New York, NY, USA: ACM. Disponvel em: <http://doi.acm.org/10.1145/502512.502525>. Acesso em: 22 nov. 2011. , 2001 GALUBA, W.; ABERER, K.; CHAKRABORTY, D.; DESPOTOVIC, Z.; KELLERER, W. Outtweeting the twitterers - predicting information cascades in microblogs. Proceedings of the 3rd conference on Online social networks. Anais..., WOSN10. Berkeley, CA, USA: USENIX Association. Disponvel em: <http://dl.acm.org/citation.cfm?id=1863190.1863193>. Acesso em: 23 nov. 2011. , 2010
24
HAVELIWALA, T. H. Topic-sensitive PageRank: a context-sensitive ranking algorithm for Web search. IEEE Transactions on Knowledge and Data Engineering, v. 15, n. 4, p. 784- 796, ago 2003. HUBERMAN, B.; ROMERO, D.; WU, F. Social networks that matter: Twitter under the microscope. ArXiv e-prints, 2008. JANSEN, B. J.; ZHANG, M.; SOBEL, K.; CHOWDURY, A. Micro-blogging as online word of mouth branding. Proceedings of the 27th international conference extended abstracts on Human factors in computing systems. Anais..., CHI EA 09. New York, NY, USA: ACM. Disponvel em: <http://doi.acm.org/10.1145/1520340.1520584>. Acesso em: 20 nov. 2011. , 2009 JANSEN, B.; ZHANG, M.; SOBEL, K.; CHOWDURY, A. Twitter power: Tweets as electronic word of mouth. J. Am. Soc. Inf. Sci., v. 60, n. 11, p. 2169-2188, 2009. KATZ, E.; LAZARSFELD, P. F. Personal influence: the part played by people in the flow of mass communications. Glencoe: Free Press, 1955. KEMPE, D.; KLEINBERG, J.; TARDOS, . Influential Nodes in a Diffusion Model for Social Networks. In: CAIRES, L.; ITALIANO, G. F.; MONTEIRO, L.; PALAMIDESSI, C.; YUNG, M. (Eds.). Automata, Languages and Programming. Berlin, Heidelberg: Springer Berlin Heidelberg, 2005. v. 3580p. 1127-1138. KLEINBERG, J. M. Authoritative sources in a hyperlinked environment. J. ACM, v. 46, n. 5, p. 604632, set 1999. KNOKE, D.; KUKLINSKI, J. H. Network analysis. Sage: Sage University Paper Series on Quantitative Applications in the Social Sciences, 1982. v. 7 LAZARSFELD, P.; BERELSON, B.; GAUDET, H. The peoples choice how the voter makes up his mind in a presidential campaign. 3. ed. New York: Columbia University Press, 1968. MEDEIROS, V. B. DE O. Anlise comparativa de redes de colaborao de eventos cientficos brasileiros. Recife: Universidade Federal de Pernambuco, 2010. MILSTEIN, S.; LORICA, B.; MAGOULAS, R. et al. Twitter and the MicroMessaging Revolution: Communication, Connections, and Immediacy--140 Characters at a Time. [S.l.]: OReilly Media / Radar, 2008. OTTE, E.; ROUSSEAU, R. Social network analysis: a powerful strategy, also for the information sciences. Journal of Information Science, v. 28, n. 6, p. 441 -453, 1 dez 2002. PAGE, L.; BRIN, S.; MOTWANI, R.; WINOGRAD, T. The PageRank Citation Ranking: Bringing Order to the Web. STANFORD INFOLAB, p. 17, 1999. ROMERO, D. M.; GALUBA, W.; ASUR, S.; HUBERMAN, B. A. Influence and Passivity in Social Media. arXiv:1008.1253, 6 ago 2010. RYMASZEWSKI, M. Second life: the official guide. [S.l.]: Wiley-Interscience, 2007. SILVA, N. B. DA. Recomendao de relacionamentos em redes sociais baseada em grafos. Recife: Universidade Federal de Pernambuco, 2010.
25
SUH, B.; HONG, L.; PIROLLI, P.; CHI, E. H. Want to be Retweeted? Large Scale Analytics on Factors Impacting Retweet in Twitter Network. . [S.l.]: IEEE. Disponvel em: <http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5590452>. Acesso em: 1 dez. 2011. , ago 2010 SUN, E.; ROSENN, I.; MARLOW, C.; LENTO, T. Gesundheit! Modeling Contagion through Facebook News Feed. International AAAI Conference on Weblogs and Social Media. Anais... [S.l: s.n.]. Disponvel em: <http://www.stanford.edu/~esun/ICWSM09_ESun.pdf>. Acesso em: 22 nov. 2011. , 2009 Twitter. Disponvel em: <http://twitter.com/about>. Acesso em: 19 nov. 2011. WATTS, D. J.; DODDS, P. S. Influentials, Networks, and Public Opinion Formation. Journal of Consumer Research, v. 34, n. 4, p. 441-458, 1 dez 2007. WENG, J.; LIM, E.-P.; JIANG, J.; HE, Q. TwitterRank: finding topic-sensitive influential twitterers. Proceedings of the third ACM international conference on Web search and data mining. Anais..., WSDM 10. New York, NY, USA: ACM. Disponvel em: <http://doi.acm.org/10.1145/1718487.1718520>. Acesso em: 20 nov. 2011. , 2010
26