Escolar Documentos
Profissional Documentos
Cultura Documentos
Anderson Berg dos Santos Dantas Orientador: Prof. Fernando Buarque de Lima Neto, PhD
Orientador:
Prof. Fernando Buarque de Lima Neto, PhD
Resumo
Sistemas de recomendao tm sido largamente utilizados por stios de comrcio eletrnico como forma de cativar clientes facilitando o processo de compra e resolvendo o problema da sobrecarga de informao. Este trabalho desenvolveu uma abordagem de sistemas de recomendao para o ambiente de vdeo locadoras, onde a busca por recomendaes frequente, mas as opinies nem sempre agradam o gosto do cliente. Para produzir boas recomendaes necessrio criar um perl para cada cliente. Numa vdeo locadora as informaes disponveis sobre um cliente para construo de um perl esto em seu histrico de locaes. No presente trabalho foi desenvolvido um sistema de recomendao baseado no contedo dos lmes presentes no histrico de locao de clientes de vdeo locadoras. Mapas auto-organizveis de Kohonen foram utilizados para realizar o aprendizado e consequente criao dos pers de usurios. As redes SOM (Self-Organizing map) organizam topologicamente os lmes, agrupando-os conforme semelhanas entre si. O objetivo auxiliar o cliente no processo de locao, direcionando-o a realizar uma boa escolha. O sistema obteve bons resultados, deixando o cliente satisfeito na maioria das decises tomadas.
Abstract
E-commerce sites use recommender systems as a tool for making recommendations to customers. Recommendations make the buying process easy and fun, besides it can resolve the information overload problem. This work developed a recommender system approach for dvd rental stores. Make good recommendations for customers of this type of store is a hard task. Usually, the recommendations made by word of mouth are not so good for the customer. It's necessary to know more about this customer to help him make a good decision. Our approach build a user-prole from the rental history of the client in the store. Self-organizing maps were used to build the user-prole. The SOM algorithm organize movies topologically, clustering them by similarities. The central goal is help the user to make a good choice. The system performed well, satisfying the client in the most tests.
Dedicatria
Agradecimentos
Agradeo a Deus pelo amor e ajuda a todo momento durante a graduao. Aos meus pais que sempre me apoiaram e me encorajaram a cursar uma faculdade. Agradecimento especial minha me, que tem sido uma forte coluna. Ao meu irmo pela compreenso e ajuda e minha irm pelo afeto. Agradeo aos colegas e professores pela conana e credibilidade que me ajudaram a prosseguir. Ao meu orientador que acreditou a todo momento que era possvel realizar este trabalho.
Sumrio
Lista de Figuras
Lista de Tabelas
Introduo
p. 11 . . . . . . . . . . . . . . . . . . . . . . . . p. 11 p. 12 p. 12 p. 13 p. 13 p. 13
Caracterizao do Problema
. . . . . . . . . . . . . . . . . . .
1.4.4
Fundamentao Terica
p. 14 p. 14 p. 16 p. 17 p. 19 p. 20 p. 22 p. 22
2.1
Sistemas de Recomendao . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Tcnicas de recomendao . . . . . . . . . . . . . . . . . . . . . 2.1.1.1 2.1.1.2 2.1.1.3 2.1.2 Filtragem baseada em contedo . . . . . . . . . . . . . Filtragem colaborativa . . . . . . . . . . . . . . . . . . Filtragem hbrida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2
Mapas auto-organizveis
. . . . . . . . . . . . . . . . . . . . . . . . . .
Viso Geral
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 22 p. 25 p. 28 p. 28
Modelo proposto
p. 29 p. 29 p. 30 p. 32
Viso Geral
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 36 p. 36 p. 37
4.1 4.2
p. 40 p. 40 p. 40
5.1 5.2
Referncias
p. 42
p. 44
Lista de Figuras
1 2 3 4 5 6 7 Avaliaes de usurios no stio da Amazon.com para determinado produto. p. 16 Recomendaes da Amazon.com de acordo com o histrico do cliente. . Associao de produtos por clientes na Amazon.com . . . . . . . . . . . Crtex cerebral humano. Fonte: http://www.psiquiatriageral.com.br . . Rede SOM bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . Funo chapu mexicano. Fonte: [1] . . . . . . . . . . . . . . . . . . . . Exemplo de vizinhana, onde o instante 2 menor que o instante 1, que por sua vez menor que o instante 0 8 9 10 11 12 13 14 . . . . . . . . . . . . . . . . . . . p. 26 p. 27 p. 27 p. 31 p. 32 p. 32 p. 34 p. 35 p. 17 p. 17 p. 23 p. 24 p. 24
Resumo do algoritmo de aprendizado SOM . . . . . . . . . . . . . . . . Fluxograma do algoritmo de aprendizado das redes SOM . . . . . . . . Fluxo de execuo do modelo proposto Diagrama de classes do modelo . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
Diagrama de seqncia da fase de treinamento . . . . . . . . . . . . . . Mapa de lmes do cliente 1 Mapa de lmes do cliente 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lista de Tabelas
1 Vantagens e desvantagens das ltragens baseada em contedo e colaborativa 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21 p. 38 p. 38 p. 38 p. 39 p. 39 p. 39 p. 44 p. 44 p. 44 p. 45 p. 45 p. 45 p. 45 p. 46 p. 46 p. 46 p. 46 p. 46 p. 47 p. 47
Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme
Shangai Triad
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Forrest Gump
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pulp Fiction
. . . . . . . . . . . .
22 23
Bob Roberts
. . . . . . . . . . . . . . . . .
p. 47 p. 47
11
Introduo
1.2 Motivaes
12
de opinies de terceiros pelo cliente. Sistemas computacionais de recomendao podem trazer todas as suas vantagens para vdeo locadoras tanto fsicas como virtuais, auxiliando o cliente a fazer a melhor escolha. Isso leva a um fator diferencial da vdeo locadora na viso do cliente.
1.2 Motivaes
O que motivou o presente trabalho foi a possibilidade de tornar a escolha de um lme para locao uma experincia mais simples e interessante. O cliente poder direcionar suas escolhas a partir das informaes que o sistema ir fornecer, todas baseadas no histrico de ttulos locados na loja. Este trabalho tenta minimizar o problema da sobrecarga de informao provendo o cliente com parmetros que possam identicar o seu perl e balizar melhor sua deciso.
apropriada a escolha de um lme pelo cliente, diminuindo as chances de desperdcio de seu dinheiro e tempo em algo que no lhe agrada. Alm de oferecer um servio
diferenciado ao cliente, a vdeo locadora ir se beneciar, tambm, por uma muito provvel maio delizao do mesmo, j que ocorre uma personalizao do servio. Temos como
meta construir a aplicao baseada em redes neurais articiais, especicamente mapas auto-organizveis de Kohonen. Essa arquitetura permite que haja um agrupamento do histrico de locaes de um determinado cliente de maneira que este possa ter informaes visuais sobre seu histrico. Ser criado um mapa para cada cliente, como forma de
representar suas preferncias e construir um perl personalizado. Quando o cliente desejar realizar uma nova locao, esta ser indicada no mapa que ir lhe mostrar a vizinhana do novo lme em relao a seus principais vizinhos, que caracterizam os lmes locados mais relacionados ao qual ele deseja locar.
13
apresenta um tipo especial de redes neurais articiais: as redes auto-organizveis ou redes SOM ( Kohonen.
Self-organizing map ).
14
Fundamentao Terica
Neste captulo esto apresentados os principais conceitos que ajudaro na compreenso do documento. Primeiramente, sero abordadas as caractersticas de sistemas de recomendao estabelecidos na literatura. Tambm sero abordadas as principais tcnicas de recomendao, apontando suas vantagens, principais problemas e solues propostas por diversos autores a m de solucionar essas falhas. Posteriormente sero apresentados os mapas auto-organizveis, em especial os mapas de Kohonen, denindo sua arquitetura e o algoritmo de aprendizado.
de departamentos possuem lojas virtuais para comrcio eletrnico, algumas delas nem possuem lojas fsicas, apenas os stios na internet onde podem vender seus produtos. Casos de sucesso no Brasil so as Americanas.com (www.americanas.com.br) e o Submarino (www.submarino.com.br). Sem a necessidade de ter espao fsico ou prateleiras, os itens que podem ser colocados venda so de um nmero superior se comparado a uma loja convencional [2]. Diante de tantas possibilidades, como buscar a melhor informao? Qual produto vale a pena adquirir? Qual lme ou msica escolher? Freqentemente as pessoas procuram opinies de terceiros, como amigos e familiares que j tiveram uma experincia
15
com determinado produto ou servio [6]. Podem, ainda, procurar por resenhas em jornais e revistas, ou pedir a opinio do dono de uma livraria ou vdeo locadora. Porm, nenhum deles provavelmente vai fazer recomendaes de acordo com as preferncias pessoais do interessado. Segundo [7], esta fase, onde o consumidor realiza uma pesquisa sobre a
utilidade de um produto ou servio, chamada de busca de informaes e constitui um dos estgios relacionados ao processo de compra. Neste momento o consumidor busca
experincias de outras pessoas como amigos e familiares, ou ainda, de experincias prprias que possam auxili-lo na escolha de um produto ou servio. Da falta de ateno aos reais desejos do cliente, surgiu ento, a necessidade da criao de mecanismos que tenham a capacidade de ltrar ou recuperar rapidamente informao. Com o objetivo de facilitar a busca por informao foram criados mecanismos
que pudessem indexar documentos na internet e, rapidamente, recuper-los, trazendo ao usurio aquilo que ele precisa. Tais mecanismos so as ferramentas de busca tais como o
o usurio expressa atravs de palavras-chave. Filtrar toda a informao recebida por um usurio, raramente uma tarefa simples e eciente. tragem criados foi o de Um dos primeiros sistemas de l-
Tapestry
emails
de um usurio. O
Tapestry
tambm o interesse que outros usurios tinham por esses documentos. Os idealizadores desse produto cunharam o termo ltragem colaborativa, propondo um sistema onde a ltragem de documentos seria realizada com auxlio de grupos de pessoas com o mesmo interesse. Atualmente, os stios de comrcio eletrnico disponibilizam para seus clientes ferramentas computacionais com o objetivo de auxili-los no momento da compra. Essas ferramentas caracterizam os sistemas de recomendao. Tais sistemas consistem em sugerir ao usurio produtos que sejam de seu interesse ajudando-o no processo de compra, alguns sistemas ainda fornecem opinies de outros clientes sobre aqueles produtos. Um dos maiores exemplos de stios de comrcio eletrnico que fazem bom uso de sistemas de recomendao a Amazon.com (www.amazon.com). Auxiliar o cliente mostrando produtos relacionados s suas preferncias uma forma de personalizao. A personalizao uma caracterstica do do
marketing
direto. Diferente
marketing
marketing
Personalizar resulta na delizao do cliente, que um grande diferencial entre empresas concorrentes [3], alm disso, conquistar um novo cliente custa de cinco a dez vezes mais do que manter um antigo [9]. Um mini-curso de sistemas de recomendao ministrado
16
no V Encontro Nacional de Inteligncia Articial, no ano de 2005, por Eliseo Reategui e Slvio Cazella [10] cita algumas estratgias utilizadas pelos stios de comrcio eletrnico para recomendao de produtos:
Listas de recomendao: A loja mantm listas de produtos, como itens mais vendidos, itens que tm a melhor avaliao entre os clientes ou lista de presentes, entre outros.
Avaliao de usurios:
j o adquiriram, alm dessa avaliao usurios podem deixar comentrios sobre determinado produto (Figura 1).
Suas recomendaes:
cliente. Ento pode-se ter dois tipos de recomendao: implcita, onde o stio oferece produtos de acordo com o histrico de compras do cliente, ou explcita, onde o usurio determina quais so suas preferncias (Figura 2).
Recomendao de produtos similares: O sistema de recomendao cria associaes entre produtos avaliados pelo usurio para oferecer produtos relacionados ao que o cliente est adquirindo no momento (Figura 3).
Associao por contedo: Este tipo de recomendao feita baseado no contedo de determinado item. Por exemplo: os livros: Redes de Computadores e Programao em Java so freqentemente vendidos em conjunto.
17
sonalizao para o usurio. As trs tcnicas mais utilizadas em sistemas de recomendao so a ltragem baseada em contedo, a ltragem colaborativa e a ltragem hbrida, que procura conciliar as vantagens de duas ou mais tcnicas atacando seus principais problemas.
2.1.1.1
A ltragem baseada em contedo tem suas razes no processo chamado de recuperao de informao, onde o usurio apresenta ao sistema um formulrio e recebe, como resultado, documentos associados a esses critrios [11]. O principal objetivo da recuperao de informao encontrar documentos que correspondam a determinado critrio de busca [1]. Em um sistema de recuperao de informao, o usurio fornece ao sistema palavraschave que representam seus interesses ou necessidades atuais na procura por informao. O sistema ento, realiza um busca por essas palavras em documentos armazenados numa base e retorna os documentos mais relevantes para os critrios informados. A ltragem de informao inspeciona todo novo item que recebido selecionando aqueles relacionados a seus interesses. Assim, a ltragem de informao, mantm o perl do usurio atualizado e demonstra interesses de longo prazo, pois continua realizando a
18
seleo de documentos de acordo com as preferncias identicadas no perl. Por outro lado, a recuperao de informao, que seleciona documentos de acordo com um critrio de pesquisa, representa interesses de curto prazo [12], ou seja, interesses momentneos traduzidos pelos critrios de busca do usurio. Os atuais sistemas de recomendao tm sua origem nos sistemas de ltragem de informao. Em 1982, Peter Denning [13] j apontava para o problema do volume de informao produzida e transmitida atravs de sistemas computacionais e a facilidade de compartilhamento de informaes pela internet, sendo necessria uma ateno maior para o processo de controlar e ltrar toda essa informao. Filtragem de informao e ltragem baseada em contedo so termos semelhantes e ambos possuem o mesmo objetivo: ltrar itens atravs da anlise do seu contedo [1]. Na ltragem baseada em contedo, as recomendaes so feitas apenas baseadas em um perl do usurio previamente construdo. Esse perl individual e determinado a partir da anlise do contedo de itens que o usurio qualicou ou mostrou algum interesse no passado [11]. Quando o usurio de um stio de comrcio eletrnico, por exemplo, entra na pgina da loja e revela suas necessidades atravs de palavras-chave na ferramenta de busca, ele est realizando uma recuperao de informao, pois o sistema apresenta produtos que satisfaam simplesmente os critrios apresentados no momento. Quando este mesmo stio armazena o perl do cliente e apresenta produtos semelhantes aos que este usurio mostrou interesse no passado, caracteriza uma ltragem de informao. Uma das tcnicas mais populares para representao dos itens em sistemas de ltragem baseada em contedo a TF-IDF (Term-frequency Inverse-Document-Frequency). Esta tcnica realiza comparao e clculo de similaridade a partir da freqncia de ocorrncia de palavras-chave nos textos [3]. Para criao do perl do usurio, normalmente so utilizadas tcnicas de computao inteligente, que podem extrair informaes do comportamento de determinado usurio, por exemplo, algoritmos de classicao podem identicar e fazer a diviso entre itens que o usurio gosta e itens que ele no gosta [1]. O
feedback
muito importante na
fase de aprendizado, podendo ser explcito, quando o usurio qualica o item que lhe foi oferecido, ou implcito, quando o usurio demonstra interesse no item nalizando com a compra [4]. Exemplos de sistemas que utilizam a ltragem baseada em contedo so o NewsWeeder [14] e o InfoFinder [15]. Dentre as vantagens da utilizao de ltragem baseada em contedo, podem-se citar: (i) no necessrio que um novo item tenha algum tipo de qualicao, bastando apenas que este seja semelhante ao perl do usurio e (ii) por avaliar a semelhana entre todos
19
os itens, a ltragem baseada em contedo no se restringe a itens j avaliados por outros usurios. Os principais problemas apresentados pela ltragem baseada em contedo so: (i) as representaes de contedo de um item no conseguem capturar alguns aspectos, como qualidade de um texto, no caso sistemas de recomendao de documentos, ou informaes de multimdia, no caso de sistemas que recomendam pginas da internet [11]; (ii) o segundo ponto negativo da ltragem baseada em contedo a superespecializao do sistema. A diversidade de itens recomendados ca restrita similaridade de itens avaliados pelo usurio, sem conseguir recomendar itens no relacionados que poderiam ser de interesse do cliente.
2.1.1.2
Filtragem colaborativa
A ltragem colaborativa a tcnica de recomendao mais comum e a mais largamente utilizada [16]. A abordagem da ltragem colaborativa consiste em recomendar
itens baseados na similaridade entre usurios, diferentemente da ltragem baseada em contedo, que realiza similaridade entre itens. Basicamente, formado um conjunto de usurios denominados vizinhos mais prximos, que possuem itens classicados de forma semelhante ao usurio alvo. Os itens que sero recomendados so itens que foram bem qualicados por esse grupo de usurios, partindo do pressuposto que esse mesmo grupo possui preferncias em comum com o usurio alvo. A priori, neste tipo de tcnica nenhuma informao sobre os itens em si conhecida, as recomendaes so baseadas na semelhana entre os usurios [11]. Segundo descreve Burke [16]: O perl de um usurio num sistema colaborativo consiste em um vetor de itens e suas qualicaes, que aperfeioado na medida em que o usurio interage com o sistema ao longo do tempo. Um dos primeiros sistemas a utilizar a ltragem colaborativa foi o cionado anteriormente neste trabalho no incio da seo 2.1. A idia
com que as pessoas colaborem entre si para realizar ltragens descrevendo suas percepes referentes a documentos que receberam. Essas percepes so armazenadas em comentrios ou anotaes que podem ser consultadas por qualquer outro usurio. Uma forma de utilizao desse sistema seria um usurio buscar documentos que outro determinado usurio aprovou. Os principais representantes de sistemas que utilizam ltragem colaborativa, alm do
Tapestry, so o GroupLens
[17],
Ringo
[18] e
Bellcore
[19].
A ltragem colaborativa tambm possui vantagens e problemas identicados por diversos especialistas na literatura. Algumas vantagens deste tipo de tcnica so:
20
Como as recomendaes so baseadas em avaliaes de outros usurios possvel tratar diferentes tipos de contedo, no somente documentos textuais.
A qualidade das recomendaes superior se comparado a sistemas que utilizam ltragem baseada em contedo. A justicativa est no fato de sistemas automa-
tizados no serem ecientes em determinar a qualidade de um produto analisando apenas seu contedo. A qualidade de um item est implcita na avaliao de outros usurios, sendo possvel produzir recomendaes de melhor qualidade.
Se um novo item introduzido no sistema, no ser recomendado at que um dos usurios o avalie. O que traz outra conseqncia: se o nmero de usurios do sistema reduzido em relao quantidade de itens, ocorre um problema de cobertura, ou seja, a coleo de itens que podem ser recomendados ser resumida.
Outro problema em sistemas utilizando ltragem colaborativa ocorre quando h um usurio cujas preferncias diferem dos demais usurios, conhecidos como ovelhasnegras. Neste caso, no h vizinhos semelhantes ao usurio ativo, ocasionando
2.1.1.3
Filtragem hbrida
A abordagem da ltragem hbrida consiste em associar duas ou mais tcnicas de recomendao com o intuito de unir suas vantagens e, simultaneamente, tratar os principais problemas inerentes a cada uma delas. Observando um resumo das vantagens e desvantagens das ltragens colaborativa e baseada em contedo, apresentado na Tabela 1, pode-se perceber que essas duas abordagens so complementares. Fato que motivou a criao de sistemas hbridos [11]. Burke [16] realizou um estudo sobre sistemas de recomendao hbridos. Neste artigo ele aponta sete combinaes possveis entre tcnicas de recomendao:
1. Ponderado: A avaliao de um item a combinao do resultado de todas as tcnicas presentes no sistema. O sistema A proposta do
P-Tango
P-Tango
contedo e da ltragem colaborativa atravs de mdias ponderadas. Os pesos so ajustados de acordo com o peso de cada recomendao, isto , ao passo que o nmero
21
Vantagens possvel tratar diferentes tipos de contedo A qualidade de um item est implcita na avaliao
Usurio negra
ovelha-
Superespecializao do sistema
de usurios e avaliaes de um determinado item cresce, a ltragem colaborativa tem seu peso aumentado; 2. Alternado: O sistema se utiliza de um critrio para alternar entre as tcnicas de recomendao. Por exemplo, se uma ltragem baseada em contedo no retorna
resultados satisfatrios, ento a recomendao feita com a ltragem colaborativa; 3. Misto: Neste tipo de combinao, o sistema apresenta recomendaes de diferentes tcnicas numa mesma listagem. O sistema PTV [21] utiliza a ltragem baseada
em contedo baseado nas descries de programas de TV e a ltragem colaborativa baseado na preferncia de outros usurios, o resultado das recomendaes uma combinao dos resultados das duas ltragens; 4. Combinao de caractersticas: Trata informaes de um tipo de recomendao
como simples caractersticas que so utilizadas por outra tcnica para retornar recomendaes mais signicativas. [22] apresenta um sistema de recomendao de
lmes onde as informaes da ltragem colaborativa (denominadas, neste artigo, caractersticas colaborativas) so inuenciadas pelo contedo agregado aos lmes. Desta forma, possvel agrupar usurios semelhantes e que gostem do mesmo gnero de lmes; 5. Cascata: Nesta combinao, uma tcnica, primeiramente, produz suas recomen-
daes e uma segunda tcnica usada para renar os resultados da anterior; 6. Acrscimo de caracterstica: Primeiramente uma tcnica aplicada para gerar classicaes para um item, ento estas informaes so incorporadas na tcnica seguinte; 7.
Meta-level :
Esta abordagem utiliza o modelo criado por uma tcnica como entrada
22
meta-level
o processo de recomendao seja realmente ecaz importante convencer o usurio de que as recomendaes so relevantes e que esto relacionadas satisfao do cliente [9]. Prover argumentos e explicaes sobre os dados que geraram a recomendao agrega maior conana ao sistema. A transparncia em sistemas de recomendao melhora o
entendimento pelo cliente e este se mostra mais propenso a aceitar as recomendaes [1].
mente utilizado o aprendizado supervisionado, onde, alm da entrada, as sadas desejadas para a rede so fornecidas por um supervisor externo [23]. A tarefa ento fazer o ajuste de parmetros de forma que a rede possa representar novas entradas corretamente. O mtodo de aprendizado supervisionado se limita, porm, a aplicaes onde tanto os dados de entrada como as respostas desejadas so conhecidos. Algumas aplicaes necessitam que o treinamento seja realizado sem um supervisor para subsidiar o treinamento da rede, todo o conhecimento deve ser adquirido somente atravs das entradas. Diversos algoritmos foram desenvolvidos para treinar redes sem superviso, este trabalho ir tratar exclusivamente de um deles: os modelos
self-organizing
(ou auto-organizveis).
self-organizing,
SOM (
Self-organizing maps )
Kohonen [24]. A estrutura bsica dessas redes formada por uma camada de entrada, constituda de padres fonte, e uma camada de sada (geralmente uma grade 2D). No h camadas escondidas (hidden-layer) no modelo de mapas auto-organizveis como em
23
outros tipos de redes neurais. A inspirao para o desenvolvimento das redes SOM est no mapa topologicamente organizado do crtex cerebral de animais mais desenvolvidos. O crtex cerebral humano dividido de acordo com funes especcas, como fala e viso (Figura 4). Desta forma, neurnios que lidam com o mesmo tipo de estmulo esto localizados prximos uns dos outros. O modelo de Kohonen consiste em um mapa, onde os nodos ou neurnios articiais que esto topologicamente prximos respondem a estmulos semelhantes, ou seja, padres de entrada que possuem similaridade entre si.
Na arquitetura de uma rede SOM, os nodos so dispostos em uma grade ou reticulado, geralmente bidimensional ou unidimensional, com raras excees, h redes tridimensionais ou n-dimensionais. No modelo bidimensional, os neurnios esto organizados em linhas e colunas, como mostra a Figura 5. Cada nodo possui um conjunto de pesos que representam as sinapses do neurnio biolgico, esses pesos so ajustados de maneira que o nodo represente um dado padro de entrada. Os nodos de uma rede SOM funcionam como um extrator de caractersticas, quanto mais o vetor de pesos de um neurnio for semelhante a um padro de entrada, maior ser sua sada e mais representativo este nodo ser para a entrada [23]. As redes SOM utilizam um processo de aprendizado competitivo, no qual os neurnios da camada de sada competem entre si para representar um dado padro de entrada, assim, apenas um neurnio de sada ou neurnio por grupo estar ativo a qualquer instante de tempo. O neurnio que se sobressai entre os outros para representar a entrada
winner-takes-all,
o vencedor leva
Para implementar esta competio so normalmente utilizadas conexes laterais O modelo para esse tipo de conexo tambm
provm das clulas do crtex cerebral, onde a ordenao topolgica dos neurnios se
24
d graas ao
feedback
feedback
modelado por
uma funo chamada chapu mexicano. Segundo esta funo, as interaes laterais entre os neurnios podem ser divididas em trs regies distintas, como mostrado na Figura 6: (1) rea excitatria, vizinhos que esto mais prximos ao neurnio atual; (2) rea
inibitria, vizinhos que esto fora da rea anterior, mas includos numa segunda rea; e (3) rea levemente excitatria, que rodeia a rea inibitria, esta terceira rea geralmente ignorada.
Para simular o efeito da funo chapu mexicano, a rede SOM utiliza o conceito de vizinhana topolgica dos neurnios vencedores. Quando um neurnio vence a competio e o escolhido para representar o padro de entrada, ele tem seus pesos ajustados de forma a se aproximar mais da entrada, com o conceito de vizinhos topolgicos, alm do neurnio vencedor ter seus pesos ajustados, os neurnios localizados na vizinhana tambm tm seus pesos ajustados.
25
2.2.2 Treinamento
Como armado anteriormente, o treinamento de redes SOM competitivo e nosupervisionado. Primeiramente os pesos dos neurnios do mapa so inicializados com
valores aleatrios, que sero ajustados ao longo do algoritmo de aprendizado, de forma que se aproximem dos padres de entrada. Em seguida apresentado um padro
rede, neste momento a rede dene o neurnio que melhor representa esta entrada, caracterizando o neurnio vencedor. Para a escolha do neurnio vencedor denida uma funo de ativao que baseada na distncia entre o peso do neurnio e o vetor de entrada. A funo de ativao mais conveniente para a rede SOM baseada na distncia euclidiana [25], apresentada na equao 2.1:
yj =
i=1
onde
xi wji
(2.1)
yj
o peso do neurnio
xi .
O neurnio que possui a menor distncia escolhido como o vencedor e ir representar o padro de entrada. Aps essa escolha d-se incio ao processo de atualizao dos pesos. Nesta fase o neurnio vencedor e os vizinhos denidos pelo raio ou rea de vizinhana atualizam seus pesos. A m de implementar a interao lateral, denida uma regio de vizinhana
Nc ,
c,
de ativao.
enquanto neurnios fora do limite sero deixados intactos. Inicialmente, o valor do raio ou tamanho de
Nc
devendo diminuir monotonicamente no tempo [25]. Tal valor pode, ao nal do processo, abranger apenas o neurnio central (Nc
= {c}),
equao 2.2 mostra como so atualizados os pesos do neurnio vencedor e dos neurnios vizinhos.
wji (t + 1) =
onde
se
j Nc (t)
(2.2)
(t)
Como alternativa pode ser introduzida uma funo de vizinhana do neurnio vencedor, denido pela seguinte equao, com (neurnio central ou vencedor) e
rc
rj
j,
respectivamente:
26
/ 2 )
(2.3)
h0 = h0 (t)
= (t)
(t)
corresponde ao raio de
Nc (t).
(2.4)
Figura 7: Exemplo de vizinhana, onde o instante 2 menor que o instante 1, que por sua vez menor que o instante 0
Segundo estudos e experincias na escolha dos parmetros, Kohonen [25] recomenda que o valor inicial de
(t)
decair monotonicamente durante os primeiros 1000 ciclos da fase de aprendizado, porm mantendo o valor acima de 0,1. A regra para o decrscimo de
(t)
(t) = 0.9(1t/1000).
durante esta fase inicial do treinamento que ocorre a fase de ordenao da rede. Nas fases seguintes ocorre o ajuste no da rede, chamado de fase de convergncia. O nmero de ciclos da fase de aprendizado deve ser razoavelmente grande. Uma regra emprica que este nmero deva ser 500 vezes maior que o nmero de neurnios na rede. O tamanho da vizinhana de um neurnio no pode ser muito pequeno inicialmente, pois o mapa no teria uma boa ordenao global. A princpio o raio ou tamanho inicial da vizinhana pode ser maior que a metade do tamanho do mapa. A Figura 8 apresenta um resumo da execuo do algoritmo de aprendizado das redes SOM e a Figura 9 apresenta o uxograma do funcionamento deste processo.
27
28
2.2.3 Aplicaes
As redes SOM foram inicialmente idealizadas para identicar relaes no-lineares entre dados apresentados em mais de duas dimenses. Com a popularidade do algoritmo, diversas aplicaes foram desenvolvidas e problemas solucionados com o uso dos mapas auto-organizveis. Anlise de dados exploratrios, reconhecimento de padres e recon-
hecimento e anlise de fala esto entre as reas de aplicao de redes SOM. Um exemplo de aplicao desenvolvida pelo prprio Kohonen na rea de reconhecimento de fala o
no qual Kohonen tambm participou do desenvolvimento. WEBSOM um mtodo para organizao de grandes colees de documentos de texto. Baseado em redes SOM, o
WEBSOM organiza documentos num reticulado bidimensional de forma que documentos relacionados apaream prximos.
29
Modelo proposto
Este captulo descreve a prova de conceito proposta neste trabalho. Ser detalhado o algoritmo desenvolvido, bem como detalhes de sua implementao e o funcionamento do mesmo.
informaes que esto disponveis num ambiente de locadora de lmes consideram somente o cliente como indivduo e no um grupo de clientes que podem contribuir juntamente para gerar recomendaes. Portanto no h o conceito de avaliao de um item pelo usurio. Nos sistemas de locadoras comuns no existe um mecanismo onde o cliente possa dar sua nota para um lme de forma que outros clientes possam acompanhar essas avaliaes e ter um parmetro para a escolha de determinado ttulo. Existe apenas a opinio presencial de clientes que queiram express-las ou quando o funcionrio da loja educadamente questiona sobre a satisfao do cliente com relao a determinado lme. Nenhuma informao
armazenada num banco de dados, nem realizado um levantamento das opinies de diversos clientes, com o propsito de identicar os melhores lmes. A proposta deste trabalho desenvolver um sistema que, baseado no histrico de locaes de um cliente, ele possa auxiliar a conduo do processo de uma escolha satisfatria no momento de locar um novo ttulo. O sistema se baseia unicamente no contedo de informao acerca dos lmes que j foram locados por um determinado cliente, informaes essas que podem ser facilmente obtidas no banco de dados da locadora. Como mencionado anteriormente, no existem avaliaes de clientes sobre os lmes nem parmetros que determinem as preferncias desses clientes. Portanto, o modelo proposto no ambiciona
gerar uma lista de recomendaes diretas com ttulos para o cliente, apenas auxili-lo de forma a realizar uma escolha consciente baseado nas informaes contidas nos lmes. O
30
modelo utiliza redes auto-organizveis, pois este algoritmo desempenha bem a funo de agrupamento e vizinhana, para que o cliente tenha uma percepo melhor da relao entre os lmes que j assistiu com os que deseja locar atualmente. O objetivo especco do trabalho realizar uma prova de conceito para o uso de redes SOM na recomendao de lmes a ser implementado em vdeo locadoras como forma de personalizao da loja para o cliente, tornando mais prazeroso e simplicado o ato da escolha do lme a ser locado. A personalizao, como comentado anteriormente, torna o cliente mais satisfeito e mais assduo. O modelo proposto consiste em uma rede SOM que, quando treinada, composta por lmes contidos no histrico de um cliente (topologicamente organizados). Propo-
mos ento, um mapa SOM para cada cliente; e no um mapa s para toda a locadora. Essa deciso de projeto respeita a personalizao, objetivo principal deste trabalho. A rede ir distribuir os ttulos no mapa bidimensional, agrupando-os de acordo com semelhanas entre informaes fornecidas sobre os lmes. Nesta fase ocorre o aprendizado do comportamento do cliente com relao s escolhas de lmes. Aps o treinamento da rede, os lmes locados por um cliente estaro distribudos no mapa. O cliente deve, ento selecionar um lme do acervo da locadora e apresentar ao seu mapa individual. A rede ir calcular a posio deste novo lme e ir mostrar ao usurio trs lmes que estejam prximos ao primeiro, determinando que h semelhanas entre esses quatro ttulos. Esta uma forma de auxiliar o cliente, pois ele pode avaliar se ir gostar ou no do lme, partindo da satisfao que teve ao assistir os outros trs. A Figura 10 mostra o uxo bsico da execuo do sistema. A ferramenta foi modelada de forma a se integrar ao sistema de informao da vdeo locadora com o objetivo de ser um diferencial da locadora para corresponder demanda dos clientes na busca de informaes que os auxiliem no processo de escolha e locao de novos lmes. O projeto proposto, ento, no pretende realizar o gerenciamento do
31
programao.
implementao e ser mais largamente utilizada pelo autor deste trabalho. A Figura 11 mostra os diagramas de classes do modelo implementado. MapaSOM uma classe que comporta todos os neurnio da rede e recebe o conjunto de entradas para ser apresentado durante o treinamento. Cada neurnio possui coordenadas
y,
determinando sua
posio no reticulado do mapa e o vetor de pesos que so inicializados aleatoriamente e ajustados durante a fase de aprendizado. Cada padro de entrada tem um conjunto de caractersticas que so extrados do banco de dados de lmes, alm de um objeto neurnio que caracteriza o neurnio vencedor para representar o padro. A Figura 12 mostra o diagrama de seqncia do programa durante a fase de treinamento. O treinamento inicia criando um mapa com um determinado nmero de neurnios, cujos pesos so inicializados com valores aleatrios. Aps a fase de inicializao do mapa, tem incio o algoritmo de aprendizado propriamente dito. Ento so apresentados os
padres de entrada que representam os lmes presentes no histrico do cliente e, para cada um deles, selecionado o neurnio que melhor representa uma dada entrada. Este neurnio tem seus pesos atualizados de forma a melhor reetir as caractersticas da entrada. O neurnios contidos no raio de vizinhana do neurnio vencedor tambm tm seus pesos atualizados. Assim que todos os padres de entrada, ou seja, todos os ttulos do histrico, forem apresentados, iniciado um novo ciclo de treinamento. Quando o nmero de ciclos atingir um determinado limite, o treinamento encerrado. O valor do limite de
32
ciclos segue o valor proposto por Kohonen, como mencionado na seo 2.2.2.
ttulos dos lmes locados pelo cliente e busca no acervo da locadora as informaes complementares para cada ttulo. Essas informaes sero utilizadas como vetor de entrada para cada padro de entrada durante a fase de aprendizado da rede. Logo em seguida determinado o tamanho do mapa, ou seja, o nmero de neurnios presentes na rede.
33
O vetor de pesos de cada um desses neurnios inicializado com valores aleatrios e determinado o raio de vizinhana inicial. Empiricamente, um valor inicial adequado para a vizinhana de 60% do tamanho total do mapa. Aps a fase de inicializao do mapa, segue-se a fase de aprendizado ou treinamento. A fase de treinamento inicia ao serem apresentados rede os padres de entrada. Cada padro de entrada possui um vetor de caractersticas que identica unicamente um lme. Ento calculado o neurnio que mais se aproxima de cada padro, denominado como neurnio vencedor. O clculo para determinar o neurnio vencedor segue a funo da
distncia euclidiana como descrito na seo 2.2.2 pela equao 2.1. Este clculo realizado atravs da distncia euclidiana entre o vetor de caractersticas de um padro de entrada e o vetor de pesos de um neurnio. Quanto mais similar um neurnio for de uma entrada menor ser a distncia entre os dois, caracterizando o neurnio vencedor. Os pesos do neurnio selecionado so atualizados, assim como os pesos de neurnios em seu raio de vizinhana. Como dito anteriormente o raio de vizinhana inicial igual a 60% do tamanho do mapa, esse raio decrescido monotonicamente segundo a equao 2.3 mostrada na seo 2.2.2. Esses passos so repetidos at que o nmero determinado de ciclos seja alcanado. No nal da fase de treinamento todos os lmes presentes no
histrico do cliente esto distribudos topologicamente no mapa que representa, ento, o perl do usurio. Com a rede treinada, inicia-se a fase de teste. Neste passo sero mostrados novos
ttulos de lmes rede, representando lmes que o cliente deseja alugar. Ao ser apresentado a um novo padro, a rede ir calcular o neurnio que melhor representa este padro, da mesma maneira que realizado na fase de aprendizado. A diferena aqui est em que os pesos do neurnio vencedor no sero mais ajustados, ele apenas selecionado como representante daquela entrada no mapa topolgico do perl do cliente. O ajuste de pesos que caracteriza o aprendizado da rede, portanto nesta fase no realizado o clculo de ajuste e de vizinhana. Aps o clculo do neurnio vencedor para o novo lme, o algoritmo ir determinar quais so os trs neurnios mais prximos daquele. Para isso calculada a distncia
entre dois pontos no plano bidimensional. Os trs neurnios mais prximos do vencedor representam padres de entrada que so os lmes que mais se assemelham ao lme representado pelo neurnio vencedor. O sistema ento auxilia o cliente na deciso mostrando que o lme que ele deseja locar tem relao de semelhana com outros trs que ele j locou no passado. Dependendo da satisfao do usurio com os trs lmes que foram
34
mostrados, ele decide se ir mesmo locar o lme escolhido ou no. Prover a informao da relao entre os lmes agrega conana ao sistema, pois o cliente saber a origem das recomendaes apresentadas. Para visualizao do mapa, a ferramenta cria um grco bidimensional plotando os lmes do histrico e os novos lmes que o cliente deseja locar. As Figuras 13 e 14 mostram exemplos desse grco para o cliente 1 e cliente 2, respectivamente. Cada ponto do grco representa um neurnio contido no mapa que foi construdo na fase de treinamento. Os pontos de cor laranja representam os ttulos presentes no histrico do cliente, os pontos de cor vermelha so os novos lmes que o cliente deseja locar e os de cor azul so pontos que no representam nenhum lme. Navegando pelo mapa o cliente pode aproximar o a um dos pontos e ser mostrado um
mouse
tootip
ponto representa, desta forma o cliente pode procurar os lmes que esto mais prximos dos novos lmes. Os grcos apresentados foram criados utilizando a ferramenta
Visire,
que cria
grcos utilizando a tecnologia WPF (Windows Presentation Foundation) presente na plataforma .NET da Microsoft . O WPF um subsistema grco do .NET Framework, ou seja uma tecnologia que permite a criao de interfaces de apresentao para aplicativos desenvolvidos sob a plataforma .NET.
35
contendo as informaes dos novos lmes e dos trs lmes que mais se assemelham a eles. Estes experimentos sero detalhados no Captulo 4.
36
Este captulo tem como objetivo descrever os experimentos realizados e resultados obtidos a partir da implementao do modelo descrito no Captulo 3.
base de dados real, extraindo as caractersticas que mais se adequam ao modelo proposto. Inicialmente estava sendo negociada a obteno dos dados de uma vdeo locadora da cidade, mas devido a entraves na poltica de segurana da empresa que fornece o sistema para esta locadora, no foi possvel coletar os dados reais para teste de campo do sistema. A alternativa encaminhada foi utilizar uma base, tambm real, disponvel abertamente na internet. A base de dados utilizada foi a
avaliaes para 1682 lmes por 943 usurios. A base MovieLens foi construda a partir do stio de recomendaes de lmes: movielens.org. A base de dados MovieLens assim organizada:
Arquivo u.data:
Arquivo u.item: contm informaes sobre os lmes, ttulo, data de lanamento e gnero.
4.2 Resultados
37
Arquivo u.user: informao demogrca sobre os usurios: nome, idade, gnero, prosso.
Arquivos de treinamento e teste: a base u.data dividida em dois tipos de arquivos com a relao de 80%/20% para treinamento e teste, respectivamente.
Para o escopo deste trabalho, no sero utilizadas as avaliaes dos usurios durante a fase de treinamento, pois fugiria ao objetivo que fazer recomendaes em ambientes de locadoras de lmes reais, onde no h o conceito de avaliao pelos clientes. O ambiente de experimentos foi assim determinado: Da base de lmes foram extrados o nmero de identicao nico do lme (ID), ttulo do lme, ano de lanamento, gnero e nmero de vezes que aparece no arquivo de avaliaes. Este ltimo parmetro representa, para a realidade do presente trabalho, o nmero de locaes totais do lme na locadora. O arquivo de avaliaes dos usurios representa as locaes de cada cliente, portanto o mapa construdo cruzando as informaes destas duas tabelas. O arquivo de testes representa os lmes que o cliente deseja locar, ento esses padres so apresentados ao sistema com a rede j treinada.
4.2 Resultados
Foram criadas tabelas para visualizao e estudo dos resultados obtidos com os experimentos realizados. O primeiro ttulo apresentado nas tabelas o lme que o cliente deseja locar, os trs seguintes so os vizinhos mais prximos no mapa, que indicam ser semelhantes ao primeiro. Para a avaliao dos resultados foi considerada a nota ou avaliao que o
usurio deu ao lme. Por exemplo, na Tabela 2, o cliente 1 deseja locar o lme
Shangai
Triad. Quando apresentado este lme rede, o cliente obteve como resposta os lmes: The White Balloon, Belle de jour e Jean de Florette, evidenciando factualmente que estes
lmes tm similaridades com o primeiro. Observando os ttulos que foram mostrados como relacionados, o cliente ir avaliar se vale a pena alugar o lme
Shanghai Triad.
Para
avaliar esse resultado, observa-se a coluna Avaliao da tabela, os lmes relacionados possuem avaliao de 4, 3 e 5, respectivamente, indicando que o cliente teve satisfao razovel a tima ao assist-los. Portanto, a interpretao desse resultado que o lme
4.2 Resultados
38
para o lme
Shanghai Triad provavelmente ir agradar o cliente. A avaliao Triad foi de 5, ou seja, a satisfao do usurio foi muito boa.
Tabela 2: Resultados para o cliente 1 e o lme
Ttulo Gnero Ano
Shanghai
Shangai Triad
A valiao
Nmero de locaes
20 7 30 55
5 4 3 5
O cliente 1 tem 135 ttulos em seu histrico, quantidade que rendeu um bom aprendizado para a rede. De forma geral, foi observado que a rede conseguiu gerar um bom perl para este cliente. A tabela 3 mostra outro resultado para o cliente 1, a anlise feita de modo anlogo tabela anterior. O primeiro ttulo representa o lme que o cliente ainda no locou, os trs seguintes so os lmes mais similares ao primeiro. Observa-se que eles possuem alta similaridade em relao ao gnero e ao ano de lanamento. A satisfao do cliente conrmada pela avaliao que deu aos lmes.
Nmero de locaes
211 195 69 75
5 2 3 4
Mighty
Aphrodite.
trar lmes fortemente relacionados e que representam as preferncias do cliente. O cliente 2 possui apenas 40 ttulos no seu histrico. Observando a coluna Avaliao, que representa a satisfao do usurio, pode-se perceber que o sistema obteve bons resultados para este lme. Considerando esta mtrica, os resultados para o cliente 2 foram, na maioria, satisfatrios, tendo o sistema errado poucas vezes no agrupamento dos ttulos.
Mighty Aphrodite
A valiao
Nmero de locaes
4 5 4 4
4.2 Resultados
39
Devido pouca quantidade de padres para treinamento para o cliente 2, possvel observar na Tabela 5 que o lme
que foram bem aprovados pelo cliente. Obviamente, a nota baixa no necessariamente deve ser encarado como uma evidncia de que o sistema errou, pois fatores externos como um lme de tema, atores e produo boa, pode ter sido mal dirigido (na opinio do cliente).
Apt Pupil
A valiao
Nmero de locaes
1998
136 65 52 6
1 5 4 3
Nas tabelas seguintes possvel observar os resultados dos experimentos para outros clientes.
Il Postino
A valiao
Nmero de locaes
5 3 5 2
Pulp Fiction
A valiao
Nmero de locaes
4 4 3 5
Esses resultados experimentais, nos levam a crer que nossa proposta (i.e. o sistema proposto) correspondeu s expectativas, pois conseguiu ser um auxiliar nas decises do cliente, trazendo boas respostas na maioria dos casos testados.
40
5.1 Concluses
O trabalho proposto foi desenvolvido como uma prova de conceito para sistemas de recomendao no ambiente de vdeo locadoras utilizando, para aprendizado do comportamento de clientes, o algoritmo de redes SOM. A contribuio deste trabalho ajudar o cliente, dando diretrizes para realizar sua escolha. Sistemas de recomendao so bastante utilizados em stios de comrcio eletrnico e existem diversas ferramentas que recomendam lmes na internet. Os sistemas de informao de vdeo locadoras carecem de ferramentas que auxiliem o cliente quando este tem dvida de qual lme locar, ou quando simplesmente deseja opinies de terceiros. Geralmente o cliente busca lmes recomendados por algum amigo ou familiar que j tenha assistido e expressou sua opinio, mas no simples saber realmente qual tipo de lme ir agradar esse cliente. O modelo apresentado neste trabalho consegue montar um perl para o usurio com o objetivo de agregar informaes s opinies que ele j obteve. Foi possvel construir modelos individualizados e oferecer ao cliente a relao de um novo lme com aqueles que j esto presentes em seu histrico.
41
melhor da rede de forma geral, caracterizando melhor o perl do cliente. A adio dessas caractersticas est entre os futuros esforos para melhoria da ferramenta. Ainda outra melhoria que pode ser includa no modelo a criao de um ambiente grco mais amigvel ao usurio. Uma das caractersticas desse ambiente seria um formulrio onde o cliente pudesse simplesmente digitar o ttulo do lme a ser locado e o sistema buscar os lmes mais similares a ele. Nesse ambiente o cliente teria tambm a opo de visualizar o mapa topolgico de seu perl num plano bidimensional, tendo uma viso geral do seu histrico, podendo ento, direcionar sua escolha a um ttulo que tenha, por exemplo, o mesmo gnero do agrupamento que possui mais lmes. Um ponto muito importante que deve ser acrescentado em trabalhos futuros o armazenamento do mapa de um cliente. Criar mapas para clientes que possuem muitos Armazenar as infor-
maes do mapa do cliente imprescindvel para tornar o processo de recomendao mais eciente. Neste caso devem ser estudadas tcnicas para no precisar refazer todo mapa cada vez que o cliente loca um lme, ou seja, insere um novo ttulo no seu histrico e manter o mapa sempre atualizado. Adicionalmente a ferramenta poder agregar a ltragem colaborativa atravs da associao dos pers de diversos clientes. Esta caracterstica pode ser implementada analisandose a semelhana entre os mapas dos clientes. Com a anlise de mapas similares provavelmente possvel ser realizada a recomendao direta de lmes, pois pode-se recomendar itens que esto presentes em mapas de clientes semelhantes.
42
Referncias
[1] GABRIELSSON, S.; GABRIELSSON, S.
The use of Self-Organizing Maps in Recommender Systems. Dissertao (Mestrado) Uppsala University, 2006. A Cauda Longa: do mercado de massa para o mercado de nicho.
[S.l.]: Elsevier, 2006.
[2] ANDERSON, C.
Universi-
dade de Pernambuco, 2006. [4] TERVEEN, L.; HILL, W. Beyond recommender systems: Helping people help each other.
Technical report,
2003.
UC Berkeem:
Systems,
Disponvel
<http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/>.
[6] RESNIK, P.; VARIAN, H. R. Recommender systems. v. 40, n. 3, 1997. [7] CASTRO, E. B.
FGV, 2004.
[9] BEZERRA, B. L. D.
Uma soluo em ltragem de informao para sistemas de recomendao baseada em anlise de dados simblicos. Dissertao (Mestrado) Uni-
versidade Federal de Pernambuco, 2004. [10] REATEGUI, E. B.; CAZELLA, S. B. Sistemas de recomendao. mini-curso. Enia, 2005. [11] BALABANOVIC, M.; SHOHAM, Y. Fab: Content-based, collaborative recommendation.
[12] HERLOCKER, J. L.
Understanding and Improving Automated Collaborative Filtering Systems. Tese (Doutorado) University of Minnesota, 2000. Communications of the ACM, v. 25, n. 3, 1982. 12th International Conference
s.n.], 1995.
Referncias
43
[15] KRULWICH, B.; BURKEY, C. Learning user information interests through extraction of semantically signicant phrases. In:
s.n.], 1996.
[17] RESNICK, P. et al. Grouplens: an open architecture for collaborative ltering of net-
news. In: CSCW '94: Proceedings of the 1994 ACM conference on Computer supported cooperative work. [S.l.: s.n.], 1994. p. 175186.
[18] SHARDANAND, U.; MAES, P. Social information ltering: Algorithms for automat-
Proceedings of ACM CHI'95 Conference on Human Factors in Computing Systems. [S.l.: s.n.], 1995. p. 210217.
ing word of mouth. In:
[19] HILL, W. et al. Recommending and evaluating choices in a virtual community of use.
CHI '95: Proceedings of the SIGCHI conference on Human factors in computing systems. [S.l.: s.n.], 1995. p. 194201.
In: newspaper. In:
Evaluation. [S.l.:
[21] SMYTH, B.; COTTER, P. Personalized electronic program guides for digital tv.
AI
[22] BASU, C.; HIRSH, H.; W., C. Recommendation as classication: Using social and
[24] KOHONEN, T.
3. ed. [S.l.]:
[S.l.: s.n.],
v. 21, n. 3, p.
IEEE Trasac-
[28] GRAEF, G.; SCHAEFER, C. Application of art2 networks and self-organizing maps
Revised Papers from the nternational Workshops OHS-7, SC3, and AH-3 on Hypermedia: Openness, Structural Awareness, and Adaptivity, p. 182
[29] LEE, M.; CHOI, P.; WOO, Y. A hybrid recommender system combining collaborative ltering with neural network. In: p. 531534.
AH '02: Proceedings of the Second International Conference on Adaptive Hypermedia and Adaptive Web-Based Systems. [S.l.: s.n.], 2002.
44
Richard III
A valiao
Nmero de locaes
Richard III Bridge Gone Wind Lone Star on with the the River Kwai, The
3 4 4 5
Postino, Il
A valiao
Nmero de locaes
5 1 2 5
Rock, The
A valiao
Nmero de locaes
302 105 68
3 3 1
Heavy Metal
1967
54
45
Platoon
A valiao
Nmero de locaes
Platoon Bridge Gone Wind Lone Star on with the the River Kwai, The
4 4 4 5
Independence Day
A valiao
Nmero de locaes
Ao/Fico Cientca/ Guerra Ao/Aventura/ Fico Cientca/ Guerra Ao/Aventura/ Fico Cientca/ Guerra/Romance
1996 1997
353 178
4 2
1977
484
Empire
Strikes
1980
295
Back, The
Antonia's Line
A valiao
Nmero de locaes
59 61 6 154
3 3 3 5
Nmero de locaes
3 4 4 3
46
Apollo 13
A valiao
Nmero de locaes
2 3 3 4
Forrest Gump
A valiao
Nmero de locaes
Forrest Gump Truth Cats The Sabrina Cinema adiso Par& About Dogs,
259 234
3 2
1995 1988
152 104
4 4
Nmero de locaes
Remains of the Day, The Rainmaker, The 12 Angry Men Raging Bull
3 2 4 4
Aladdin
A valiao
Nmero de locaes
Animao/Infantil/ 1992 Comdia/Musical Animao/Infantil/ 1994 Musical Infantil/Comdia/ Musical Animao/Infantil/ 1995 Comdia 1964
2 4 4 4
Pulp Fiction
A valiao
Nmero de locaes
4 4 3 5
47
Nmero de locaes
Dead Man Walking Mr. Opus Dead Poets Society People vs. Larry Flynt, The Holland's
5 5 5 4
Braveheart
A valiao
Nmero de locaes
4 5 2 5
Bob Roberts
A valiao
Nmero de locaes
65 60 76 27
4 3 3 4
Nmero de locaes
2001:
A Space
1968
202
82 173 119
4 4 4