TCC Final AndersonBerg

ESCOLA POLITCNICA DE PERNAMBUCO
Sistema de Recomendao para clientes de vdeo locadoras baseado em redes SOM

Trabalho de Concluso de Curso Engenharia da Computao
Anderson Berg dos Santos Dantas Orientador: Prof. Fernando Buarque de Lima Neto, PhD
Anderson Berg dos Santos Dantas
Sistema de Recomendao para clientes de vdeo locadoras baseado em redes SOM

Monograa apresentada como requisito parcial para obteno do diploma de Bacharel em Engenharia da Computao pela Escola Politcnica de Pernambuco - Universidade de Pernambuco.
Orientador:
Prof. Fernando Buarque de Lima Neto, PhD
Departamento de Sistemas e Computao Escola Politcnica de Pernambuco Universidade de Pernambuco
Recife - PE, Brasil Novembro de 2009
Resumo
Sistemas de recomendao tm sido largamente utilizados por stios de comrcio eletrnico como forma de cativar clientes facilitando o processo de compra e resolvendo o problema da sobrecarga de informao. Este trabalho desenvolveu uma abordagem de sistemas de recomendao para o ambiente de vdeo locadoras, onde a busca por recomendaes frequente, mas as opinies nem sempre agradam o gosto do cliente. Para produzir boas recomendaes necessrio criar um perl para cada cliente. Numa vdeo locadora as informaes disponveis sobre um cliente para construo de um perl esto em seu histrico de locaes. No presente trabalho foi desenvolvido um sistema de recomendao baseado no contedo dos lmes presentes no histrico de locao de clientes de vdeo locadoras. Mapas auto-organizveis de Kohonen foram utilizados para realizar o aprendizado e consequente criao dos pers de usurios. As redes SOM (Self-Organizing map) organizam topologicamente os lmes, agrupando-os conforme semelhanas entre si. O objetivo auxiliar o cliente no processo de locao, direcionando-o a realizar uma boa escolha. O sistema obteve bons resultados, deixando o cliente satisfeito na maioria das decises tomadas.
Abstract
E-commerce sites use recommender systems as a tool for making recommendations to customers. Recommendations make the buying process easy and fun, besides it can resolve the information overload problem. This work developed a recommender system approach for dvd rental stores. Make good recommendations for customers of this type of store is a hard task. Usually, the recommendations made by word of mouth are not so good for the customer. It's necessary to know more about this customer to help him make a good decision. Our approach build a user-prole from the rental history of the client in the store. Self-organizing maps were used to build the user-prole. The SOM algorithm organize movies topologically, clustering them by similarities. The central goal is help the user to make a good choice. The system performed well, satisfying the client in the most tests.
Dedicatria
A Deus e minha famlia, pois me ensinaram os passos que devo seguir.
Agradecimentos
Agradeo a Deus pelo amor e ajuda a todo momento durante a graduao. Aos meus pais que sempre me apoiaram e me encorajaram a cursar uma faculdade. Agradecimento especial minha me, que tem sido uma forte coluna. Ao meu irmo pela compreenso e ajuda e minha irm pelo afeto. Agradeo aos colegas e professores pela conana e credibilidade que me ajudaram a prosseguir. Ao meu orientador que acreditou a todo momento que era possvel realizar este trabalho.
Sumrio
Lista de Figuras
Lista de Tabelas
Introduo
p. 11 . . . . . . . . . . . . . . . . . . . . . . . . p. 11 p. 12 p. 12 p. 13 p. 13 p. 13
1.1 1.2 1.3 1.4
Caracterizao do Problema
Motivaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Objetivos e Metas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Organizao do Documento 1.4.1 1.4.2 1.4.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Captulo 2: Reviso Bibliogrca Captulo 3: Modelo Proposto
. . . . . . . . . . . . . . . . . . .
Captulo 4: Conguraes dos Experimentos e Anlise dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13 p. 13
1.4.4
Captulo 5: Concluso e Trabalhos Futuros . . . . . . . . . . . .
Fundamentao Terica
p. 14 p. 14 p. 16 p. 17 p. 19 p. 20 p. 22 p. 22
2.1
Sistemas de Recomendao . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Tcnicas de recomendao . . . . . . . . . . . . . . . . . . . . . 2.1.1.1 2.1.1.2 2.1.1.3 2.1.2 Filtragem baseada em contedo . . . . . . . . . . . . . Filtragem colaborativa . . . . . . . . . . . . . . . . . . Filtragem hbrida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conana em sistemas de recomendao
2.2
Mapas auto-organizveis
. . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 2.2.2 2.2.3 2.2.4
Viso Geral
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 22 p. 25 p. 28 p. 28
Treinamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trabalhos relacionados . . . . . . . . . . . . . . . . . . . . . . .
Modelo proposto
p. 29 p. 29 p. 30 p. 32
3.1 3.2 3.3
Viso Geral
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Implementao do modelo Funcionamento do modelo
Experimentos e Anlise de Resultados
p. 36 p. 36 p. 37
4.1 4.2
Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Concluses e Trabalhos Futuros
p. 40 p. 40 p. 40
5.1 5.2
Concluses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diculdades e trabalhos futuros . . . . . . . . . . . . . . . . . . . . . .
Referncias
p. 42
Apndice A: Tabelas de resultados
p. 44
Lista de Figuras
1 2 3 4 5 6 7 Avaliaes de usurios no stio da Amazon.com para determinado produto. p. 16 Recomendaes da Amazon.com de acordo com o histrico do cliente. . Associao de produtos por clientes na Amazon.com . . . . . . . . . . . Crtex cerebral humano. Fonte: http://www.psiquiatriageral.com.br . . Rede SOM bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . Funo chapu mexicano. Fonte: [1] . . . . . . . . . . . . . . . . . . . . Exemplo de vizinhana, onde o instante 2 menor que o instante 1, que por sua vez menor que o instante 0 8 9 10 11 12 13 14 . . . . . . . . . . . . . . . . . . . p. 26 p. 27 p. 27 p. 31 p. 32 p. 32 p. 34 p. 35 p. 17 p. 17 p. 23 p. 24 p. 24
Resumo do algoritmo de aprendizado SOM . . . . . . . . . . . . . . . . Fluxograma do algoritmo de aprendizado das redes SOM . . . . . . . . Fluxo de execuo do modelo proposto Diagrama de classes do modelo . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
Diagrama de seqncia da fase de treinamento . . . . . . . . . . . . . . Mapa de lmes do cliente 1 Mapa de lmes do cliente 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lista de Tabelas
1 Vantagens e desvantagens das ltragens baseada em contedo e colaborativa 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21 p. 38 p. 38 p. 38 p. 39 p. 39 p. 39 p. 44 p. 44 p. 44 p. 45 p. 45 p. 45 p. 45 p. 46 p. 46 p. 46 p. 46 p. 46 p. 47 p. 47
Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 1 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 2 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme Resultados para o cliente 6 e o lme
Shangai Triad
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
The Usual Suspects Mighty Aphrodite Apt Pupil Il Postino
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pulp Fiction Richard III Postino, Il Rock, The Platoon
. . . . . . . . . . . . . . . . . . . . . . . .
Independence Day Antonia's Line The River Wild Apollo 13
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Forrest Gump
The Remains of the Day Aladdin
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pulp Fiction
Resultados para o cliente 11 e o lme Resultados para o cliente 11 e o lme
Dead Man Walking Braveheart
. . . . . . . . . . . .
22 23
Resultados para o cliente 11 e o lme Resultados para o cliente 11 e o lme
Bob Roberts
. . . . . . . . . . . . . . . . .
p. 47 p. 47
2001: A Space Odyssey
11
Introduo
1.1 Caracterizao do Problema

A tecnologia, principalmente a internet, tem mudado a forma de fazer negcios na indstria do entretenimento. V-se atualmente, em grande volume, a migrao do mercado fsico (tradicional) para o virtual. Muitas lojas disponibilizam os seus produtos venda atravs de stios na grande rede de computadores, outras, mais ousadas, possuem apenas lojas virtuais. Uma das vantagens dessas lojas o fato de, por no precisar de um ambiente fsico para vendas, o nmero de produtos oferecidos muito maior [2], oferecendo assim uma maior variedade de produtos a seus clientes. Porm esse grande volume de produtos leva a um problema conhecido como sobrecarga de informao. Diante da diversidade de produtos, o cliente que quer realizar uma compra em stios de comrcio eletrnico, freqentemente precisa de auxlio para encontrar o que deseja. Alm das ferramentas de busca, as grandes lojas virtuais disponibilizam uma forma de mostrar ao cliente informaes personalizadas sobre produtos que podem interess-lo, que o sistema de recomendao. Os sistemas de recomendao podem sugerir produtos utilizando diversos aspectos, como compras anteriores de determinado cliente ou opinies de outros clientes sobre os produtos da loja. Desta feita, os sistemas de recomendao criam lojas personalizadas para o perl de cada cliente. A personalizao fomenta algo muito importante para o negcio que a delizao do cliente [3]. Em vdeo locadoras, por exemplo, comum a diculdade de sugerir novos lmes para clientes, mesmo para os mais antigos e/ou mais assduos. Isso por no ser fcil para o funcionrio de um estabelecimento desse segmento identicar o perl do cliente a partir de lmes j locados e conseqentemente quais so suas preferncias. O cliente, por muitas vezes, segue a opinio de outras pessoas que indicam um determinado ttulo, armando ser aquele um bom lme. Opinio que, geralmente, pode no corresponder ao seu perl. Atualmente as locadoras de DVD esto disponibilizando locaes atravs de pginas na internet com a vantagem da entrega em domiclio. Fato que diculta ainda mais a obteno
1.2 Motivaes
12
de opinies de terceiros pelo cliente. Sistemas computacionais de recomendao podem trazer todas as suas vantagens para vdeo locadoras tanto fsicas como virtuais, auxiliando o cliente a fazer a melhor escolha. Isso leva a um fator diferencial da vdeo locadora na viso do cliente.
1.2 Motivaes
O que motivou o presente trabalho foi a possibilidade de tornar a escolha de um lme para locao uma experincia mais simples e interessante. O cliente poder direcionar suas escolhas a partir das informaes que o sistema ir fornecer, todas baseadas no histrico de ttulos locados na loja. Este trabalho tenta minimizar o problema da sobrecarga de informao provendo o cliente com parmetros que possam identicar o seu perl e balizar melhor sua deciso.
1.3 Objetivos e Metas

O objetivo deste trabalho desenvolver um sistema de recomendao personalizado para clientes que freqentam vdeo locadoras. O sistema visa facilitar e tornar mais
apropriada a escolha de um lme pelo cliente, diminuindo as chances de desperdcio de seu dinheiro e tempo em algo que no lhe agrada. Alm de oferecer um servio
diferenciado ao cliente, a vdeo locadora ir se beneciar, tambm, por uma muito provvel maio delizao do mesmo, j que ocorre uma personalizao do servio. Temos como
meta construir a aplicao baseada em redes neurais articiais, especicamente mapas auto-organizveis de Kohonen. Essa arquitetura permite que haja um agrupamento do histrico de locaes de um determinado cliente de maneira que este possa ter informaes visuais sobre seu histrico. Ser criado um mapa para cada cliente, como forma de
representar suas preferncias e construir um perl personalizado. Quando o cliente desejar realizar uma nova locao, esta ser indicada no mapa que ir lhe mostrar a vizinhana do novo lme em relao a seus principais vizinhos, que caracterizam os lmes locados mais relacionados ao qual ele deseja locar.
1.4 Organizao do Documento
13
1.4 Organizao do Documento

1.4.1 Captulo 2: Reviso Bibliogrca
Sero apresentados os principais conceitos em que se baseia o modelo proposto por este trabalho. O captulo inicia com uma reviso sobre sistemas de recomendao, abordando as principais tcnicas de recomendao, suas vantagens e desvantagens e modelos propostos para soluo de problemas na recomendao. A segunda parte do captulo
apresenta um tipo especial de redes neurais articiais: as redes auto-organizveis ou redes SOM ( Kohonen.
Self-organizing map ).
Ser abordado o modelo de redes SOM introduzido por
1.4.2 Captulo 3: Modelo Proposto

Descreve a proposta central do modelo, alm do algoritmo que foi desenvolvido. Neste captulo os conceitos tericos apresentados no captulo 2 so utilizados de forma clara, organizada e objetiva, visando o atingimento das metas e objetivos do trabalho.
1.4.3 Captulo 4: Conguraes dos Experimentos e Anlise dos Resultados

Neste captulo sero detalhados os experimentos realizados com o modelo e os resultados obtidos para comprovar a funcionalidade do trabalho.
1.4.4 Captulo 5: Concluso e Trabalhos Futuros

Consideraes nais, diculdades enfrentadas durante o desenvolvimento e propostas de continuidade do trabalho.
14
Fundamentao Terica
Neste captulo esto apresentados os principais conceitos que ajudaro na compreenso do documento. Primeiramente, sero abordadas as caractersticas de sistemas de recomendao estabelecidos na literatura. Tambm sero abordadas as principais tcnicas de recomendao, apontando suas vantagens, principais problemas e solues propostas por diversos autores a m de solucionar essas falhas. Posteriormente sero apresentados os mapas auto-organizveis, em especial os mapas de Kohonen, denindo sua arquitetura e o algoritmo de aprendizado.
2.1 Sistemas de Recomendao

O uso de sistemas informatizados, principalmente da internet, resulta em um grande volume de informao sendo criada e transmitida no mundo todo [4]. Um estudo realizado em 2003 por pesquisadores da Universidade da Califrnia [5] estimou que cinco exabytes de informao foram criados no ano de 2002, onde a maior parte armazenada em dispositivos magnticos, em especial discos rgidos. O comrcio, principalmente o mercado do entretenimento, tem se beneciado com a evoluo da tecnologia. As lojas no precisam mais ter espao fsico, possvel realizar vendas e fazer negociaes com segurana atravs da internet. A de 10 milhes de msicas disponveis para venda atravs de
Itunes Store possui mais download. As grandes lojas
de departamentos possuem lojas virtuais para comrcio eletrnico, algumas delas nem possuem lojas fsicas, apenas os stios na internet onde podem vender seus produtos. Casos de sucesso no Brasil so as Americanas.com (www.americanas.com.br) e o Submarino (www.submarino.com.br). Sem a necessidade de ter espao fsico ou prateleiras, os itens que podem ser colocados venda so de um nmero superior se comparado a uma loja convencional [2]. Diante de tantas possibilidades, como buscar a melhor informao? Qual produto vale a pena adquirir? Qual lme ou msica escolher? Freqentemente as pessoas procuram opinies de terceiros, como amigos e familiares que j tiveram uma experincia
15
com determinado produto ou servio [6]. Podem, ainda, procurar por resenhas em jornais e revistas, ou pedir a opinio do dono de uma livraria ou vdeo locadora. Porm, nenhum deles provavelmente vai fazer recomendaes de acordo com as preferncias pessoais do interessado. Segundo [7], esta fase, onde o consumidor realiza uma pesquisa sobre a
utilidade de um produto ou servio, chamada de busca de informaes e constitui um dos estgios relacionados ao processo de compra. Neste momento o consumidor busca
experincias de outras pessoas como amigos e familiares, ou ainda, de experincias prprias que possam auxili-lo na escolha de um produto ou servio. Da falta de ateno aos reais desejos do cliente, surgiu ento, a necessidade da criao de mecanismos que tenham a capacidade de ltrar ou recuperar rapidamente informao. Com o objetivo de facilitar a busca por informao foram criados mecanismos
que pudessem indexar documentos na internet e, rapidamente, recuper-los, trazendo ao usurio aquilo que ele precisa. Tais mecanismos so as ferramentas de busca tais como o
google
(www.google.com), que seleciona documentos na internet a partir de critrios que
o usurio expressa atravs de palavras-chave. Filtrar toda a informao recebida por um usurio, raramente uma tarefa simples e eciente. tragem criados foi o de Um dos primeiros sistemas de l-
Tapestry
[8]. Este sistema ltrava documentos enviados para a caixa
emails
de um usurio. O
Tapestry
analisa, no somente o contedo dos textos, mas
tambm o interesse que outros usurios tinham por esses documentos. Os idealizadores desse produto cunharam o termo ltragem colaborativa, propondo um sistema onde a ltragem de documentos seria realizada com auxlio de grupos de pessoas com o mesmo interesse. Atualmente, os stios de comrcio eletrnico disponibilizam para seus clientes ferramentas computacionais com o objetivo de auxili-los no momento da compra. Essas ferramentas caracterizam os sistemas de recomendao. Tais sistemas consistem em sugerir ao usurio produtos que sejam de seu interesse ajudando-o no processo de compra, alguns sistemas ainda fornecem opinies de outros clientes sobre aqueles produtos. Um dos maiores exemplos de stios de comrcio eletrnico que fazem bom uso de sistemas de recomendao a Amazon.com (www.amazon.com). Auxiliar o cliente mostrando produtos relacionados s suas preferncias uma forma de personalizao. A personalizao uma caracterstica do do
marketing
direto. Diferente
marketing
de massa, cujo objetivo alcanar o maior nmero de pessoas atravs
dos diversos tipos de mdia, o
marketing
direto tem seu foco no cliente individualmente.
Personalizar resulta na delizao do cliente, que um grande diferencial entre empresas concorrentes [3], alm disso, conquistar um novo cliente custa de cinco a dez vezes mais do que manter um antigo [9]. Um mini-curso de sistemas de recomendao ministrado
16
no V Encontro Nacional de Inteligncia Articial, no ano de 2005, por Eliseo Reategui e Slvio Cazella [10] cita algumas estratgias utilizadas pelos stios de comrcio eletrnico para recomendao de produtos:
Listas de recomendao: A loja mantm listas de produtos, como itens mais vendidos, itens que tm a melhor avaliao entre os clientes ou lista de presentes, entre outros.
Avaliao de usurios:
Consiste em se obter notas do produto por clientes que
j o adquiriram, alm dessa avaliao usurios podem deixar comentrios sobre determinado produto (Figura 1).
Suas recomendaes:
O stio oferece alguns produtos baseado em interesses do
cliente. Ento pode-se ter dois tipos de recomendao: implcita, onde o stio oferece produtos de acordo com o histrico de compras do cliente, ou explcita, onde o usurio determina quais so suas preferncias (Figura 2).
Recomendao de produtos similares: O sistema de recomendao cria associaes entre produtos avaliados pelo usurio para oferecer produtos relacionados ao que o cliente est adquirindo no momento (Figura 3).
Associao por contedo: Este tipo de recomendao feita baseado no contedo de determinado item. Por exemplo: os livros: Redes de Computadores e Programao em Java so freqentemente vendidos em conjunto.
Figura 1: Avaliaes de usurios no stio da Amazon.com para determinado produto.
2.1.1 Tcnicas de recomendao

Diversas tcnicas que pudessem identicar padres de comportamento e ltragem de informao foram denidas na literatura com o objetivo de obter recomendaes e per-
17
Figura 2: Recomendaes da Amazon.com de acordo com o histrico do cliente.
Figura 3: Associao de produtos por clientes na Amazon.com
sonalizao para o usurio. As trs tcnicas mais utilizadas em sistemas de recomendao so a ltragem baseada em contedo, a ltragem colaborativa e a ltragem hbrida, que procura conciliar as vantagens de duas ou mais tcnicas atacando seus principais problemas.
2.1.1.1
Filtragem baseada em contedo
A ltragem baseada em contedo tem suas razes no processo chamado de recuperao de informao, onde o usurio apresenta ao sistema um formulrio e recebe, como resultado, documentos associados a esses critrios [11]. O principal objetivo da recuperao de informao encontrar documentos que correspondam a determinado critrio de busca [1]. Em um sistema de recuperao de informao, o usurio fornece ao sistema palavraschave que representam seus interesses ou necessidades atuais na procura por informao. O sistema ento, realiza um busca por essas palavras em documentos armazenados numa base e retorna os documentos mais relevantes para os critrios informados. A ltragem de informao inspeciona todo novo item que recebido selecionando aqueles relacionados a seus interesses. Assim, a ltragem de informao, mantm o perl do usurio atualizado e demonstra interesses de longo prazo, pois continua realizando a
18
seleo de documentos de acordo com as preferncias identicadas no perl. Por outro lado, a recuperao de informao, que seleciona documentos de acordo com um critrio de pesquisa, representa interesses de curto prazo [12], ou seja, interesses momentneos traduzidos pelos critrios de busca do usurio. Os atuais sistemas de recomendao tm sua origem nos sistemas de ltragem de informao. Em 1982, Peter Denning [13] j apontava para o problema do volume de informao produzida e transmitida atravs de sistemas computacionais e a facilidade de compartilhamento de informaes pela internet, sendo necessria uma ateno maior para o processo de controlar e ltrar toda essa informao. Filtragem de informao e ltragem baseada em contedo so termos semelhantes e ambos possuem o mesmo objetivo: ltrar itens atravs da anlise do seu contedo [1]. Na ltragem baseada em contedo, as recomendaes so feitas apenas baseadas em um perl do usurio previamente construdo. Esse perl individual e determinado a partir da anlise do contedo de itens que o usurio qualicou ou mostrou algum interesse no passado [11]. Quando o usurio de um stio de comrcio eletrnico, por exemplo, entra na pgina da loja e revela suas necessidades atravs de palavras-chave na ferramenta de busca, ele est realizando uma recuperao de informao, pois o sistema apresenta produtos que satisfaam simplesmente os critrios apresentados no momento. Quando este mesmo stio armazena o perl do cliente e apresenta produtos semelhantes aos que este usurio mostrou interesse no passado, caracteriza uma ltragem de informao. Uma das tcnicas mais populares para representao dos itens em sistemas de ltragem baseada em contedo a TF-IDF (Term-frequency Inverse-Document-Frequency). Esta tcnica realiza comparao e clculo de similaridade a partir da freqncia de ocorrncia de palavras-chave nos textos [3]. Para criao do perl do usurio, normalmente so utilizadas tcnicas de computao inteligente, que podem extrair informaes do comportamento de determinado usurio, por exemplo, algoritmos de classicao podem identicar e fazer a diviso entre itens que o usurio gosta e itens que ele no gosta [1]. O
feedback
muito importante na
fase de aprendizado, podendo ser explcito, quando o usurio qualica o item que lhe foi oferecido, ou implcito, quando o usurio demonstra interesse no item nalizando com a compra [4]. Exemplos de sistemas que utilizam a ltragem baseada em contedo so o NewsWeeder [14] e o InfoFinder [15]. Dentre as vantagens da utilizao de ltragem baseada em contedo, podem-se citar: (i) no necessrio que um novo item tenha algum tipo de qualicao, bastando apenas que este seja semelhante ao perl do usurio e (ii) por avaliar a semelhana entre todos
19
os itens, a ltragem baseada em contedo no se restringe a itens j avaliados por outros usurios. Os principais problemas apresentados pela ltragem baseada em contedo so: (i) as representaes de contedo de um item no conseguem capturar alguns aspectos, como qualidade de um texto, no caso sistemas de recomendao de documentos, ou informaes de multimdia, no caso de sistemas que recomendam pginas da internet [11]; (ii) o segundo ponto negativo da ltragem baseada em contedo a superespecializao do sistema. A diversidade de itens recomendados ca restrita similaridade de itens avaliados pelo usurio, sem conseguir recomendar itens no relacionados que poderiam ser de interesse do cliente.
2.1.1.2
Filtragem colaborativa
A ltragem colaborativa a tcnica de recomendao mais comum e a mais largamente utilizada [16]. A abordagem da ltragem colaborativa consiste em recomendar
itens baseados na similaridade entre usurios, diferentemente da ltragem baseada em contedo, que realiza similaridade entre itens. Basicamente, formado um conjunto de usurios denominados vizinhos mais prximos, que possuem itens classicados de forma semelhante ao usurio alvo. Os itens que sero recomendados so itens que foram bem qualicados por esse grupo de usurios, partindo do pressuposto que esse mesmo grupo possui preferncias em comum com o usurio alvo. A priori, neste tipo de tcnica nenhuma informao sobre os itens em si conhecida, as recomendaes so baseadas na semelhana entre os usurios [11]. Segundo descreve Burke [16]: O perl de um usurio num sistema colaborativo consiste em um vetor de itens e suas qualicaes, que aperfeioado na medida em que o usurio interage com o sistema ao longo do tempo. Um dos primeiros sistemas a utilizar a ltragem colaborativa foi o cionado anteriormente neste trabalho no incio da seo 2.1. A idia
Tapestry [8], mendo Tapestry fazer
com que as pessoas colaborem entre si para realizar ltragens descrevendo suas percepes referentes a documentos que receberam. Essas percepes so armazenadas em comentrios ou anotaes que podem ser consultadas por qualquer outro usurio. Uma forma de utilizao desse sistema seria um usurio buscar documentos que outro determinado usurio aprovou. Os principais representantes de sistemas que utilizam ltragem colaborativa, alm do
Tapestry, so o GroupLens
[17],
Ringo
[18] e
Bellcore
[19].
A ltragem colaborativa tambm possui vantagens e problemas identicados por diversos especialistas na literatura. Algumas vantagens deste tipo de tcnica so:
20
Como as recomendaes so baseadas em avaliaes de outros usurios possvel tratar diferentes tipos de contedo, no somente documentos textuais.
A qualidade das recomendaes superior se comparado a sistemas que utilizam ltragem baseada em contedo. A justicativa est no fato de sistemas automa-
tizados no serem ecientes em determinar a qualidade de um produto analisando apenas seu contedo. A qualidade de um item est implcita na avaliao de outros usurios, sendo possvel produzir recomendaes de melhor qualidade.
Algumas das desvantagens da ltragem colaborativa so:
Se um novo item introduzido no sistema, no ser recomendado at que um dos usurios o avalie. O que traz outra conseqncia: se o nmero de usurios do sistema reduzido em relao quantidade de itens, ocorre um problema de cobertura, ou seja, a coleo de itens que podem ser recomendados ser resumida.
Outro problema em sistemas utilizando ltragem colaborativa ocorre quando h um usurio cujas preferncias diferem dos demais usurios, conhecidos como ovelhasnegras. Neste caso, no h vizinhos semelhantes ao usurio ativo, ocasionando
recomendaes que no correspondem s preferncias desse usurio.
2.1.1.3
Filtragem hbrida
A abordagem da ltragem hbrida consiste em associar duas ou mais tcnicas de recomendao com o intuito de unir suas vantagens e, simultaneamente, tratar os principais problemas inerentes a cada uma delas. Observando um resumo das vantagens e desvantagens das ltragens colaborativa e baseada em contedo, apresentado na Tabela 1, pode-se perceber que essas duas abordagens so complementares. Fato que motivou a criao de sistemas hbridos [11]. Burke [16] realizou um estudo sobre sistemas de recomendao hbridos. Neste artigo ele aponta sete combinaes possveis entre tcnicas de recomendao:
1. Ponderado: A avaliao de um item a combinao do resultado de todas as tcnicas presentes no sistema. O sistema A proposta do
P-Tango
[20] um exemplo de uso desta tcnica.
P-Tango
combinar as recomendaes da ltragem baseada em
contedo e da ltragem colaborativa atravs de mdias ponderadas. Os pesos so ajustados de acordo com o peso de cada recomendao, isto , ao passo que o nmero
21
Tabela 1: Vantagens e desvantagens das ltragens baseada em contedo e colaborativa

Filtragem colaborativa Filtragem baseada em contedo
Vantagens possvel tratar diferentes tipos de contedo A qualidade de um item est implcita na avaliao
Desvantagens Problema da primeira avaliao
Vantagens No tenha necessrio algum tipo que um novo item de qualicao
Desvantagens Trata somente contedo textual
Usurio negra
ovelha-
No se restringe a itens j avaliados por outros usurios
Superespecializao do sistema
de usurios e avaliaes de um determinado item cresce, a ltragem colaborativa tem seu peso aumentado; 2. Alternado: O sistema se utiliza de um critrio para alternar entre as tcnicas de recomendao. Por exemplo, se uma ltragem baseada em contedo no retorna
resultados satisfatrios, ento a recomendao feita com a ltragem colaborativa; 3. Misto: Neste tipo de combinao, o sistema apresenta recomendaes de diferentes tcnicas numa mesma listagem. O sistema PTV [21] utiliza a ltragem baseada
em contedo baseado nas descries de programas de TV e a ltragem colaborativa baseado na preferncia de outros usurios, o resultado das recomendaes uma combinao dos resultados das duas ltragens; 4. Combinao de caractersticas: Trata informaes de um tipo de recomendao
como simples caractersticas que so utilizadas por outra tcnica para retornar recomendaes mais signicativas. [22] apresenta um sistema de recomendao de
lmes onde as informaes da ltragem colaborativa (denominadas, neste artigo, caractersticas colaborativas) so inuenciadas pelo contedo agregado aos lmes. Desta forma, possvel agrupar usurios semelhantes e que gostem do mesmo gnero de lmes; 5. Cascata: Nesta combinao, uma tcnica, primeiramente, produz suas recomen-
daes e uma segunda tcnica usada para renar os resultados da anterior; 6. Acrscimo de caracterstica: Primeiramente uma tcnica aplicada para gerar classicaes para um item, ento estas informaes so incorporadas na tcnica seguinte; 7.
Meta-level :
Esta abordagem utiliza o modelo criado por uma tcnica como entrada
para outra tcnica. No acrscimo de caracterstica, um modelo gera caractersticas
2.2 Mapas auto-organizveis

para serem usadas como entrada para outro modelo, na abordagem modelo completo utilizado como entrada para outro modelo.
22
meta-level
2.1.2 Conana em sistemas de recomendao

O objetivo central dos sistemas de recomendao levar o cliente de uma dada loja a fazer melhores compras, tornando o mesmo mais satisfeito com o servio. Para que
o processo de recomendao seja realmente ecaz importante convencer o usurio de que as recomendaes so relevantes e que esto relacionadas satisfao do cliente [9]. Prover argumentos e explicaes sobre os dados que geraram a recomendao agrega maior conana ao sistema. A transparncia em sistemas de recomendao melhora o
entendimento pelo cliente e este se mostra mais propenso a aceitar as recomendaes [1].

O principal objetivo das redes neurais articiais (RNAs) aprender com o ambiente em que esto inseridas para adquirirem a capacidade de adaptao s mudanas nesse ambiente. O tipo de aprendizado das redes neurais pode ser dividido em duas classes: O mtodo mais comu-
aprendizado supervisionado e aprendizado no-supervisionado.
mente utilizado o aprendizado supervisionado, onde, alm da entrada, as sadas desejadas para a rede so fornecidas por um supervisor externo [23]. A tarefa ento fazer o ajuste de parmetros de forma que a rede possa representar novas entradas corretamente. O mtodo de aprendizado supervisionado se limita, porm, a aplicaes onde tanto os dados de entrada como as respostas desejadas so conhecidos. Algumas aplicaes necessitam que o treinamento seja realizado sem um supervisor para subsidiar o treinamento da rede, todo o conhecimento deve ser adquirido somente atravs das entradas. Diversos algoritmos foram desenvolvidos para treinar redes sem superviso, este trabalho ir tratar exclusivamente de um deles: os modelos
self-organizing
(ou auto-organizveis).
2.2.1 Viso Geral

Os mapas
self-organizing,
SOM (
Self-organizing maps )
foram propostas por Teuvo
Kohonen [24]. A estrutura bsica dessas redes formada por uma camada de entrada, constituda de padres fonte, e uma camada de sada (geralmente uma grade 2D). No h camadas escondidas (hidden-layer) no modelo de mapas auto-organizveis como em
23
outros tipos de redes neurais. A inspirao para o desenvolvimento das redes SOM est no mapa topologicamente organizado do crtex cerebral de animais mais desenvolvidos. O crtex cerebral humano dividido de acordo com funes especcas, como fala e viso (Figura 4). Desta forma, neurnios que lidam com o mesmo tipo de estmulo esto localizados prximos uns dos outros. O modelo de Kohonen consiste em um mapa, onde os nodos ou neurnios articiais que esto topologicamente prximos respondem a estmulos semelhantes, ou seja, padres de entrada que possuem similaridade entre si.
Figura 4: Crtex cerebral humano. Fonte: http://www.psiquiatriageral.com.br
Na arquitetura de uma rede SOM, os nodos so dispostos em uma grade ou reticulado, geralmente bidimensional ou unidimensional, com raras excees, h redes tridimensionais ou n-dimensionais. No modelo bidimensional, os neurnios esto organizados em linhas e colunas, como mostra a Figura 5. Cada nodo possui um conjunto de pesos que representam as sinapses do neurnio biolgico, esses pesos so ajustados de maneira que o nodo represente um dado padro de entrada. Os nodos de uma rede SOM funcionam como um extrator de caractersticas, quanto mais o vetor de pesos de um neurnio for semelhante a um padro de entrada, maior ser sua sada e mais representativo este nodo ser para a entrada [23]. As redes SOM utilizam um processo de aprendizado competitivo, no qual os neurnios da camada de sada competem entre si para representar um dado padro de entrada, assim, apenas um neurnio de sada ou neurnio por grupo estar ativo a qualquer instante de tempo. O neurnio que se sobressai entre os outros para representar a entrada
chamado de vencedor e a competio chamada de tudo.
winner-takes-all,
o vencedor leva
Para implementar esta competio so normalmente utilizadas conexes laterais O modelo para esse tipo de conexo tambm
inibitrias entre os neurnios de sada.
provm das clulas do crtex cerebral, onde a ordenao topolgica dos neurnios se
24
Figura 5: Rede SOM bidimensional
d graas ao
feedback
lateral entre as clulas. Em RNAs este
feedback
modelado por
uma funo chamada chapu mexicano. Segundo esta funo, as interaes laterais entre os neurnios podem ser divididas em trs regies distintas, como mostrado na Figura 6: (1) rea excitatria, vizinhos que esto mais prximos ao neurnio atual; (2) rea
inibitria, vizinhos que esto fora da rea anterior, mas includos numa segunda rea; e (3) rea levemente excitatria, que rodeia a rea inibitria, esta terceira rea geralmente ignorada.
Figura 6: Funo chapu mexicano. Fonte: [1]
Para simular o efeito da funo chapu mexicano, a rede SOM utiliza o conceito de vizinhana topolgica dos neurnios vencedores. Quando um neurnio vence a competio e o escolhido para representar o padro de entrada, ele tem seus pesos ajustados de forma a se aproximar mais da entrada, com o conceito de vizinhos topolgicos, alm do neurnio vencedor ter seus pesos ajustados, os neurnios localizados na vizinhana tambm tm seus pesos ajustados.
25
2.2.2 Treinamento
Como armado anteriormente, o treinamento de redes SOM competitivo e nosupervisionado. Primeiramente os pesos dos neurnios do mapa so inicializados com
valores aleatrios, que sero ajustados ao longo do algoritmo de aprendizado, de forma que se aproximem dos padres de entrada. Em seguida apresentado um padro
rede, neste momento a rede dene o neurnio que melhor representa esta entrada, caracterizando o neurnio vencedor. Para a escolha do neurnio vencedor denida uma funo de ativao que baseada na distncia entre o peso do neurnio e o vetor de entrada. A funo de ativao mais conveniente para a rede SOM baseada na distncia euclidiana [25], apresentada na equao 2.1:
yj =
i=1
onde
xi wji
(2.1)
yj
representa a sada do neurnio
j , x o vetor de entrada e wji
o peso do neurnio
associado ao elemento de entrada
xi .
O neurnio que possui a menor distncia escolhido como o vencedor e ir representar o padro de entrada. Aps essa escolha d-se incio ao processo de atualizao dos pesos. Nesta fase o neurnio vencedor e os vizinhos denidos pelo raio ou rea de vizinhana atualizam seus pesos. A m de implementar a interao lateral, denida uma regio de vizinhana
Nc ,
tendo como centro o neurnio
c,
estabelecido como vencedor pela funo
de ativao.
Todos os neurnios internos a essa vizinhana tero os pesos atualizados,
enquanto neurnios fora do limite sero deixados intactos. Inicialmente, o valor do raio ou tamanho de
Nc
deve ser alto, abrangendo, aproximadamente, quase todo o mapa e depois
devendo diminuir monotonicamente no tempo [25]. Tal valor pode, ao nal do processo, abranger apenas o neurnio central (Nc
= {c}),
como se pode observar na Figura 7. A
equao 2.2 mostra como so atualizados os pesos do neurnio vencedor e dos neurnios vizinhos.
wji (t + 1) =
onde
wji (t) + (t)(xi (t) wji (t)), wji (t),

se
se
j Nc (t)
j Nc (t) / 0 < (t) < 1,

que decresce no tempo.
(2.2)
(t)
o valor da taxa de aprendizado
Como alternativa pode ser introduzida uma funo de vizinhana do neurnio vencedor, denido pela seguinte equao, com (neurnio central ou vencedor) e
rc
rj
como as coordenadas dos neurnios
j,
respectivamente:
26
hci (t) = h0 exp( ri rc

onde
/ 2 )
(2.3)
h0 = h0 (t)
= (t)
so funes que devem decrescer no tempo. O parmetro
(t)
corresponde ao raio de
Nc (t).
O ajuste de pesos passa ento a ser calculado desta forma:
wji (t + 1) = wji (t) + hci (xi (t) wji (t))
(2.4)
Figura 7: Exemplo de vizinhana, onde o instante 2 menor que o instante 1, que por sua vez menor que o instante 0
Segundo estudos e experincias na escolha dos parmetros, Kohonen [25] recomenda que o valor inicial de
(t)
(taxa de aprendizado da rede) deve estar prximo de 1 e
decair monotonicamente durante os primeiros 1000 ciclos da fase de aprendizado, porm mantendo o valor acima de 0,1. A regra para o decrscimo de
(t)
pode ser uma funo
linear, exponencial ou inversamente proporcional a t, por exemplo:
(t) = 0.9(1t/1000).
durante esta fase inicial do treinamento que ocorre a fase de ordenao da rede. Nas fases seguintes ocorre o ajuste no da rede, chamado de fase de convergncia. O nmero de ciclos da fase de aprendizado deve ser razoavelmente grande. Uma regra emprica que este nmero deva ser 500 vezes maior que o nmero de neurnios na rede. O tamanho da vizinhana de um neurnio no pode ser muito pequeno inicialmente, pois o mapa no teria uma boa ordenao global. A princpio o raio ou tamanho inicial da vizinhana pode ser maior que a metade do tamanho do mapa. A Figura 8 apresenta um resumo da execuo do algoritmo de aprendizado das redes SOM e a Figura 9 apresenta o uxograma do funcionamento deste processo.
27
Figura 8: Resumo do algoritmo de aprendizado SOM
Figura 9: Fluxograma do algoritmo de aprendizado das redes SOM
28
2.2.3 Aplicaes
As redes SOM foram inicialmente idealizadas para identicar relaes no-lineares entre dados apresentados em mais de duas dimenses. Com a popularidade do algoritmo, diversas aplicaes foram desenvolvidas e problemas solucionados com o uso dos mapas auto-organizveis. Anlise de dados exploratrios, reconhecimento de padres e recon-
hecimento e anlise de fala esto entre as reas de aplicao de redes SOM. Um exemplo de aplicao desenvolvida pelo prprio Kohonen na rea de reconhecimento de fala o
neural phonetic typewriter
[26]. Outra aplicao que merece destaque o WEBSOM [27],
no qual Kohonen tambm participou do desenvolvimento. WEBSOM um mtodo para organizao de grandes colees de documentos de texto. Baseado em redes SOM, o
WEBSOM organiza documentos num reticulado bidimensional de forma que documentos relacionados apaream prximos.
2.2.4 Trabalhos relacionados

Existem algumas aplicaes na literatura de sistemas de recomendao que utilizam redes SOM. Esta seo se dedica ao comentrio de duas das mais importantes. Graef e Schafer [28] descrevem duas abordagens baseadas em ltragem colaborativa usando redes SOM e ART2. Eles investigaram o desempenho dos dois modelos avaliando tempo de resposta, qualidade das predies e adaptatividade. A abordagem utilizando redes SOM consiste em agrupar usurios no mapa baseado na semelhana de suas avaliaes sobre lmes. Um sistema de recomendao hbrido combinando ltragem colaborativa com SOM apresentado por Lee [29]. Essa abordagem utiliza redes SOM para criar agrupamentos de usurios de acordo com informaes demogrcas, como sexo e idade e preferncias por diversos gneros de lmes. A idia aplicar ltragem colaborativa dentro de agrupamento ao qual o usurio pertence. Estas abordagens diferem do modelo proposto por este trabalho, que prope a criao de mapas individuais que contm agrupamentos de lmes locados por um cliente de vdeo locadora, caracterizando o seu perl no que diz respeito a suas preferncias pessoais.
29
Modelo proposto
Este captulo descreve a prova de conceito proposta neste trabalho. Ser detalhado o algoritmo desenvolvido, bem como detalhes de sua implementao e o funcionamento do mesmo.
3.1 Viso Geral

O modelo para recomendao desenvolvido leva em considerao a limitao de vdeo locadoras no que tange aos conceitos gerais de sistemas de recomendao comuns. As
informaes que esto disponveis num ambiente de locadora de lmes consideram somente o cliente como indivduo e no um grupo de clientes que podem contribuir juntamente para gerar recomendaes. Portanto no h o conceito de avaliao de um item pelo usurio. Nos sistemas de locadoras comuns no existe um mecanismo onde o cliente possa dar sua nota para um lme de forma que outros clientes possam acompanhar essas avaliaes e ter um parmetro para a escolha de determinado ttulo. Existe apenas a opinio presencial de clientes que queiram express-las ou quando o funcionrio da loja educadamente questiona sobre a satisfao do cliente com relao a determinado lme. Nenhuma informao
armazenada num banco de dados, nem realizado um levantamento das opinies de diversos clientes, com o propsito de identicar os melhores lmes. A proposta deste trabalho desenvolver um sistema que, baseado no histrico de locaes de um cliente, ele possa auxiliar a conduo do processo de uma escolha satisfatria no momento de locar um novo ttulo. O sistema se baseia unicamente no contedo de informao acerca dos lmes que j foram locados por um determinado cliente, informaes essas que podem ser facilmente obtidas no banco de dados da locadora. Como mencionado anteriormente, no existem avaliaes de clientes sobre os lmes nem parmetros que determinem as preferncias desses clientes. Portanto, o modelo proposto no ambiciona
gerar uma lista de recomendaes diretas com ttulos para o cliente, apenas auxili-lo de forma a realizar uma escolha consciente baseado nas informaes contidas nos lmes. O
3.2 Implementao do modelo
30
modelo utiliza redes auto-organizveis, pois este algoritmo desempenha bem a funo de agrupamento e vizinhana, para que o cliente tenha uma percepo melhor da relao entre os lmes que j assistiu com os que deseja locar atualmente. O objetivo especco do trabalho realizar uma prova de conceito para o uso de redes SOM na recomendao de lmes a ser implementado em vdeo locadoras como forma de personalizao da loja para o cliente, tornando mais prazeroso e simplicado o ato da escolha do lme a ser locado. A personalizao, como comentado anteriormente, torna o cliente mais satisfeito e mais assduo. O modelo proposto consiste em uma rede SOM que, quando treinada, composta por lmes contidos no histrico de um cliente (topologicamente organizados). Propo-
mos ento, um mapa SOM para cada cliente; e no um mapa s para toda a locadora. Essa deciso de projeto respeita a personalizao, objetivo principal deste trabalho. A rede ir distribuir os ttulos no mapa bidimensional, agrupando-os de acordo com semelhanas entre informaes fornecidas sobre os lmes. Nesta fase ocorre o aprendizado do comportamento do cliente com relao s escolhas de lmes. Aps o treinamento da rede, os lmes locados por um cliente estaro distribudos no mapa. O cliente deve, ento selecionar um lme do acervo da locadora e apresentar ao seu mapa individual. A rede ir calcular a posio deste novo lme e ir mostrar ao usurio trs lmes que estejam prximos ao primeiro, determinando que h semelhanas entre esses quatro ttulos. Esta uma forma de auxiliar o cliente, pois ele pode avaliar se ir gostar ou no do lme, partindo da satisfao que teve ao assistir os outros trs. A Figura 10 mostra o uxo bsico da execuo do sistema. A ferramenta foi modelada de forma a se integrar ao sistema de informao da vdeo locadora com o objetivo de ser um diferencial da locadora para corresponder demanda dos clientes na busca de informaes que os auxiliem no processo de escolha e locao de novos lmes. O projeto proposto, ento, no pretende realizar o gerenciamento do
estabelecimento como um todo.

A implementao da rede SOM utilizada no modelo deste trabalho foi feita baseada no algoritmo original proposto por Kohonen, como descrito no Captulo 2. A linguagem utilizada para desenvolvimento foi C# com o Microsoft ( Visual Studio 2008 como IDE
Integrated Development Environment
ou Ambiente Integrado de Desenvolvimento) de
31
Figura 10: Fluxo de execuo do modelo proposto
programao.
A escolha desta tecnologia se justica por ser uma linguagem de fcil
implementao e ser mais largamente utilizada pelo autor deste trabalho. A Figura 11 mostra os diagramas de classes do modelo implementado. MapaSOM uma classe que comporta todos os neurnio da rede e recebe o conjunto de entradas para ser apresentado durante o treinamento. Cada neurnio possui coordenadas
y,
determinando sua
posio no reticulado do mapa e o vetor de pesos que so inicializados aleatoriamente e ajustados durante a fase de aprendizado. Cada padro de entrada tem um conjunto de caractersticas que so extrados do banco de dados de lmes, alm de um objeto neurnio que caracteriza o neurnio vencedor para representar o padro. A Figura 12 mostra o diagrama de seqncia do programa durante a fase de treinamento. O treinamento inicia criando um mapa com um determinado nmero de neurnios, cujos pesos so inicializados com valores aleatrios. Aps a fase de inicializao do mapa, tem incio o algoritmo de aprendizado propriamente dito. Ento so apresentados os
padres de entrada que representam os lmes presentes no histrico do cliente e, para cada um deles, selecionado o neurnio que melhor representa uma dada entrada. Este neurnio tem seus pesos atualizados de forma a melhor reetir as caractersticas da entrada. O neurnios contidos no raio de vizinhana do neurnio vencedor tambm tm seus pesos atualizados. Assim que todos os padres de entrada, ou seja, todos os ttulos do histrico, forem apresentados, iniciado um novo ciclo de treinamento. Quando o nmero de ciclos atingir um determinado limite, o treinamento encerrado. O valor do limite de
3.3 Funcionamento do modelo
32
Figura 11: Diagrama de classes do modelo
ciclos segue o valor proposto por Kohonen, como mencionado na seo 2.2.2.
Figura 12: Diagrama de seqncia da fase de treinamento

O algoritmo inicia obtendo os padres de entrada a serem utilizados na fase de treinamento, que so os lmes do histrico de locaes do cliente. A ferramenta extrai os
ttulos dos lmes locados pelo cliente e busca no acervo da locadora as informaes complementares para cada ttulo. Essas informaes sero utilizadas como vetor de entrada para cada padro de entrada durante a fase de aprendizado da rede. Logo em seguida determinado o tamanho do mapa, ou seja, o nmero de neurnios presentes na rede.
33
O vetor de pesos de cada um desses neurnios inicializado com valores aleatrios e determinado o raio de vizinhana inicial. Empiricamente, um valor inicial adequado para a vizinhana de 60% do tamanho total do mapa. Aps a fase de inicializao do mapa, segue-se a fase de aprendizado ou treinamento. A fase de treinamento inicia ao serem apresentados rede os padres de entrada. Cada padro de entrada possui um vetor de caractersticas que identica unicamente um lme. Ento calculado o neurnio que mais se aproxima de cada padro, denominado como neurnio vencedor. O clculo para determinar o neurnio vencedor segue a funo da
distncia euclidiana como descrito na seo 2.2.2 pela equao 2.1. Este clculo realizado atravs da distncia euclidiana entre o vetor de caractersticas de um padro de entrada e o vetor de pesos de um neurnio. Quanto mais similar um neurnio for de uma entrada menor ser a distncia entre os dois, caracterizando o neurnio vencedor. Os pesos do neurnio selecionado so atualizados, assim como os pesos de neurnios em seu raio de vizinhana. Como dito anteriormente o raio de vizinhana inicial igual a 60% do tamanho do mapa, esse raio decrescido monotonicamente segundo a equao 2.3 mostrada na seo 2.2.2. Esses passos so repetidos at que o nmero determinado de ciclos seja alcanado. No nal da fase de treinamento todos os lmes presentes no
histrico do cliente esto distribudos topologicamente no mapa que representa, ento, o perl do usurio. Com a rede treinada, inicia-se a fase de teste. Neste passo sero mostrados novos
ttulos de lmes rede, representando lmes que o cliente deseja alugar. Ao ser apresentado a um novo padro, a rede ir calcular o neurnio que melhor representa este padro, da mesma maneira que realizado na fase de aprendizado. A diferena aqui est em que os pesos do neurnio vencedor no sero mais ajustados, ele apenas selecionado como representante daquela entrada no mapa topolgico do perl do cliente. O ajuste de pesos que caracteriza o aprendizado da rede, portanto nesta fase no realizado o clculo de ajuste e de vizinhana. Aps o clculo do neurnio vencedor para o novo lme, o algoritmo ir determinar quais so os trs neurnios mais prximos daquele. Para isso calculada a distncia
entre dois pontos no plano bidimensional. Os trs neurnios mais prximos do vencedor representam padres de entrada que so os lmes que mais se assemelham ao lme representado pelo neurnio vencedor. O sistema ento auxilia o cliente na deciso mostrando que o lme que ele deseja locar tem relao de semelhana com outros trs que ele j locou no passado. Dependendo da satisfao do usurio com os trs lmes que foram
34
mostrados, ele decide se ir mesmo locar o lme escolhido ou no. Prover a informao da relao entre os lmes agrega conana ao sistema, pois o cliente saber a origem das recomendaes apresentadas. Para visualizao do mapa, a ferramenta cria um grco bidimensional plotando os lmes do histrico e os novos lmes que o cliente deseja locar. As Figuras 13 e 14 mostram exemplos desse grco para o cliente 1 e cliente 2, respectivamente. Cada ponto do grco representa um neurnio contido no mapa que foi construdo na fase de treinamento. Os pontos de cor laranja representam os ttulos presentes no histrico do cliente, os pontos de cor vermelha so os novos lmes que o cliente deseja locar e os de cor azul so pontos que no representam nenhum lme. Navegando pelo mapa o cliente pode aproximar o a um dos pontos e ser mostrado um
mouse
tootip
(legenda) contendo o ttulo do lme que o
ponto representa, desta forma o cliente pode procurar os lmes que esto mais prximos dos novos lmes. Os grcos apresentados foram criados utilizando a ferramenta
Visire,
que cria
grcos utilizando a tecnologia WPF (Windows Presentation Foundation) presente na plataforma .NET da Microsoft . O WPF um subsistema grco do .NET Framework, ou seja uma tecnologia que permite a criao de interfaces de apresentao para aplicativos desenvolvidos sob a plataforma .NET.
Figura 13: Mapa de lmes do cliente 1
A nvel de experimentos e avalizao de resultados, foram gerados arquivos de texto
35
Figura 14: Mapa de lmes do cliente 2
contendo as informaes dos novos lmes e dos trs lmes que mais se assemelham a eles. Estes experimentos sero detalhados no Captulo 4.
36
Experimentos e Anlise de Resultados
Este captulo tem como objetivo descrever os experimentos realizados e resultados obtidos a partir da implementao do modelo descrito no Captulo 3.
4.1 Base de dados

Como mencionado no captulo anterior, o objetivo deste trabalho auxiliar clientes na escolha de lmes em uma vdeo locadora. Foi desenvolvida uma rede auto-organizvel, segundo o modelo de Teuvo Kohonen [25], com o m de aprender o comportamento do usurio e poder gui-lo em sua escolha. Para a realizao dos testes foi utilizada uma
base de dados real, extraindo as caractersticas que mais se adequam ao modelo proposto. Inicialmente estava sendo negociada a obteno dos dados de uma vdeo locadora da cidade, mas devido a entraves na poltica de segurana da empresa que fornece o sistema para esta locadora, no foi possvel coletar os dados reais para teste de campo do sistema. A alternativa encaminhada foi utilizar uma base, tambm real, disponvel abertamente na internet. A base de dados utilizada foi a
MovieLens Data Set (http://www.grouplens.org),

Essa base conta com 100.000
fornecida pelo grupo de pesquisa GroupLens Research.
avaliaes para 1682 lmes por 943 usurios. A base MovieLens foi construda a partir do stio de recomendaes de lmes: movielens.org. A base de dados MovieLens assim organizada:
Arquivo u.data:
arquivo contendo 100.000 avaliaes de 943 usurios para 1682
lmes. Cada usurio avaliou, no mnimo 20 ttulos.
Arquivo u.item: contm informaes sobre os lmes, ttulo, data de lanamento e gnero.
Arquivo u.genre: lista de gneros de lmes.
4.2 Resultados
37
Arquivo u.user: informao demogrca sobre os usurios: nome, idade, gnero, prosso.
Arquivos de treinamento e teste: a base u.data dividida em dois tipos de arquivos com a relao de 80%/20% para treinamento e teste, respectivamente.
Para o escopo deste trabalho, no sero utilizadas as avaliaes dos usurios durante a fase de treinamento, pois fugiria ao objetivo que fazer recomendaes em ambientes de locadoras de lmes reais, onde no h o conceito de avaliao pelos clientes. O ambiente de experimentos foi assim determinado: Da base de lmes foram extrados o nmero de identicao nico do lme (ID), ttulo do lme, ano de lanamento, gnero e nmero de vezes que aparece no arquivo de avaliaes. Este ltimo parmetro representa, para a realidade do presente trabalho, o nmero de locaes totais do lme na locadora. O arquivo de avaliaes dos usurios representa as locaes de cada cliente, portanto o mapa construdo cruzando as informaes destas duas tabelas. O arquivo de testes representa os lmes que o cliente deseja locar, ento esses padres so apresentados ao sistema com a rede j treinada.
4.2 Resultados
Foram criadas tabelas para visualizao e estudo dos resultados obtidos com os experimentos realizados. O primeiro ttulo apresentado nas tabelas o lme que o cliente deseja locar, os trs seguintes so os vizinhos mais prximos no mapa, que indicam ser semelhantes ao primeiro. Para a avaliao dos resultados foi considerada a nota ou avaliao que o
usurio deu ao lme. Por exemplo, na Tabela 2, o cliente 1 deseja locar o lme
Shangai
Triad. Quando apresentado este lme rede, o cliente obteve como resposta os lmes: The White Balloon, Belle de jour e Jean de Florette, evidenciando factualmente que estes
lmes tm similaridades com o primeiro. Observando os ttulos que foram mostrados como relacionados, o cliente ir avaliar se vale a pena alugar o lme
Shanghai Triad.
Para
avaliar esse resultado, observa-se a coluna Avaliao da tabela, os lmes relacionados possuem avaliao de 4, 3 e 5, respectivamente, indicando que o cliente teve satisfao razovel a tima ao assist-los. Portanto, a interpretao desse resultado que o lme
4.2 Resultados
38
para o lme
Shanghai Triad provavelmente ir agradar o cliente. A avaliao Triad foi de 5, ou seja, a satisfao do usurio foi muito boa.
Tabela 2: Resultados para o cliente 1 e o lme
Ttulo Gnero Ano
Shanghai
Shangai Triad
A valiao
Nmero de locaes
Shanghai Triad White Balloon, The Belle de jour Jean de Florette
Drama Drama Drama Drama
1995 1995 1967 1986
20 7 30 55
5 4 3 5
O cliente 1 tem 135 ttulos em seu histrico, quantidade que rendeu um bom aprendizado para a rede. De forma geral, foi observado que a rede conseguiu gerar um bom perl para este cliente. A tabela 3 mostra outro resultado para o cliente 1, a anlise feita de modo anlogo tabela anterior. O primeiro ttulo representa o lme que o cliente ainda no locou, os trs seguintes so os lmes mais similares ao primeiro. Observa-se que eles possuem alta similaridade em relao ao gnero e ao ano de lanamento. A satisfao do cliente conrmada pela avaliao que deu aos lmes.

Ttulo Gnero Ano
The Usual Suspects

A valiao
Nmero de locaes
Usual Suspects, The Seven (Se7en) Copycat Four Rooms
Crime/Suspense Crime/Suspense Crime/Drama/ Suspense Suspense
1995 1995 1995 1995
211 195 69 75
5 2 3 4
A Tabela 4 mostra o resultado para o cliente 2, desejando alugar o lme
Mighty
Aphrodite.
Neste exemplo a rede tambm teve um bom desempenho em relao a encon-
trar lmes fortemente relacionados e que representam as preferncias do cliente. O cliente 2 possui apenas 40 ttulos no seu histrico. Observando a coluna Avaliao, que representa a satisfao do usurio, pode-se perceber que o sistema obteve bons resultados para este lme. Considerando esta mtrica, os resultados para o cliente 2 foram, na maioria, satisfatrios, tendo o sistema errado poucas vezes no agrupamento dos ttulos.

Ttulo Gnero Ano
Mighty Aphrodite
A valiao
Nmero de locaes
Mighty Aphrodite Kolya Birdcage, The Full Monty, The
Comdia Comdia Comdia Comdia
1995 1996 1996 1997
134 94 231 252
4 5 4 4
4.2 Resultados
39
Devido pouca quantidade de padres para treinamento para o cliente 2, possvel observar na Tabela 5 que o lme
Apt Pupil, com baixa avaliao, relaciona-se com outros
que foram bem aprovados pelo cliente. Obviamente, a nota baixa no necessariamente deve ser encarado como uma evidncia de que o sistema errou, pois fatores externos como um lme de tema, atores e produo boa, pode ter sido mal dirigido (na opinio do cliente).

Ttulo Gnero Ano
Apt Pupil
A valiao
Nmero de locaes
Apt Pupil Wings of the Dove, The Restoration Promesse, La
Drama Suspense Drama Drama
1998
136 65 52 6
1 5 4 3
Drama/Romance/ 1997 1995 1996
Nas tabelas seguintes possvel observar os resultados dos experimentos para outros clientes.

Ttulo Gnero Ano
Il Postino
A valiao
Nmero de locaes
Postino, Il Chasing Amy Like Water For Chocolate Jerry Maguire
Drama/Romance Drama/Romance Drama/Romance Drama/Romance
1994 1997 1992 1996
140 203 121 309
5 3 5 2

Ttulo Gnero Ano
Pulp Fiction
A valiao
Nmero de locaes
Pulp Fiction GoodFellas Donnie Brasco Godfather, The
Crime/Drama Crime/Drama Crime/Drama Crime/Drama
1994 1990 1997 1972
312 177 129 340
4 4 3 5
Esses resultados experimentais, nos levam a crer que nossa proposta (i.e. o sistema proposto) correspondeu s expectativas, pois conseguiu ser um auxiliar nas decises do cliente, trazendo boas respostas na maioria dos casos testados.
40
Concluses e Trabalhos Futuros
5.1 Concluses
O trabalho proposto foi desenvolvido como uma prova de conceito para sistemas de recomendao no ambiente de vdeo locadoras utilizando, para aprendizado do comportamento de clientes, o algoritmo de redes SOM. A contribuio deste trabalho ajudar o cliente, dando diretrizes para realizar sua escolha. Sistemas de recomendao so bastante utilizados em stios de comrcio eletrnico e existem diversas ferramentas que recomendam lmes na internet. Os sistemas de informao de vdeo locadoras carecem de ferramentas que auxiliem o cliente quando este tem dvida de qual lme locar, ou quando simplesmente deseja opinies de terceiros. Geralmente o cliente busca lmes recomendados por algum amigo ou familiar que j tenha assistido e expressou sua opinio, mas no simples saber realmente qual tipo de lme ir agradar esse cliente. O modelo apresentado neste trabalho consegue montar um perl para o usurio com o objetivo de agregar informaes s opinies que ele j obteve. Foi possvel construir modelos individualizados e oferecer ao cliente a relao de um novo lme com aqueles que j esto presentes em seu histrico.
5.2 Diculdades e trabalhos futuros

As redes SOM conseguem trabalhar bem como extrator de caractersticas, para isso precisam de vrias informaes sobre os padres de entrada. Uma diculdade no desenvolvimento do trabalho foi obter outros parmetros associados aos lmes, maiores detalhes que pudessem ser considerados no momento do treinamento da rede. Informaes como premiaes que o lme recebeu, como Oscar ou Globo de Ouro, quantidade de premiaes, ou ainda, diretor, ator principal, entre outros detalhes que no constam na base do MovieLens, mas podem ser facilmente obtidos do banco de dados de uma locadora e poderiam ainda mais melhorar as sugestes. Com estas informaes haveria um ajuste
5.2 Diculdades e trabalhos futuros
41
melhor da rede de forma geral, caracterizando melhor o perl do cliente. A adio dessas caractersticas est entre os futuros esforos para melhoria da ferramenta. Ainda outra melhoria que pode ser includa no modelo a criao de um ambiente grco mais amigvel ao usurio. Uma das caractersticas desse ambiente seria um formulrio onde o cliente pudesse simplesmente digitar o ttulo do lme a ser locado e o sistema buscar os lmes mais similares a ele. Nesse ambiente o cliente teria tambm a opo de visualizar o mapa topolgico de seu perl num plano bidimensional, tendo uma viso geral do seu histrico, podendo ento, direcionar sua escolha a um ttulo que tenha, por exemplo, o mesmo gnero do agrupamento que possui mais lmes. Um ponto muito importante que deve ser acrescentado em trabalhos futuros o armazenamento do mapa de um cliente. Criar mapas para clientes que possuem muitos Armazenar as infor-
lmes em seu histrico demanda muito processamento e tempo.
maes do mapa do cliente imprescindvel para tornar o processo de recomendao mais eciente. Neste caso devem ser estudadas tcnicas para no precisar refazer todo mapa cada vez que o cliente loca um lme, ou seja, insere um novo ttulo no seu histrico e manter o mapa sempre atualizado. Adicionalmente a ferramenta poder agregar a ltragem colaborativa atravs da associao dos pers de diversos clientes. Esta caracterstica pode ser implementada analisandose a semelhana entre os mapas dos clientes. Com a anlise de mapas similares provavelmente possvel ser realizada a recomendao direta de lmes, pois pode-se recomendar itens que esto presentes em mapas de clientes semelhantes.
42
Referncias
[1] GABRIELSSON, S.; GABRIELSSON, S.
The use of Self-Organizing Maps in Recommender Systems. Dissertao (Mestrado) Uppsala University, 2006. A Cauda Longa: do mercado de massa para o mercado de nicho.
[S.l.]: Elsevier, 2006.
[2] ANDERSON, C.
[3] FILHO, V. M. e-recommender: Sistema inteligente de recomendao para comrcio eletrnico.
Trabalho de Concluso do Curso de Engenharia da Computao,
Universi-
dade de Pernambuco, 2006. [4] TERVEEN, L.; HILL, W. Beyond recommender systems: Helping people help each other.
HCI In The New Millennium, Addison-Wesley, 2001.

2003. of Information Management and
[5] LYMAN, P. et al. How much information? leys School
Technical report,
2003.
UC Berkeem:
Systems,
Disponvel
<http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/>.
[6] RESNIK, P.; VARIAN, H. R. Recommender systems. v. 40, n. 3, 1997. [7] CASTRO, E. B.
Communications of the ACM,
Marketing de Varejo. [S.l.]:
FGV, 2004.
[8] GOLDBERG, D. et al. Using collaborative ltering to weave an information tapestry.
Communications of the ACM, v. 35, n. 12, p. 6170, 1992.
[9] BEZERRA, B. L. D.
Uma soluo em ltragem de informao para sistemas de recomendao baseada em anlise de dados simblicos. Dissertao (Mestrado) Uni-
versidade Federal de Pernambuco, 2004. [10] REATEGUI, E. B.; CAZELLA, S. B. Sistemas de recomendao. mini-curso. Enia, 2005. [11] BALABANOVIC, M.; SHOHAM, Y. Fab: Content-based, collaborative recommendation.
Communication of the ACM, v. 40, n. 3, p. 6672, 1997.
[12] HERLOCKER, J. L.
Understanding and Improving Automated Collaborative Filtering Systems. Tese (Doutorado) University of Minnesota, 2000. Communications of the ACM, v. 25, n. 3, 1982. 12th International Conference
[13] DENNING, P. J. Electronic junk.
[14] LANG, K. Newsweeder: Learning to lter netnews. In:
on Machine Learning. [S.l.:
s.n.], 1995.
Referncias
43
[15] KRULWICH, B.; BURKEY, C. Learning user information interests through extraction of semantically signicant phrases. In:
Learning in Information Access. [S.l.:
AAAI Spring Symposium on Machine User Modeling
s.n.], 1996.
[16] BURKE, R. Hybrid recommender systems: Survey and experiments.
and User-Adapted Interaction, v. 12, n. 4, p. 331370, 2002.
[17] RESNICK, P. et al. Grouplens: an open architecture for collaborative ltering of net-
news. In: CSCW '94: Proceedings of the 1994 ACM conference on Computer supported cooperative work. [S.l.: s.n.], 1994. p. 175186.
[18] SHARDANAND, U.; MAES, P. Social information ltering: Algorithms for automat-
Proceedings of ACM CHI'95 Conference on Human Factors in Computing Systems. [S.l.: s.n.], 1995. p. 210217.
ing word of mouth. In:
[19] HILL, W. et al. Recommending and evaluating choices in a virtual community of use.
CHI '95: Proceedings of the SIGCHI conference on Human factors in computing systems. [S.l.: s.n.], 1995. p. 194201.
In: newspaper. In:
[20] CLAYPOOL, M. et al. Combining content-based and collaborative lters in an online
Evaluation. [S.l.:
SIGIR '99 Workshop on Recommender Systems - Implementation and

s.n.], 1999.
[21] SMYTH, B.; COTTER, P. Personalized electronic program guides for digital tv.
Magazine, American Association for Articial Intelligence, v. 22, n. 2, 2001.

content-based information in recommendation. In:
AI
[22] BASU, C.; HIRSH, H.; W., C. Recommendation as classication: Using social and
Conference on Articial Intelligence. [S.l.: ciais: teoria e aplicaes. [S.l.]:

Verlag, 1989.
Proceedings of the 15th National
s.n.], 1998. p. 714720.
[23] BRAGA, A. P.; CARVALHO, A. P. L. F.; LUDERMIR, T. B. Editora LTC, 2000.
Redes neurais artiSpringer-
[24] KOHONEN, T.
Self-Organizing and Associative Memory.
3. ed. [S.l.]:
[25] KOHONEN, T. The self-organizing map. In: 1990. v. 78, n. 9, p. 14641480.
Proceedings of the IEEE. IEEE Computer,
[S.l.: s.n.],
[26] KOHONEN, T. The neural phonetic typewriter. 1122, 1988.
v. 21, n. 3, p.
[27] KOHONEN, T. et al. Self organizing of a massive document collection.
tions on Neural Networks, v. 11, n. 3, 2000.

to collaborative ltering. 184, 2002.
IEEE Trasac-
[28] GRAEF, G.; SCHAEFER, C. Application of art2 networks and self-organizing maps
Revised Papers from the nternational Workshops OHS-7, SC3, and AH-3 on Hypermedia: Openness, Structural Awareness, and Adaptivity, p. 182
[29] LEE, M.; CHOI, P.; WOO, Y. A hybrid recommender system combining collaborative ltering with neural network. In: p. 531534.
AH '02: Proceedings of the Second International Conference on Adaptive Hypermedia and Adaptive Web-Based Systems. [S.l.: s.n.], 2002.
44

Como complemento do Captulo 4, este apdice apresenta tabelas com resultados para os demais experimentos.

Ttulo Gnero Ano
Richard III
A valiao
Nmero de locaes
Richard III Bridge Gone Wind Lone Star on with the the River Kwai, The
Drama/Guerra Drama/Guerra Drama/Romance/ Guerra Drama/Mistrio
1995 1957 1939 1996
73 130 138 148
3 4 4 5

Ttulo Gnero Ano
Postino, Il
A valiao
Nmero de locaes
Postino, Il Breakfast Tiany's Jerry Maguire Graduate, The at
Drama/Romance Drama/Romance Drama/Romance Drama/Romance
1994 1961 1996 1967
140 77 309 192
5 1 2 5

Ttulo Gnero Ano
Rock, The
A valiao
Nmero de locaes
Rock, The GoldenEye Muppet sure Island Trea-
Ao/Aventura/ Suspense Ao/Aventura/ Suspense Ao/Aventura/ Comdia/Musical/ Suspense
1996 1995 1996
302 105 68
3 3 1
Heavy Metal
Ao/Aventura/ Animao/Terror/ Fico Cientca
1967
54
45

Ttulo Gnero Ano
Platoon
A valiao
Nmero de locaes
Platoon Bridge Gone Wind Lone Star on with the the River Kwai, The
Drama/Guerra Drama/Guerra Drama/Guerra/ Romance Drama/Mistrio
1986 1957 1939 1996
99 130 138 148
4 4 4 5

Ttulo Gnero Ano
Independence Day
A valiao
Nmero de locaes
Independence Day Starship ers Star Wars Troop-
Ao/Fico Cientca/ Guerra Ao/Aventura/ Fico Cientca/ Guerra Ao/Aventura/ Fico Cientca/ Guerra/Romance
1996 1997
353 178
4 2
1977
484
Empire
Strikes
Ao/Aventura/ Fico Cientca/ Guerra/Romance
1980
295
Back, The

Ttulo Gnero Ano
Antonia's Line
A valiao
Nmero de locaes
Antonia's Line Marvin's Room Promesse, La Good Will Hunting
1995 1996 1996 1997
59 61 6 154
3 3 3 5

Ttulo Gnero Ano
The River Wild

A valiao
Nmero de locaes
River Wild, The Breakdown Heat Scream
Ao/Suspense Ao/Suspense Ao/Crime/ Suspense Terror/Suspense
1994 1997 1995 1996
113 60 185 391
3 4 4 3

Ttulo Gnero Ano
46
Apollo 13
A valiao
Nmero de locaes
Apollo 13 Fugitive, The Face/O Usual The Suspects,
Ao/Drama/ Suspense Ao/Suspense Ao/Suspense/ Fico Cientca Crime/Suspense
1995 1993 1997 1995
222 267 152 211
2 3 3 4

Ttulo Gnero Ano
Forrest Gump
A valiao
Nmero de locaes
Forrest Gump Truth Cats The Sabrina Cinema adiso Par& About Dogs,
Comdia/Romance/ 1994 Guerra Comdia/Romance 1996
259 234
3 2
Comdia/Romance Comdia/Drama/ Romance
1995 1988
152 104
4 4

Ttulo Gnero Ano
The Remains of the Day

A valiao
Nmero de locaes
Remains of the Day, The Rainmaker, The 12 Angry Men Raging Bull
1993 1997 1957 1980
119 124 102 98
3 2 4 4

Ttulo Gnero Ano
Aladdin
A valiao
Nmero de locaes
Aladdin Lion King, The Mary Poppins Toy Story
Animao/Infantil/ 1992 Comdia/Musical Animao/Infantil/ 1994 Musical Infantil/Comdia/ Musical Animao/Infantil/ 1995 Comdia 1964
184 175 147 383
2 4 4 4

Ttulo Gnero Ano
Pulp Fiction
A valiao
Nmero de locaes
Pulp Fiction GoodFellas Donnie Brasco Godfather, The
Crime/Drama Crime/Drama Crime/Drama Crime/Drama
1994 1990 1997 1972
312 177 129 340
4 4 3 5
47

Ttulo Gnero Ano
Dead Man Walking

A valiao
Nmero de locaes
Dead Man Walking Mr. Opus Dead Poets Society People vs. Larry Flynt, The Holland's
1995 1995 1989 1996
246 235 197 166
5 5 5 4

Ttulo Gnero Ano
Braveheart
A valiao
Nmero de locaes
Braveheart Schindler's List Apocalypse Now English Patient, The
Drama/Guerra Drama/Guerra Drama/Guerra Drama/Romance/ Guerra
1995 1993 1979 1996
230 237 179 388
4 5 2 5

Ttulo Gnero Ano
Bob Roberts
A valiao
Nmero de locaes
Bob Roberts Brady Bunch Movie, The Fierce Creatures Jerey
Comdia Comdia Comdia Comdia
1992 1995 1997 1995
65 60 76 27
4 3 3 4

Ttulo Gnero Ano
2001: A Space Odyssey

A valiao
Nmero de locaes
2001:
A Space
Drama/Mistrio/ Fico Cientca/ Suspense Drama/Mistrio/ Suspense Mistrio/Suspense Drama
1968
202
Odyssey Client, The Rear Window Remains of the Day, The
1994 1954 1993
82 173 119
4 4 4

TCC Final AndersonBerg

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

TCC Final AndersonBerg

Enviado por

Direitos autorais:

Formatos disponíveis

ESCOLA POLITCNICA DE PERNAMBUCO

Sistema de Recomendao para clientes de vdeo locadoras baseado em redes SOM

Anderson Berg dos Santos Dantas

Sistema de Recomendao para clientes de vdeo locadoras baseado em redes SOM

Departamento de Sistemas e Computao Escola Politcnica de Pernambuco Universidade de Pernambuco

Recife - PE, Brasil Novembro de 2009

A Deus e minha famlia, pois me ensinaram os passos que devo seguir.

1.1 1.2 1.3 1.4

Motivaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Objetivos e Metas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Organizao do Documento 1.4.1 1.4.2 1.4.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Captulo 2: Reviso Bibliogrca Captulo 3: Modelo Proposto

Captulo 4: Conguraes dos Experimentos e Anlise dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13 p. 13

Captulo 5: Concluso e Trabalhos Futuros . . . . . . . . . . . .

Conana em sistemas de recomendao

2.2.1 2.2.2 2.2.3 2.2.4

Treinamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trabalhos relacionados . . . . . . . . . . . . . . . . . . . . . . .

3.1 3.2 3.3

Implementao do modelo Funcionamento do modelo

Experimentos e Anlise de Resultados

Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Concluses e Trabalhos Futuros

Concluses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diculdades e trabalhos futuros . . . . . . . . . . . . . . . . . . . . . .

Apndice A: Tabelas de resultados

The Usual Suspects Mighty Aphrodite Apt Pupil Il Postino

Pulp Fiction Richard III Postino, Il Rock, The Platoon

Independence Day Antonia's Line The River Wild Apollo 13

The Remains of the Day Aladdin

Resultados para o cliente 11 e o lme Resultados para o cliente 11 e o lme

Dead Man Walking Braveheart

Resultados para o cliente 11 e o lme Resultados para o cliente 11 e o lme

2001: A Space Odyssey

1.1 Caracterizao do Problema

1.3 Objetivos e Metas

1.4 Organizao do Documento

1.4 Organizao do Documento

Ser abordado o modelo de redes SOM introduzido por

1.4.2 Captulo 3: Modelo Proposto

1.4.3 Captulo 4: Conguraes dos Experimentos e Anlise dos Resultados

1.4.4 Captulo 5: Concluso e Trabalhos Futuros

2.1 Sistemas de Recomendao

Itunes Store possui mais download. As grandes lojas

2.1 Sistemas de Recomendao

(www.google.com), que seleciona documentos na internet a partir de critrios que

[8]. Este sistema ltrava documentos enviados para a caixa

analisa, no somente o contedo dos textos, mas

de massa, cujo objetivo alcanar o maior nmero de pessoas atravs

dos diversos tipos de mdia, o

direto tem seu foco no cliente individualmente.

2.1 Sistemas de Recomendao

Consiste em se obter notas do produto por clientes que

O stio oferece alguns produtos baseado em interesses do

Figura 1: Avaliaes de usurios no stio da Amazon.com para determinado produto.

2.1.1 Tcnicas de recomendao

2.1 Sistemas de Recomendao

Figura 2: Recomendaes da Amazon.com de acordo com o histrico do cliente.

Figura 3: Associao de produtos por clientes na Amazon.com

Filtragem baseada em contedo

2.1 Sistemas de Recomendao

2.1 Sistemas de Recomendao

Tapestry [8], mendo Tapestry fazer

2.1 Sistemas de Recomendao

Algumas das desvantagens da ltragem colaborativa so:

recomendaes que no correspondem s preferncias desse usurio.

[20] um exemplo de uso desta tcnica.

combinar as recomendaes da ltragem baseada em

Captulo 2: Reviso Bibliogrca Captulo 3: Modelo Proposto

Captulo 4: Conguraes dos Experimentos e Anlise dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13 p. 13

Conana em sistemas de recomendao

Concluses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diculdades e trabalhos futuros . . . . . . . . . . . . . . . . . . . . . .

Resultados para o cliente 11 e o lme Resultados para o cliente 11 e o lme

Resultados para o cliente 11 e o lme Resultados para o cliente 11 e o lme

1.4.3 Captulo 4: Conguraes dos Experimentos e Anlise dos Resultados

[8]. Este sistema ltrava documentos enviados para a caixa

Algumas das desvantagens da ltragem colaborativa so:

combinar as recomendaes da ltragem baseada em

Tabela 1: Vantagens e desvantagens das ltragens baseada em contedo e colaborativa

Vantagens No tenha necessrio algum tipo que um novo item de qualicao

2.1.2 Conana em sistemas de recomendao

A escolha desta tecnologia se justica por ser uma linguagem de fcil

(legenda) contendo o ttulo do lme que o

Figura 13: Mapa de lmes do cliente 1

Figura 14: Mapa de lmes do cliente 2