Item-based-adp: análise e melhoramento do algoritmo de filtragem colaborativa item-based

dc.contributor.advisor1Rosa, Thierson Couto
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4414718560764818eng
dc.contributor.referee1Rosa, Thierson Couto
dc.contributor.referee2Camilo Júnior, Celso Gonçalves
dc.contributor.referee3Pereira, Denilson Alves
dc.creatorAleixo, Everton Lima
dc.creator.Latteshttp://lattes.cnpq.br/6594252534841093eng
dc.date.accessioned2015-02-06T20:35:41Z
dc.date.issued2014-09-02
dc.description.abstractMemory-based algorithms are the most popular among the collaborative filtering algorithms. They use as input a table containing ratings given by users to items, known as the rating matrix. They predict the rating given by user a to an item i by computing similarities of the ratings among users or similarities of the ratings among items. In the first case Memory-Based algorithms are classified as User-based algorithms and in the second one they are labeled as Item-based algorithms. The prediction is computed using the ratings of k most similar users (or items), also know as neighbors. Memory-based algorithms are simple to understand and to program, usually provide accurate recommendation and are less sensible to data change. However, to obtain the most similar neighbors for a prediction they have to process all the data which is a serious scalability problem. Also they are sensitive to the sparsity of the input. In this work we propose an efficient and effective Item-Based that aims at diminishing the sensibility of the Memory-Based approach to both problems stated above. The algorithm is faster (almost 50%) than the traditional Item-Based algorithm while maintaining the same level of accuracy. However, in environments that have much data to predict and few to train the algorithm, the accuracy of the proposed algorithm surpass significantly that of the traditional Item-based algorithms. Our approach can also be easily adapted to be used as User-based algorithms.eng
dc.description.provenanceSubmitted by Erika Demachki (erikademachki@gmail.com) on 2015-02-06T20:35:15Z No. of bitstreams: 2 Dissertação - Everton Lima Aleixo - 2014.pdf: 2375638 bytes, checksum: accbd56745e040e23362d951a1336538 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)eng
dc.description.provenanceApproved for entry into archive by Erika Demachki (erikademachki@gmail.com) on 2015-02-06T20:35:41Z (GMT) No. of bitstreams: 2 Dissertação - Everton Lima Aleixo - 2014.pdf: 2375638 bytes, checksum: accbd56745e040e23362d951a1336538 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)eng
dc.description.provenanceMade available in DSpace on 2015-02-06T20:35:41Z (GMT). No. of bitstreams: 2 Dissertação - Everton Lima Aleixo - 2014.pdf: 2375638 bytes, checksum: accbd56745e040e23362d951a1336538 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2014-09-02eng
dc.description.resumoAlgoritmos baseados em memória são os mais populares entre os algoritmos de filtragem colaborativa. Eles usam como entrada uma tabela contendo as avaliações feitas pelos usuários aos itens, conhecida como matriz de avaliações. Eles predizem a avaliação dada por um usuário a a um item i, computando a similaridade de avaliações entre a e outros usuários ou entre i e outros itens. No primeiro caso, os algoritmos baseados em memória são classificados como algoritmos baseados em usuários (User-based) e no segundo caso são rotulados como algoritmos baseados em itens (Item-Based). A predição é computada usando as avaliações dos k usuários (ou itens) mais similares, também conhecidos como vizinhos. Algoritmos baseados em memória são simples de entender e implementar. Normalmente produzem boas recomendações e são menos sensíveis a mudança nos dados. Entretanto, para obter os vizinhos mais similares para a predição, eles necessitam processar todos os dados da matriz, o que é um sério problema de escalabilidade. Eles também são sensíveis a densidade dos dados. Neste trabalho, nós propomos um algoritmo eficiente e eficaz baseado em itens que visa diminuir a sensibilidade dos algoritmos baseados em memória para ambos os problemas acima referidos. Esse algoritmo é mais rápido (quase 50%) do que o algoritmo baseado em itens tradicional, mantendo o mesmo nível de acurácia. Entretanto, em ambientes onde existem muitos dados para predizer e poucos para treinar o algoritmo, a acurácia do algoritmo proposto supera significativamente a do algoritmo tradicional baseado em itens. Nossa abordagem pode ainda ser facilmente adaptada para ser utilizada como o algoritmo baseado em usuários.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESeng
dc.formatapplication/pdf*
dc.identifier.citationALEIXO, Everton Lima. Item-based-adp: análise e melhoramento do algoritmo de filtragem colaborativa item-based. 2014. 96 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2014.eng
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/4133
dc.languageporeng
dc.publisherUniversidade Federal de Goiáseng
dc.publisher.countryBrasileng
dc.publisher.departmentInstituto de Informática - INF (RG)eng
dc.publisher.initialsUFGeng
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)eng
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectSistemas de recomendaçãopor
dc.subjectAcuráciapor
dc.subjectFiltragem colaborativapor
dc.subjectBaseado em memóriapor
dc.subjectRecommender systemseng
dc.subjectAccuracyeng
dc.subjectCollaborative filteringeng
dc.subjectMemory-basedeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOeng
dc.thumbnail.urlhttp://repositorio.bc.ufg.br/tede/retrieve/16645/Disserta%c3%a7%c3%a3o%20-%20Everton%20Lima%20Aleixo%20-%202014.pdf.jpg*
dc.titleItem-based-adp: análise e melhoramento do algoritmo de filtragem colaborativa item-basedeng
dc.title.alternativeItem-based-adp: analysis and improvent of collaborative filtering algorithm item-basedeng
dc.typeDissertaçãoeng

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação - Everton Lima Aleixo - 2014.pdf
Tamanho:
2.27 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.11 KB
Formato:
Item-specific license agreed upon to submission
Descrição: