Framework para sistemas de recomendação baseados em neural contextual Bandits com restrição de justiça

dc.contributor.advisor1Soares, Anderson da Silva
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1096941114079527
dc.contributor.referee1Soares, Anderson da Silva
dc.contributor.referee2Rosa, Thierson Couto
dc.contributor.referee3Carvalho, Cedric Luiz De
dc.contributor.referee4Araújo, Aluizio Fausto Ribeiro
dc.contributor.referee5Veloso, Adriano
dc.creatorSantana, Marlesson Rodrigues Oliveira de
dc.creator.Latteshttp://lattes.cnpq.br/4493140717229623
dc.date.accessioned2024-11-13T15:16:51Z
dc.date.available2024-11-13T15:16:51Z
dc.date.issued2024-06-03
dc.description.abstractThe advent of digital businesses such as marketplaces, in which a company mediates a commercial transaction between different actors, presents challenges to recommendation systems as it is a multi-stakeholder scenario. In this scenario, the recommendation must meet conflicting objectives between the parties, such as relevance versus exposure, for example. State-of-the-art models that address the problem in a supervised way not only assume that the recommendation is a stationary problem, but are also user-centered, which leads to long-term system degradation. This thesis focuses on modeling the recommendation system as a reinforcement learning problem, through a Markovian decision-making process with uncertainty where it is possible to model the different interests of stakeholders in an environment with fairness constraints. The main challenges are the need for real interactions between stakeholders and the recommendation system in a continuous cycle of events that enables the scenario for online learning. For the development of this work, we present a model proposal, based on Neural Contextual Bandits with fairness constrain for multi-stakeholder scenarios. As results, we present the construction of MARS-Gym, a framework for modeling, training and evaluating recommendation systems based on reinforcement learning, and the development of different recommendation policies with fairness control adaptable to Neural models. Contextual Bandits, which led to an increase in fairness metrics for all scenarios presented while controlling the reduction in relevance metrics.eng
dc.description.resumoO advento dos negócios digitais como marketplaces, em que uma empresa intermedeia uma transação comercial entre diferentes atores, apresenta desafios aos sistemas de recomendação por se tratar de um cenário multistakeholders. Nesse cenário, a recomendação deve atender a objetivos conflitantes entre as partes, como relevância versus exposição, por exemplo. Modelos estado da arte que tratam o problema de forma supervisionada, não apenas assumem que a recomendação é um problema estacionário, mas também são centradas no usuário, o que leva à degradação do sistema em longo prazo. Esta tese foca em modelar o sistema de recomendação como um problema de aprendizado por reforço, por um processo markoviano de tomada de decisão com incerteza onde seja possível modelar os diferentes interesses dos stakeholders em um ambiente com restrições de justiça. Os principais desafios estão na necessidade de interações reais entre os stakeholders e o sistema de recomendação em um ciclo de eventos contínuo que possibilite o cenário para o aprendizado online. Para o desenvolvimento deste trabalho, apresentamos uma proposta de modelo, baseado em Neural Contextual Bandits com restrição de justiça para cenários multistakeholders. Como resultados, apresentamos um framework de código aberto (MARS-Gym) para modelagem, treinamento, e avaliação de agentes de RL para sistemas de recomendação em ambientes multistakeholders e a arquitetura de Neural Contextual Bandit ‘Fair-Feature-Policy‘ com otimização multiobjetiva e restrição de justiça, o que levou a um aumento nas métricas de exposição ideal dos fornecedores em todos os cenários avaliados, em contrapartida, com pouca ou nenhuma redução na relevância das recomendações dadas pelo modelo.
dc.identifier.citationSANTANA, M. R. O. Framework para Sistemas de Recomendação Baseados em Neural Contextual Bandits com Restrição de Justiça. Goiânia. 2024. 105p. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/13642
dc.languagepor
dc.publisherUniversidade Federal de Goiás
dc.publisher.countryBrasil
dc.publisher.departmentInstituto de Informática - INF (RMG)
dc.publisher.initialsUFG
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectrecomendação multistakeholderpor
dc.subjectjustiça na recomendaçãopor
dc.subjectaprendizado por reforçopor
dc.subjectmultistakeholder recommendationeng
dc.subjectfairnesseng
dc.subjectreinforcement learningeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.titleFramework para sistemas de recomendação baseados em neural contextual Bandits com restrição de justiça
dc.title.alternativeFramework for Recommender Systems based on Neural Contextual bandits with Fairness-Constrainedeng
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese - Marlesson Rodrigues Oliveira de Santana - 2024.pdf
Tamanho:
12.1 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: