Framework para sistemas de recomendação baseados em neural contextual Bandits com restrição de justiça
dc.contributor.advisor1 | Soares, Anderson da Silva | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1096941114079527 | |
dc.contributor.referee1 | Soares, Anderson da Silva | |
dc.contributor.referee2 | Rosa, Thierson Couto | |
dc.contributor.referee3 | Carvalho, Cedric Luiz De | |
dc.contributor.referee4 | Araújo, Aluizio Fausto Ribeiro | |
dc.contributor.referee5 | Veloso, Adriano | |
dc.creator | Santana, Marlesson Rodrigues Oliveira de | |
dc.creator.Lattes | http://lattes.cnpq.br/4493140717229623 | |
dc.date.accessioned | 2024-11-13T15:16:51Z | |
dc.date.available | 2024-11-13T15:16:51Z | |
dc.date.issued | 2024-06-03 | |
dc.description.abstract | The advent of digital businesses such as marketplaces, in which a company mediates a commercial transaction between different actors, presents challenges to recommendation systems as it is a multi-stakeholder scenario. In this scenario, the recommendation must meet conflicting objectives between the parties, such as relevance versus exposure, for example. State-of-the-art models that address the problem in a supervised way not only assume that the recommendation is a stationary problem, but are also user-centered, which leads to long-term system degradation. This thesis focuses on modeling the recommendation system as a reinforcement learning problem, through a Markovian decision-making process with uncertainty where it is possible to model the different interests of stakeholders in an environment with fairness constraints. The main challenges are the need for real interactions between stakeholders and the recommendation system in a continuous cycle of events that enables the scenario for online learning. For the development of this work, we present a model proposal, based on Neural Contextual Bandits with fairness constrain for multi-stakeholder scenarios. As results, we present the construction of MARS-Gym, a framework for modeling, training and evaluating recommendation systems based on reinforcement learning, and the development of different recommendation policies with fairness control adaptable to Neural models. Contextual Bandits, which led to an increase in fairness metrics for all scenarios presented while controlling the reduction in relevance metrics. | eng |
dc.description.resumo | O advento dos negócios digitais como marketplaces, em que uma empresa intermedeia uma transação comercial entre diferentes atores, apresenta desafios aos sistemas de recomendação por se tratar de um cenário multistakeholders. Nesse cenário, a recomendação deve atender a objetivos conflitantes entre as partes, como relevância versus exposição, por exemplo. Modelos estado da arte que tratam o problema de forma supervisionada, não apenas assumem que a recomendação é um problema estacionário, mas também são centradas no usuário, o que leva à degradação do sistema em longo prazo. Esta tese foca em modelar o sistema de recomendação como um problema de aprendizado por reforço, por um processo markoviano de tomada de decisão com incerteza onde seja possível modelar os diferentes interesses dos stakeholders em um ambiente com restrições de justiça. Os principais desafios estão na necessidade de interações reais entre os stakeholders e o sistema de recomendação em um ciclo de eventos contínuo que possibilite o cenário para o aprendizado online. Para o desenvolvimento deste trabalho, apresentamos uma proposta de modelo, baseado em Neural Contextual Bandits com restrição de justiça para cenários multistakeholders. Como resultados, apresentamos um framework de código aberto (MARS-Gym) para modelagem, treinamento, e avaliação de agentes de RL para sistemas de recomendação em ambientes multistakeholders e a arquitetura de Neural Contextual Bandit ‘Fair-Feature-Policy‘ com otimização multiobjetiva e restrição de justiça, o que levou a um aumento nas métricas de exposição ideal dos fornecedores em todos os cenários avaliados, em contrapartida, com pouca ou nenhuma redução na relevância das recomendações dadas pelo modelo. | |
dc.identifier.citation | SANTANA, M. R. O. Framework para Sistemas de Recomendação Baseados em Neural Contextual Bandits com Restrição de Justiça. Goiânia. 2024. 105p. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. | |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/13642 | |
dc.language | por | |
dc.publisher | Universidade Federal de Goiás | |
dc.publisher.country | Brasil | |
dc.publisher.department | Instituto de Informática - INF (RMG) | |
dc.publisher.initials | UFG | |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | recomendação multistakeholder | por |
dc.subject | justiça na recomendação | por |
dc.subject | aprendizado por reforço | por |
dc.subject | multistakeholder recommendation | eng |
dc.subject | fairness | eng |
dc.subject | reinforcement learning | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO | |
dc.title | Framework para sistemas de recomendação baseados em neural contextual Bandits com restrição de justiça | |
dc.title.alternative | Framework for Recommender Systems based on Neural Contextual bandits with Fairness-Constrained | eng |
dc.type | Tese |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Tese - Marlesson Rodrigues Oliveira de Santana - 2024.pdf
- Tamanho:
- 12.1 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: