Alinhamento de LLMs via aprendizado por reforço avaliação de métodos de preferência humana

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Goiás

Resumo

This Course Completion Report aims to bring together the results of my journey to become an expert in LLM Alignment. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.

Descrição

Citação

NOVAIS, Artur Matos Andrade. Alinhamento de LLMs via aprendizado por reforço avaliação de métodos de preferência humana. 2025. 100 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.