2025-04-232025-04-232024-12-17SIMÕES, Lucca Emmanuel Pineli. Aprendizado por reforço em modelos de linguagem natural desenvolvimento de modelos pequenos e dados sintéticos para monitoria de qualidade em call centers. 2025. 83 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.http://repositorio.bc.ufg.br//handle/ri/27322This Course Completion Report aims to bring together the results of my journey to become an expert in Reinforcement Learning with Human Feedback (RLHF). An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.porAcesso Abertohttp://creativecommons.org/licenses/by-nc-nd/4.0/Inteligência artificialAprendizado por reforçoModelos de linguagemArtificial intelligenceReinforcement learningLanguage modelsAprendizado por reforço em modelos de linguagem natural desenvolvimento de modelos pequenos e dados sintéticos para monitoria de qualidade em call centersTrabalho de conclusão de curso de graduação (TCCG)