MemoryGraph: uma proposta de memória para agentes conversacionais utilizando grafo de conhecimento
dc.contributor.advisor1 | Soares, Anderson da Silva | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1096941114079527 | |
dc.contributor.referee1 | Soares, Anderson da Silva | |
dc.contributor.referee2 | Galvão Filho, Arlindo Rodrigues | |
dc.contributor.referee3 | Silva, Nadia Felix Felipe da | |
dc.contributor.referee4 | Pereira, Fabíola Souza Fernandes | |
dc.contributor.referee5 | Fanucchi, Rodrigo Zempullski | |
dc.creator | Oliveira, Vinicius Paulo Lopes de | |
dc.creator.Lattes | http://lattes.cnpq.br/3160389407449721 | |
dc.date.accessioned | 2024-11-25T15:55:47Z | |
dc.date.available | 2024-11-25T15:55:47Z | |
dc.date.issued | 2024-09-25 | |
dc.description.abstract | With the advancement of massive language models applied to natural language processing, many proposals have become viable, such as the use of conversational agents applied to various everyday tasks. However, these models still have limitations in both the integration of new knowledge and the representation and retrieval of that knowledge, being constrained by costs, execution time, and training. Furthermore, their black-box nature prevents the direct manipulation of knowledge, mainly due to the vector representation that indirectly represents it, making the control and explanation of their results more difficult. In contrast, knowledge graphs allow for a rich and explicit representation of relationships between real-world entities. Despite the challenges in their construction, studies indicate that these can complement each other to produce better results. Therefore, the objective of this research is to propose a memory system for conversational agents based on massive language models through the combination of explicit knowledge (knowledge graphs) and implicit knowledge (language models) to achieve better semantic and lexical representation. This methodology was called MemoryGraph and is composed of three processes: graph construction, graph search, and user representation. Various knowledge graph construction workflows were proposed and compared, considering their costs and influences on the final result. The agent can search for information in this base through various search proposals based on RAG, referred to here as GraphRAG. This search methodology was evaluated by humans in five proposed question scenarios, showing superior average results in all five proposed search approaches (29% in the best approach). In addition, six RAG metrics, evaluated by a massive model, were applied to the proposed application results from two popular datasets and one composed of diabetes guidelines, showing superior results in all datasets. Furthermore, a method for long-term user representation, called user_memory, was proposed, demonstrating 93% retention of user information. To reinforce this result, case studies were conducted, demonstrating the agent's ability to personalize the user experience based on past experiences, increasing the speed of information delivery and user satisfaction. The results demonstrate that the MemoryGraph paradigm represents an advance over vector representation in environments where richer, temporal, and mutable contextualization is necessary. It also indicates that the integration of knowledge graphs with massive language models, especially in the construction of long-term memory and rich contextualization based on past experiences, can represent a significant advance in creating more efficient, personalized conversational agents with enhanced capacity for retaining and utilizing information over time. | eng |
dc.description.resumo | Com o avanço dos modelos de linguagem massivos aplicados ao processamento de linguagem natural, muitas propostas se tornaram viáveis como, por exemplo, o uso de agentes conversacionais aplicado à diversas tarefas do cotidiano. No entanto, esses modelos ainda apresentam limitações tanto na integração de novos conhecimentos, quanto na representação e recuperação desse conhecimento, sendo limitados pelos custos, tempo de execução e treinamento. Além disso, sua característica de caixapreta impede a manipulação direta do conhecimento, principalmente devido a representação vetorial que o representa de forma indireta, dificultando o controle e explicação de seus resultados. Em contraste, os grafos de conhecimento permitem uma representação rica e explícita das relações entre entidades do mundo real. Apesar dos desafios para sua construção, estudos indicam que estes podem se complementar para a produção de melhores resultados. Dessa forma, o objetivo desta pesquisa é propor um sistema de memória para agente conversacional baseado em modelos de linguagem massivos através da combinação de conhecimentos explícitos (grafos de conhecimento) e implícitos (modelos de linguagem) para melhor representação semântica e léxica deste. Essa metodologia foi chamada de MemoryGraph e é composto por três processos: construção do grafo, busca no grafo e representação do usuário. Foram propostos e comparados diversos fluxos de construção de grafo de conhecimento, considerando seus custos e influências no resultado final. O agente pode buscar informações nessa base através de diversas propostas de busca baseado em RAG, chamado aqui de GraphRAG. Esta metodologia de busca foi avaliada por humanos em cinco cenários de perguntas propostos, apresentando resultado médio superior nas cinco abordagens de buscas propostas (29% na melhor abordagem). Além destes, seis métricas de RAG, avaliadas por um modelo massivo, foram aplicados ao resultado da aplicação proposta de dois datasets populares e um composto pelas diretrizes de diabetes, apresentando resultados superiores em todos os datasets. Além disso, foi proposto um método de representação do usuário a longo prazo, nomeada de user_memory, que demonstrou retenção de 93% das informações sobre o usuário. Para reforçar esse resultado, foram realizados estudos de caso que demonstram a capacidade do agente em personalizar a experiência do usuário baseado em experiências passadas, aumentando a velocidade de entrega da informação e satisfação do usuário. Os resultados demonstram que o paradigma do MemoryGraph representa um avanço em relação a representação vetorial em ambientes onde se faz necessário uma contextualização mais rica, temporal e mutável. Indicando, também, que a integração de grafos de conhecimento com modelos de linguagem massivos, especialmente na construção da memória de longo prazo e rica contextualização baseada em experiencias passadas, pode representar um avanço significativo na criação de agentes conversacionais mais eficientes, personalizados e com uma capacidade aprimorada de retenção e utilização de informações ao longo do tempo. | |
dc.identifier.citation | OLIVEIRA, V. P. L. MemoryGraph: uma proposta de memória para agentes conversacionais utilizando grafo de conhecimento. 2024. 182 f. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. | |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/13690 | |
dc.language | por | |
dc.publisher | Universidade Federal de Goiás | |
dc.publisher.country | Brasil | |
dc.publisher.department | Instituto de Informática - INF (RMG) | |
dc.publisher.initials | UFG | |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Grafo de conhecimento | por |
dc.subject | Aprendizado de máquina | por |
dc.subject | Processamento de linguagem natural | por |
dc.subject | Agente Conversacional | por |
dc.subject | Modelo de Linguagem Massivo | por |
dc.subject | Knowledge graph | eng |
dc.subject | Machine learning | eng |
dc.subject | Natural language processing | eng |
dc.subject | Conversational agent | eng |
dc.subject | Massive language models | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
dc.title | MemoryGraph: uma proposta de memória para agentes conversacionais utilizando grafo de conhecimento | |
dc.title.alternative | MemoryGraph: a memory proposal for conversational agents using a knowledge graph | eng |
dc.type | Tese |