Preenchendo a Lacuna da Supervisão Humana na Robótica por Meio da Linguagem: Uma IA Agêntica Multimodal para Escalar a Supervisão Humana em Sistemas Autônomos
dc.contributor.advisor1 | Soares, Anderson da Silva | |
dc.contributor.referee1 | Soares, Anderson Da Silva | |
dc.contributor.referee2 | Laureano, Gustavo Teodoro | |
dc.contributor.referee3 | Salazar, Aldo Andre Diaz | |
dc.contributor.referee4 | Colombini, Esther Luna | |
dc.contributor.referee5 | Vieira, Flavio Henrique Teles | |
dc.creator | Santos, Lara Fernanda Portilho dos | |
dc.creator.Lattes | http://lattes.cnpq.br/9653117035626347 | |
dc.date.accessioned | 2025-05-26T13:38:21Z | |
dc.date.available | 2025-05-26T13:38:21Z | |
dc.date.issued | 2025-04-22 | |
dc.description.abstract | While many autonomous systems can navigate and avoid obstacles under predictable conditions, they often rely on a human supervisor (Human-in-the-Loop - HITL) to adapt to adverse obstacles, sudden layout modifications, or partial hardware failures. However, existing HITL strategies frequently leave operators struggling with large volumes of data that demand real-time interpretation. To mitigate these challenges, we propose an agentic AI approach that integrates long-term memory with adaptive reasoning techniques, thereby reducing operator workload and minimizing disruptions in dynamic autonomous robotics operations. The proposed system incorporates hierarchical subagents to systematically integrate historical data, sensor logs, and iterative problem-solving techniques to address frequent challenges in multi-robot deployments, including localization failures, hardware malfunctions, and crowd-induced obstacles. Experimental evaluations comparing memory-augmented and baseline (no-memory) conditions reveal that its usage consistently yields higher solution accuracy and operator satisfaction. In particular, memory retrieval accelerates the resolution of recurring failure modes, while adaptive reasoning enhances real-time decision-making in novel or crowded scenarios. Text-based similarity metrics (Token Overlap and Semantic Alignment) further demonstrate that reusing verified domain language and strategies improves the clarity and maintainability of the recommended actions. The results underscore the viability of a modular, language-based system that combines data-driven diagnostics, robust memory mechanisms, and self-reflective planning for large-scale robot supervision. By uniting flexible LLM capabilities with HITL workflows, our proposal holds considerable promise for improving both efficiency and transparency in real-world autonomous robotics operations. | eng |
dc.description.resumo | Embora varios sistemas aut ´ onomos consigam navegar e evitar obst ˆ aculos em condic¸ ´ oes ˜ previs´ıveis, eles ainda dependem de supervisao humana (Human-in-the-Loop – HITL) ˜ para lidar com obstaculos adversos, mudanc¸as repentinas no ambiente ou falhas parciais ´ de hardware. No entanto, as estrategias HITL atuais frequentemente sobrecarregam os ´ operadores com grandes volumes de dados que exigem interpretac¸ao em tempo real. Para ˜ mitigar esses desafios, propomos uma abordagem baseada em Agentic AI que integra memoria de longo prazo com t ´ ecnicas de racioc ´ ´ınio adaptativo, reduzindo a carga do operador e minimizando interrupc¸oes nas operac¸ ˜ oes rob ˜ oticas. ´ O sistema proposto incorpora subagentes hierarquicos para integrar dados hist ´ oricos, ´ registros de sensores e tecnicas iterativas de resoluc¸ ´ ao de problemas, enfrentando falhas ˜ de localizac¸ao, defeitos de hardware e obst ˜ aculos causados por aglomerac¸ ´ oes — desafios ˜ comuns em implantac¸oes com m ˜ ultiplos rob ´ os. Avaliac¸ ˆ oes experimentais entre condic¸ ˜ oes ˜ com e sem memoria demonstram que seu uso proporciona maior precis ´ ao nas soluc¸ ˜ oes ˜ e maior satisfac¸ao do operador. A recuperac¸ ˜ ao de mem ˜ oria acelera a resoluc¸ ´ ao de falhas ˜ recorrentes, enquanto o racioc´ınio adaptativo melhora a tomada de decisoes em cen ˜ arios ´ novos ou congestionados. Metricas de similaridade textual (Sobreposic¸ ´ ao de Tokens e ˜ Alinhamento Semantico) mostram que a reutilizac¸ ˆ ao de linguagem e estrat ˜ egias validadas ´ no dom´ınio aumentam a clareza e a consistencia das ac¸ ˆ oes recomendadas. ˜ Os resultados destacam a viabilidade de um sistema modular baseado em linguagem, que combina diagnosticos orientados por dados, mecanismos robustos de mem ´ oria e t ´ ecnicas ´ de Self-Discovery para supervisao de aut ˜ onomos em larga escala. Ao unir as capacidades ˆ flex´ıveis de LLMs com fluxos de HITL, nossa proposta mostra grande potencial para aumentar a eficiencia e a transpar ˆ encia na rob ˆ otica aut ´ onoma aplicada ao mundo real. | |
dc.identifier.citation | ASSIS, L. S. Bridging the Human-in-the-Loop Gap in Robotics Through Language. Goiania, 2025. 86p. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025. | |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/14349 | |
dc.language | Português | por |
dc.publisher | Universidade Federal de Goiás | por |
dc.publisher.country | Brasil | por |
dc.publisher.department | Instituto de Informática - INF (RMG) | |
dc.publisher.initials | UFG | por |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | |
dc.rights | Acesso Aberto | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Robotica | por |
dc.subject | Agentes baseados em LLMs | por |
dc.subject | Human-in-the-loop | por |
dc.subject | Self-Discovery Reasoning | por |
dc.subject | Memory Augmented Reasoning | por |
dc.subject | Robotics | eng |
dc.subject | Agentic LLMs | eng |
dc.subject | Human-in-the-loop | eng |
dc.subject | Self-Discovery Reasoning | eng |
dc.subject | Memory Augmented Reasoning | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
dc.title | Preenchendo a Lacuna da Supervisão Humana na Robótica por Meio da Linguagem: Uma IA Agêntica Multimodal para Escalar a Supervisão Humana em Sistemas Autônomos | |
dc.title.alternative | Bridging the Human-in-the-Loop Gap in Robotics Through Language: A Multimodal Agentic AI for Scaling Human Supervision in Autonomous Systems | eng |
dc.type | Tese |