Regressão Afim Espaço-Temporal para Rastreamento de Características

dc.contributor.advisor-co1Laureano, Gustavo Teodoro
dc.contributor.advisor1Costa, Ronaldo Martins Da
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7080590204832262
dc.contributor.referee1Soares, Fabrizzio Alphonsus Alves De Melo Nunes
dc.contributor.referee2Soares, Anderson Da Silva
dc.contributor.referee3Osório, Fernando Santos
dc.contributor.referee4Salazar, Aldo Andre Diaz
dc.creatorDias, Nigel Joseph Bandeira
dc.creator.Latteshttp://lattes.cnpq.br/5381876478719358
dc.date.accessioned2026-05-18T19:04:30Z
dc.date.available2026-05-18T19:04:30Z
dc.date.issued2026
dc.description.abstractFeature association is a fundamental prerequisite for visual localization pipelines. Typically, these methods rely on feature matching to estimate relative motion based on projective geometric constraints. Despite significant advances in feature association, most existing techniques rely on pairwise matching paradigms and often neglect the rich temporal context inherent in image sequences. In this thesis, we revisit the canonical Kanade-Lucas-Tomasi (KLT) feature tracker. We reformulate this classic algorithm by integrating deep neural network mechanisms for spatiotemporal and geometric learning. The proposed methodology uses a convolutional neural network trained to regress affine transformation parameters across consecutive frame patches. This capability allows for precise tracking of interest points considering the consistency of the projective geometry. To perform the training of the proposed network, we introduce a versatile protocol to synthesize feature tracking annotations from already available datasets. This methodology leverages state-of-the-art feature extraction and matching along with a model selection criterion based on epipolar geometry. Experimental evaluations on the TUM RGB-D benchmark demonstrate the consistent superiority of the proposed method in estimating relative camera motion compared to KLT and the Pips++ method. Although our method exhibits a lower inlier ratio, the resulting correspondence subset possesses significantly higher geometric fidelity. These results establish the proposed method as a robust solution, suitable for deployment in embedded systems with limited resources.eng
dc.description.resumoA associação de características é um pré-requisito fundamental para pipelines de localização visual. Tipicamente, esses métodos dependem da correspondência de características para estimar o movimento relativo com base em restrições da geometria projetiva. Apesar dos avanços significativos na associação de características, a maioria das técnicas existentes baseia-se em paradigmas de correspondência em pares e frequentemente negligencia o rico contexto temporal inerente às sequências de imagens. Nesta tese, revisitamos o canônico rastreador de características de Kanade-Lucas-Tomasi (KLT). Reformulamos este algoritmo clássico integrando mecanismos de redes neurais profundas para o aprendizado espaço-temporal e geométrico. A metodologia proposta utiliza uma rede neural convolucional treinada para realizar a regressão dos parâmetros de transformação afim a partir de patches de quadros consecutivos. Essa capacidade permite um rastreamento preciso de pontos de interesse, considerando a consistência da geometria projetiva. Para realizar o treinamento da rede proposta, introduzimos um protocolo versátil para sintetizar anotações de rastreamento de características a partir de conjuntos de dados já disponíveis. Esta metodologia faz uso da extração e correspondência de características no estado da arte, juntamente com um critério de seleção de modelo baseado em geometria epipolar. Avaliações experimentais no benchmark TUM RGB-D demonstram a superioridade consistente do método proposto na estimativa do movimento relativo da câmera em comparação ao KLT e ao método Pips++. Embora nosso método exiba uma proporção menor de inliers, o subconjunto de correspondências resultante possui uma fidelidade geométrica significativamente maior. Esses resultados estabelecem o método proposto como uma solução robusta, adequada para implantação em sistemas embarcados com recursos limitados.
dc.identifier.citationDIAS, Nigel. Spatio-Temporal Affine Regression for Feature Tracking. Goiânia, 2026. 71 f. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2026.
dc.identifier.urihttps://repositorio.bc.ufg.br/tede/handle/tede/15386
dc.languagePortuguêspor
dc.publisherUniversidade Federal de Goiáspor
dc.publisher.countryBrasilpor
dc.publisher.departmentInstituto de Informática - INF (RMG)
dc.publisher.initialsUFGpor
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)
dc.rightsAcesso Aberto
dc.subjectCaracterísticaspor
dc.subjectRastreamentopor
dc.subjectEspaço-Temporalpor
dc.subjectRedes Neurais Profundaspor
dc.subjectFeatureeng
dc.subjectTrackingeng
dc.subjectSpatio-temporaleng
dc.subjectDeep Neural Networkseng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleRegressão Afim Espaço-Temporal para Rastreamento de Características
dc.title.alternativeSpatio-Temporal Affine Regression for Feature Trackingeng
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese - Nigel Dias - 2026.pdf
Tamanho:
14.3 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: