Estimação de distâncias de objetos em imagens de câmeras monoculares utilizando medes neurais profundas

dc.contributor.advisor1Cardoso, Álisson Assis
dc.contributor.referee1Cardoso, Álisson Assis
dc.contributor.referee1Vieira, Flávio Henrique Teles
dc.contributor.referee1Lopes Filho, Gilberto
dc.creatorCaraíba, André Felipe dos Santos
dc.date.accessioned2024-08-21T11:12:34Z
dc.date.available2024-08-21T11:12:34Z
dc.date.issued2024-08-01
dc.description.resumoA estimação de distância e uma tarefa essencial para muitas aplicações como navegação de robos moveis, sistemas de navegação de veículos autônomos e dispositivos de assistência para pessoas com deficiência visual. Diferentes sensores, como LiDAR e câmeras estéreo, podem ser empregados nessa tarefa. No entanto, sensores de distância 3D, como LiDAR, possuem alto custo e apresentam problemas de sincronização. Câmeras de profundidade ou câmeras estereos ao comumente usadas, mas sofrem de dificuldades de calibração e geralmente não apresentam bons resultados em longos alcances. Câmeras monoculares oferecem uma solução econômica e versátil para realizar a estimação de distância. Com o avanço das técnicas de aprendizado profundo, diversos trabalhos propõem estimar à distância de objetos usando detecção de objetos e mapas de profundidade a partir de imagens ˜ de câmeras monoculares. Este trabalho se propõe a desenvolver uma rede neural capaz ˜ de estimar à distância de objetos usando imagens RGB capturadas por câmeras monoculares, foram testados diversos métodos e proposta uma nova arquitetura (CustomNet). O modelo proposto utiliza uma rede pre-treinada para estimação de profundidade, MiDaS, em conjunto com uma rede de detecção de objetos, ˜ YOLOv8, para extração de um vetor de características usado como entrada para uma Rede Neural Multicamadas que estima a distância final absoluta. Os resultados mostram que a abordagem proposta (CustomNet) supera abordagens alternativas em trabalhos anteriores, como DisNet, e supera outras abordagens desenvolvidas ao decorrer deste trabalho, como MLP simples e AlexNet. Dentre os modelos desenvolvidos neste trabalho, a rede convolucional VGG alcanço o menor erro na estimação da distância dentre os testes realizados.
dc.identifier.citationCARAÍBA, André Felipe dos Santos. Estimação de distâncias de objetos em imagens de câmeras monoculares utilizando redes neurais profundas. 2024. 8 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Escola de Engenharia Elétrica, Mecânica e de Computação, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.urihttp://repositorio.bc.ufg.br//handle/ri/25359
dc.language.isopor
dc.publisherUniversidade Federal de Goiás
dc.publisher.countryBrasil
dc.publisher.courseEngenharia Elétrica (RMG)
dc.publisher.departmentEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RMG)
dc.publisher.initialsUFG
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectEstimação de distância
dc.subjectAprendizado profundo
dc.subjectDetecção de objetos
dc.subjectCâmaras moleculares
dc.subjectRedes neurais profundas
dc.subjectMidas
dc.subjectYolov8
dc.subjectRegressão
dc.subjectMapas de profundidade
dc.titleEstimação de distâncias de objetos em imagens de câmeras monoculares utilizando medes neurais profundas
dc.typeTrabalho de conclusão de curso de graduação (TCCG)

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
TCCG - Engenharia Elétrica - Andre Felipe dos Santos Caraíba - 2024.pdf
Tamanho:
3.82 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: