Implementação de redes convolucionais para a segmentação de imagens em tempo real com vistas à aplicação em robôs autônomos com dispositivos de visão de baixo custo

dc.contributor.advisor-co1Vinhal, Cássio Dener Noronha
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/9791117638583664eng
dc.contributor.advisor1Cruz Júnior, Gélson da
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4370555454162131eng
dc.contributor.referee1Cruz Júnior, Gélson da
dc.contributor.referee2Vinhal, Cássio Dener Noronha
dc.contributor.referee3Soares, Fabrízzio Alphonsus de Melo Nunes
dc.contributor.referee4Silva, Karina Rocha Gomes da
dc.creatorRodrigues, Carlos Alberto de Sousa Parente
dc.creator.Latteshttp://lattes.cnpq.br/7489081850245911eng
dc.date.accessioned2018-08-20T10:46:35Z
dc.date.issued2018-03-16
dc.description.abstractThis work presents a study of convolutional networks to segment and classify images. The purpose of this network is to eventually give more autonomy to LEIA 1 robot, using the computer vision information in its processing. Methods such as this attempts to adapt the visual perception system of living beings. The complexity of this task lies in not having sufficient understanding of the biological system to model a system capable of processing images with the same speed and efficiency as a human. To accomplish this work, two different convolutional network architectures were validated. The first network has 13 layers, while the second has 15 layers, and more adjustable weights than the first one. For training and validation, a slice of Playing for Data dataset was used and adapted. The training set was composed of 300 images, and the network was validated using 2500 patterns. For each architecture, three training routines were performed, using the Adam, Nadam and Adamax methods. The most relevant results used the 15-layer architecture with Adamax optimizer.eng
dc.description.provenanceSubmitted by Franciele Moreira (francielemoreyra@gmail.com) on 2018-08-17T13:33:19Z No. of bitstreams: 2 Dissertação - Carlos Alberto de Sousa Parente Rodrigues - 2018.pdf: 6333824 bytes, checksum: a035fcc2026db7dbe0a7b6945a83690e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-08-20T10:46:35Z (GMT) No. of bitstreams: 2 Dissertação - Carlos Alberto de Sousa Parente Rodrigues - 2018.pdf: 6333824 bytes, checksum: a035fcc2026db7dbe0a7b6945a83690e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceMade available in DSpace on 2018-08-20T10:46:35Z (GMT). No. of bitstreams: 2 Dissertação - Carlos Alberto de Sousa Parente Rodrigues - 2018.pdf: 6333824 bytes, checksum: a035fcc2026db7dbe0a7b6945a83690e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-03-16eng
dc.description.resumoEste trabalho apresenta um estudo de redes convolucionais para segmentar e classificar imagens. O objetivo desta rede é futuramente deixar o robô LEIA 1 mais autônomo, utilizando as informações de visão computacional no seu processamento. Métodos como esse são tentativas de adaptação do sistema de processamento de visão dos seres vivos. A complexidade desta tarefa está em não haver entendimento suficiente do sistema biológico para modelar um sistema capaz de processar imagens com a mesma velocidade e eficiência que um ser humano. Para realizar este trabalho, duas diferentes arquiteturas de redes completamente convolucionais foram validadas. A primeira rede possui 13 camadas, enquanto a segunda possui 15 camadas, e mais pesos ajustáveis do que a primeira. Para o treinamento e validação, uma parcela do dataset Playing for Data foi utlizado e adaptado. O conjunto de treinamento foi composto de 300 imagens, e a rede foi validada utilizando 2500 padrões. Para cada arquitetura, três rotinas de treinamento foram executadas, com os métodos Adam, Nadam e Adamax. Os resultados mais relevantes utilizaram a arquitetura de 15 camadas com o otimizador Adamax.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESeng
dc.formatapplication/pdf*
dc.identifier.citationRODRIGUES, C. A. S. P. Implementação de redes convolucionais para a segmentação de imagens em tempo real com vistas à aplicação em robôs autônomos com dispositivos de visão de baixo custo. 2018. 110 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2018.eng
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/8811
dc.languageporeng
dc.publisherUniversidade Federal de Goiáseng
dc.publisher.countryBrasileng
dc.publisher.departmentEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)eng
dc.publisher.initialsUFGeng
dc.publisher.programPrograma de Pós-graduação em Engenharia Elétrica e da Computação (EMC)eng
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectRedes neurais artificiaispor
dc.subjectVisão computacionalpor
dc.subjectSegmentação de imagenspor
dc.subjectArtificial neural networkseng
dc.subjectComputer visioneng
dc.subjectImage segmentationeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOeng
dc.titleImplementação de redes convolucionais para a segmentação de imagens em tempo real com vistas à aplicação em robôs autônomos com dispositivos de visão de baixo custoeng
dc.title.alternativeImplementation of convolutional networks to real time segmentation aiming at applications in autonomous robots with vision devices of low costeng
dc.typeDissertaçãoeng

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertação - Carlos Alberto de Sousa Parente Rodrigues - 2018.pdf
Tamanho:
6.04 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.11 KB
Formato:
Item-specific license agreed upon to submission
Descrição: