Modelo neural recozido para a representação semântica de documentos por meio de vetores contínuos

dc.contributor.advisor1Cruz Junior, Gelson da
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4370555454162131pt_BR
dc.contributor.referee1Cruz Junior , Gelson da
dc.contributor.referee2Soares Alcalá , Symone Gomes
dc.contributor.referee3Oliveira , Marco Antonio Assfalk de
dc.contributor.referee4Soares , Fabrízzio Alphonsus Alves de Melo Nunes
dc.contributor.referee5Campos , Sérgio Vale Aguiar
dc.creatorMendonça, Leandro Rezende Carneiro de
dc.creator.Latteshttp://lattes.cnpq.br/5053246742596082pt_BR
dc.date.accessioned2020-12-09T11:29:26Z
dc.date.available2020-12-09T11:29:26Z
dc.date.issued2020-11-13
dc.description.abstractAs a result of the growing production of unstructured textual data, techniques for representing words and documents in the vector space have emerged recently. The Brazilian Public Ministry has received several textual requests that are send by citizens with different needs, such as those involved in cases of domestic violence against women, others requesting intensive care unit admissions, and more. The time spent in classifying, detecting similar requests and distributing them is essential to optimize and save public resources. Therefore, we adopted the neural model with the Simulated Annealing (SA), a classic global optimization algorithm with low computational complexity, because of the need to reduce the daily training time, providing a more friendly graphic visualization of data in high dimensions, supporting the judicial decision process. The physical analogy of the SA meta-heuristic associated with the continuous representation of documents in the vector space contribute greatly to the friendly visualization of a high-dimensional dataset, maintaining a comparable score with other deep models and optimization algorithms, such as Covariance Matrix Adaptation Evolution Strategy (CMA-ES) and Bayesian Optimization (BO).eng
dc.description.provenanceSubmitted by Franciele Moreira (francielemoreyra@gmail.com) on 2020-12-08T15:26:54Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf: 16635106 bytes, checksum: b691690a35c53d8a89191a29acc51523 (MD5)en
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2020-12-09T11:29:26Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf: 16635106 bytes, checksum: b691690a35c53d8a89191a29acc51523 (MD5)en
dc.description.provenanceMade available in DSpace on 2020-12-09T11:29:26Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf: 16635106 bytes, checksum: b691690a35c53d8a89191a29acc51523 (MD5) Previous issue date: 2020-11-13en
dc.description.resumoComo resultado da crescente produção de dados textuais não estruturados, surgiram técnicas para representar palavras e documentos no espaço vetorial para extração de conhecimento. O Ministério Público brasileiro recebe inúmeras solicitações textuais não estruturadas enviadas por cidadãos com necessidades diversas - violência doméstica contra a mulher, solicitações de internações em unidades de terapia intensiva, entre outras. O tempo gasto na classificação, detecção de similaridades e distribuição para a promotoria competente é essencial para otimização dos recursos públicos. Assim, foi adotado um modelo neural associado ao algoritmo Simulated Annealing (SA), um clássico algoritmo de otimização global com baixa complexidade computacional, de modo a reduzir o tempo de treinamento diário e a proporcionar uma visualização gráfica mais amigável de dados multidimensionais, apoiando o processo de decisão judicial. A analogia física do algoritmo SA associado à representação contínua de documentos no espaço vetorial contribui para a visualização amigável de um conjunto de dados de alta dimensão, mantendo uma acurácia comparável a outros modelos neurais profundos e a outros algoritmos de otimização, como Covariance Matrix Adaptation Evolution Strategy (CMA-ES) e Bayesian Optimization (BO).pt_BR
dc.description.sponsorshipOutropt_BR
dc.identifier.citationMENDONÇA, L. R. C. Modelo neural recozido para a representação semântica de documentos por meio de vetores contínuos. 2020. 78 f. Tese (Doutorado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020.pt_BR
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/10965
dc.languageporpt_BR
dc.publisherUniversidade Federal de Goiáspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)pt_BR
dc.publisher.initialsUFGpt_BR
dc.publisher.programPrograma de Pós-graduação em Engenharia Elétrica e da Computação (EMC)pt_BR
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectRepresentação de documentopor
dc.subjectRedes neuraispor
dc.subjectProcessamento de linguagem naturalpor
dc.subjectAnálise de textopor
dc.subjectRepresentação vetorialpor
dc.subjectOtimizaçãopor
dc.subjectRecozimento simuladopor
dc.subjectAprendizado de máquinapor
dc.subjectDocument representationeng
dc.subjectNeural networkeng
dc.subjectNatural language processeng
dc.subjectText analysiseng
dc.subjectVector representationeng
dc.subjectOptimizationeng
dc.subjectSimulated annealingeng
dc.subjectMachine learningeng
dc.subject.cnpqENGENHARIASpt_BR
dc.titleModelo neural recozido para a representação semântica de documentos por meio de vetores contínuospt_BR
dc.typeTesept_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf
Tamanho:
15.86 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: