Modelo neural recozido para a representação semântica de documentos por meio de vetores contínuos
dc.contributor.advisor1 | Cruz Junior, Gelson da | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/4370555454162131 | pt_BR |
dc.contributor.referee1 | Cruz Junior , Gelson da | |
dc.contributor.referee2 | Soares Alcalá , Symone Gomes | |
dc.contributor.referee3 | Oliveira , Marco Antonio Assfalk de | |
dc.contributor.referee4 | Soares , Fabrízzio Alphonsus Alves de Melo Nunes | |
dc.contributor.referee5 | Campos , Sérgio Vale Aguiar | |
dc.creator | Mendonça, Leandro Rezende Carneiro de | |
dc.creator.Lattes | http://lattes.cnpq.br/5053246742596082 | pt_BR |
dc.date.accessioned | 2020-12-09T11:29:26Z | |
dc.date.available | 2020-12-09T11:29:26Z | |
dc.date.issued | 2020-11-13 | |
dc.description.abstract | As a result of the growing production of unstructured textual data, techniques for representing words and documents in the vector space have emerged recently. The Brazilian Public Ministry has received several textual requests that are send by citizens with different needs, such as those involved in cases of domestic violence against women, others requesting intensive care unit admissions, and more. The time spent in classifying, detecting similar requests and distributing them is essential to optimize and save public resources. Therefore, we adopted the neural model with the Simulated Annealing (SA), a classic global optimization algorithm with low computational complexity, because of the need to reduce the daily training time, providing a more friendly graphic visualization of data in high dimensions, supporting the judicial decision process. The physical analogy of the SA meta-heuristic associated with the continuous representation of documents in the vector space contribute greatly to the friendly visualization of a high-dimensional dataset, maintaining a comparable score with other deep models and optimization algorithms, such as Covariance Matrix Adaptation Evolution Strategy (CMA-ES) and Bayesian Optimization (BO). | eng |
dc.description.provenance | Submitted by Franciele Moreira (francielemoreyra@gmail.com) on 2020-12-08T15:26:54Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf: 16635106 bytes, checksum: b691690a35c53d8a89191a29acc51523 (MD5) | en |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2020-12-09T11:29:26Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf: 16635106 bytes, checksum: b691690a35c53d8a89191a29acc51523 (MD5) | en |
dc.description.provenance | Made available in DSpace on 2020-12-09T11:29:26Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf: 16635106 bytes, checksum: b691690a35c53d8a89191a29acc51523 (MD5) Previous issue date: 2020-11-13 | en |
dc.description.resumo | Como resultado da crescente produção de dados textuais não estruturados, surgiram técnicas para representar palavras e documentos no espaço vetorial para extração de conhecimento. O Ministério Público brasileiro recebe inúmeras solicitações textuais não estruturadas enviadas por cidadãos com necessidades diversas - violência doméstica contra a mulher, solicitações de internações em unidades de terapia intensiva, entre outras. O tempo gasto na classificação, detecção de similaridades e distribuição para a promotoria competente é essencial para otimização dos recursos públicos. Assim, foi adotado um modelo neural associado ao algoritmo Simulated Annealing (SA), um clássico algoritmo de otimização global com baixa complexidade computacional, de modo a reduzir o tempo de treinamento diário e a proporcionar uma visualização gráfica mais amigável de dados multidimensionais, apoiando o processo de decisão judicial. A analogia física do algoritmo SA associado à representação contínua de documentos no espaço vetorial contribui para a visualização amigável de um conjunto de dados de alta dimensão, mantendo uma acurácia comparável a outros modelos neurais profundos e a outros algoritmos de otimização, como Covariance Matrix Adaptation Evolution Strategy (CMA-ES) e Bayesian Optimization (BO). | pt_BR |
dc.description.sponsorship | Outro | pt_BR |
dc.identifier.citation | MENDONÇA, L. R. C. Modelo neural recozido para a representação semântica de documentos por meio de vetores contínuos. 2020. 78 f. Tese (Doutorado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020. | pt_BR |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/10965 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Goiás | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG) | pt_BR |
dc.publisher.initials | UFG | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC) | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Representação de documento | por |
dc.subject | Redes neurais | por |
dc.subject | Processamento de linguagem natural | por |
dc.subject | Análise de texto | por |
dc.subject | Representação vetorial | por |
dc.subject | Otimização | por |
dc.subject | Recozimento simulado | por |
dc.subject | Aprendizado de máquina | por |
dc.subject | Document representation | eng |
dc.subject | Neural network | eng |
dc.subject | Natural language process | eng |
dc.subject | Text analysis | eng |
dc.subject | Vector representation | eng |
dc.subject | Optimization | eng |
dc.subject | Simulated annealing | eng |
dc.subject | Machine learning | eng |
dc.subject.cnpq | ENGENHARIAS | pt_BR |
dc.title | Modelo neural recozido para a representação semântica de documentos por meio de vetores contínuos | pt_BR |
dc.type | Tese | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Tese - Leandro Rezende Carneiro de Mendonça - 2020.pdf
- Tamanho:
- 15.86 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: