Acelerando a construção de tabelas hash para dados textuais com aplicações
dc.contributor.advisor1 | Martins, Wellington Santos | |
dc.contributor.advisor1Lattes | http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782112U1 | pt_BR |
dc.contributor.referee1 | Martins, Wellington Santos | |
dc.contributor.referee2 | Rosa, Thierson Couto | |
dc.contributor.referee3 | Sousa, Daniel Xavier de | |
dc.creator | Barros, Chayner Cordeiro | |
dc.creator.Lattes | http://lattes.cnpq.br/9904877655695826 | pt_BR |
dc.date.accessioned | 2020-12-30T14:06:54Z | |
dc.date.available | 2020-12-30T14:06:54Z | |
dc.date.issued | 2020-11-17 | |
dc.description.abstract | Text mining is characterized by the extraction of information from textual data, in the most diverse formats, aiming at the knowledge production, classification, clusterization, translation of this information among other things. In order for text mining to be efficient, some procedures are performed on the data to ensure that it contains only content relevant to the analysis to be performed, and that it is structured in a format that is easier to manipulate computationally. Several pre-processing tasks must be performed on this data, in order to achieve the desired quality and representation. In this sense, the present work proposes an implementation of a hash table capable of efficiently exploring the high parallelism available in GPUs, as a way to increase the performance of pre- processing tasks. However, this work not only presents more efficient algorithms, but also demonstrates the feasibility of its use in applications such as the generation of the co- occurrence matrix and the representation of the text using embeddings. | eng |
dc.description.provenance | Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2020-12-29T12:17:23Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Chayner Cordeiro Barros - 2020.pdf: 2461082 bytes, checksum: 509c2fef0f7ecb4fca4473b8e19d9d09 (MD5) | en |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2020-12-30T14:06:54Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Chayner Cordeiro Barros - 2020.pdf: 2461082 bytes, checksum: 509c2fef0f7ecb4fca4473b8e19d9d09 (MD5) | en |
dc.description.provenance | Made available in DSpace on 2020-12-30T14:06:54Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Chayner Cordeiro Barros - 2020.pdf: 2461082 bytes, checksum: 509c2fef0f7ecb4fca4473b8e19d9d09 (MD5) Previous issue date: 2020-11-17 | en |
dc.description.resumo | A mineração de texto (text mining) se caracteriza pela extração de informações a partir de dados textuais, nos mais diversos formatos, objetivando a produção de conhecimento, a classificação, clusterização, tradução desta informação entre outras tarefas. Para que a mineração de textos seja eficiente alguns procedimentos são realizados sobre os dados para garantir que eles contenham apenas conteúdo relevante à análise que será realizada, e que estejam estruturados num formato mais fácil de ser manipulado computacionalmente. Diversas tarefas de pré-processamento devem ser realizadas sobre esses dados, para alcançar a qualidade e a representação desejada. Neste sentido, o presente trabalho propõe uma implementação de tabela hash capaz de explorar o alto paralelismo disponível nas GPUs de forma eficiente, como forma de aumentar o desempenho das tarefas de pré- processamento de texto. Entretanto, este trabalho não apenas apresenta algoritmos mais eficientes, mas também demonstra a viabilidade de seu uso em aplicações como a geração da matriz de coocorrência e da representação do texto utilizando-se embeddings. | pt_BR |
dc.identifier.citation | BARROS, C. C. Acelerando a construção de tabelas hash para dados textuais com aplicações. 2020. 99 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020. | pt_BR |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/11006 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Goiás | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Informática - INF (RG) | pt_BR |
dc.publisher.initials | UFG | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Computação de alto desempenho | por |
dc.subject | Aprendizado de máquina | por |
dc.subject | Mineração de texto | por |
dc.subject | Matriz de coocorrência | por |
dc.subject | Tabelas hash | por |
dc.subject | Embeddings | por |
dc.subject | CUDA | por |
dc.subject | Hpc | por |
dc.subject | CUDA | por |
dc.subject | Machine learning | eng |
dc.subject | High performance computing | eng |
dc.subject | Text mining | eng |
dc.subject | Co-occurrence matrix | eng |
dc.subject | Hash tables | eng |
dc.subject | Embeddings | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO | pt_BR |
dc.title | Acelerando a construção de tabelas hash para dados textuais com aplicações | pt_BR |
dc.title.alternative | Accelerating the construction of hash tables for textual data with applications | eng |
dc.type | Dissertação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Dissertação - Chayner Cordeiro Barros - 2020.pdf
- Tamanho:
- 2.35 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: