Acelerando a construção de tabelas hash para dados textuais com aplicações

Barros, Chayner Cordeiro

Acelerando a construção de tabelas hash para dados textuais com aplicações

dc.contributor.advisor1	Martins, Wellington Santos
dc.contributor.advisor1Lattes	http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782112U1	pt_BR
dc.contributor.referee1	Martins, Wellington Santos
dc.contributor.referee2	Rosa, Thierson Couto
dc.contributor.referee3	Sousa, Daniel Xavier de
dc.creator	Barros, Chayner Cordeiro
dc.creator.Lattes	http://lattes.cnpq.br/9904877655695826	pt_BR
dc.date.accessioned	2020-12-30T14:06:54Z
dc.date.available	2020-12-30T14:06:54Z
dc.date.issued	2020-11-17
dc.description.abstract	Text mining is characterized by the extraction of information from textual data, in the most diverse formats, aiming at the knowledge production, classification, clusterization, translation of this information among other things. In order for text mining to be efficient, some procedures are performed on the data to ensure that it contains only content relevant to the analysis to be performed, and that it is structured in a format that is easier to manipulate computationally. Several pre-processing tasks must be performed on this data, in order to achieve the desired quality and representation. In this sense, the present work proposes an implementation of a hash table capable of efficiently exploring the high parallelism available in GPUs, as a way to increase the performance of pre- processing tasks. However, this work not only presents more efficient algorithms, but also demonstrates the feasibility of its use in applications such as the generation of the co- occurrence matrix and the representation of the text using embeddings.	eng
dc.description.resumo	A mineração de texto (text mining) se caracteriza pela extração de informações a partir de dados textuais, nos mais diversos formatos, objetivando a produção de conhecimento, a classificação, clusterização, tradução desta informação entre outras tarefas. Para que a mineração de textos seja eficiente alguns procedimentos são realizados sobre os dados para garantir que eles contenham apenas conteúdo relevante à análise que será realizada, e que estejam estruturados num formato mais fácil de ser manipulado computacionalmente. Diversas tarefas de pré-processamento devem ser realizadas sobre esses dados, para alcançar a qualidade e a representação desejada. Neste sentido, o presente trabalho propõe uma implementação de tabela hash capaz de explorar o alto paralelismo disponível nas GPUs de forma eficiente, como forma de aumentar o desempenho das tarefas de pré- processamento de texto. Entretanto, este trabalho não apenas apresenta algoritmos mais eficientes, mas também demonstra a viabilidade de seu uso em aplicações como a geração da matriz de coocorrência e da representação do texto utilizando-se embeddings.	pt_BR
dc.identifier.citation	BARROS, C. C. Acelerando a construção de tabelas hash para dados textuais com aplicações. 2020. 99 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020.	pt_BR
dc.identifier.uri	http://repositorio.bc.ufg.br/tede/handle/tede/11006
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Goiás	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Instituto de Informática - INF (RG)	pt_BR
dc.publisher.initials	UFG	pt_BR
dc.publisher.program	Programa de Pós-graduação em Ciência da Computação (INF)	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Computação de alto desempenho	por
dc.subject	Aprendizado de máquina	por
dc.subject	Mineração de texto	por
dc.subject	Matriz de coocorrência	por
dc.subject	Tabelas hash	por
dc.subject	Embeddings	por
dc.subject	CUDA	por
dc.subject	Hpc	por
dc.subject	CUDA	por
dc.subject	Machine learning	eng
dc.subject	High performance computing	eng
dc.subject	Text mining	eng
dc.subject	Co-occurrence matrix	eng
dc.subject	Hash tables	eng
dc.subject	Embeddings	eng
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO	pt_BR
dc.title	Acelerando a construção de tabelas hash para dados textuais com aplicações	pt_BR
dc.title.alternative	Accelerating the construction of hash tables for textual data with applications	eng
dc.type	Dissertação	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Dissertação - Chayner Cordeiro Barros - 2020.pdf
Tamanho:: 2.35 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Mestrado em Ciência da Computação (INF)