Acelerando a construção de tabelas hash para dados textuais com aplicações

dc.contributor.advisor1Martins, Wellington Santos
dc.contributor.advisor1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782112U1pt_BR
dc.contributor.referee1Martins, Wellington Santos
dc.contributor.referee2Rosa, Thierson Couto
dc.contributor.referee3Sousa, Daniel Xavier de
dc.creatorBarros, Chayner Cordeiro
dc.creator.Latteshttp://lattes.cnpq.br/9904877655695826pt_BR
dc.date.accessioned2020-12-30T14:06:54Z
dc.date.available2020-12-30T14:06:54Z
dc.date.issued2020-11-17
dc.description.abstractText mining is characterized by the extraction of information from textual data, in the most diverse formats, aiming at the knowledge production, classification, clusterization, translation of this information among other things. In order for text mining to be efficient, some procedures are performed on the data to ensure that it contains only content relevant to the analysis to be performed, and that it is structured in a format that is easier to manipulate computationally. Several pre-processing tasks must be performed on this data, in order to achieve the desired quality and representation. In this sense, the present work proposes an implementation of a hash table capable of efficiently exploring the high parallelism available in GPUs, as a way to increase the performance of pre- processing tasks. However, this work not only presents more efficient algorithms, but also demonstrates the feasibility of its use in applications such as the generation of the co- occurrence matrix and the representation of the text using embeddings.eng
dc.description.provenanceSubmitted by Luciana Ferreira (lucgeral@gmail.com) on 2020-12-29T12:17:23Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Chayner Cordeiro Barros - 2020.pdf: 2461082 bytes, checksum: 509c2fef0f7ecb4fca4473b8e19d9d09 (MD5)en
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2020-12-30T14:06:54Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Chayner Cordeiro Barros - 2020.pdf: 2461082 bytes, checksum: 509c2fef0f7ecb4fca4473b8e19d9d09 (MD5)en
dc.description.provenanceMade available in DSpace on 2020-12-30T14:06:54Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Chayner Cordeiro Barros - 2020.pdf: 2461082 bytes, checksum: 509c2fef0f7ecb4fca4473b8e19d9d09 (MD5) Previous issue date: 2020-11-17en
dc.description.resumoA mineração de texto (text mining) se caracteriza pela extração de informações a partir de dados textuais, nos mais diversos formatos, objetivando a produção de conhecimento, a classificação, clusterização, tradução desta informação entre outras tarefas. Para que a mineração de textos seja eficiente alguns procedimentos são realizados sobre os dados para garantir que eles contenham apenas conteúdo relevante à análise que será realizada, e que estejam estruturados num formato mais fácil de ser manipulado computacionalmente. Diversas tarefas de pré-processamento devem ser realizadas sobre esses dados, para alcançar a qualidade e a representação desejada. Neste sentido, o presente trabalho propõe uma implementação de tabela hash capaz de explorar o alto paralelismo disponível nas GPUs de forma eficiente, como forma de aumentar o desempenho das tarefas de pré- processamento de texto. Entretanto, este trabalho não apenas apresenta algoritmos mais eficientes, mas também demonstra a viabilidade de seu uso em aplicações como a geração da matriz de coocorrência e da representação do texto utilizando-se embeddings.pt_BR
dc.identifier.citationBARROS, C. C. Acelerando a construção de tabelas hash para dados textuais com aplicações. 2020. 99 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020.pt_BR
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/11006
dc.languageporpt_BR
dc.publisherUniversidade Federal de Goiáspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Informática - INF (RG)pt_BR
dc.publisher.initialsUFGpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)pt_BR
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectComputação de alto desempenhopor
dc.subjectAprendizado de máquinapor
dc.subjectMineração de textopor
dc.subjectMatriz de coocorrênciapor
dc.subjectTabelas hashpor
dc.subjectEmbeddingspor
dc.subjectCUDApor
dc.subjectHpcpor
dc.subjectCUDApor
dc.subjectMachine learningeng
dc.subjectHigh performance computingeng
dc.subjectText miningeng
dc.subjectCo-occurrence matrixeng
dc.subjectHash tableseng
dc.subjectEmbeddingseng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOpt_BR
dc.titleAcelerando a construção de tabelas hash para dados textuais com aplicaçõespt_BR
dc.title.alternativeAccelerating the construction of hash tables for textual data with applicationseng
dc.typeDissertaçãopt_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertação - Chayner Cordeiro Barros - 2020.pdf
Tamanho:
2.35 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: