Junção de conjuntos por similaridade explorando paralelismo multinível em GPUs

Ribeiro Junior, Sidney

Junção de conjuntos por similaridade explorando paralelismo multinível em GPUs

Arquivos

Dissertação - Sidney Ribeiro Junior - 2017.pdf (1.75 MB)

Data

2017-08-29

Autores

Ribeiro Junior, Sidney

Editor

Universidade Federal de Goiás

Resumo

Similarity Join is an important operation for information retrieval, near duplicate detection, data analysis etc. State-of-the-art algorithms for similarity join use a technique known as prefix filtering to reduce the amount of sets to be entirely compared by previously discarding dissimilar sets. However, prefix filtering is only effective when looking for very similar data. An alternative to speedup the similarity join when prefix filtering is not efficient is to explore parallelism. In this work we developed three multi-level fine-grained parallel algorithms for many-core architectures (such as modern Graphic Processing Units) to solve the similarity join problem. The proposed algorithms have shown speedup gains of 109x and 17x when compared with sequential (ppjoin) and parallel (fgssjoin) state-of-the-art solutions, respectively, on standard real text databases.

Palavras-chave

Junção de conjuntos por similaridade , Junção por similaridade , Recuperação da informação , Paralelismo , GPU set similarity join , Similarity join , Information retrieval , Parallelism , GPU

Citação

RIBEIRO-JUNIOR, Sidney. Junção de conjuntos por similaridade explorando paralelismo multinível em GPUs. 2017. 50 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2017.

URI

http://repositorio.bc.ufg.br/tede/handle/tede/7848

Coleções

Mestrado em Ciência da Computação (INF)

Página do item completo

Junção de conjuntos por similaridade explorando paralelismo multinível em GPUs

Arquivos

Data

Autores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Descrição

Palavras-chave

Citação

URI

Coleções