Otimização de operações fundamentais em GPU implementação de SGEMM e flashAttention em CUDA

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Goiás

Resumo

This Course Completion Report aims to bring together the results of my journey to become an expert in GPU Model Acceleration. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.

Descrição

Citação

LIMA, Luis Ricardo Santos de. Otimização de operações fundamentais em GPU implementação de SGEMM e flashAttention em CUDA. 2025. 80 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.