Otimização de operações fundamentais em GPU implementação de SGEMM e flashAttention em CUDA
Carregando...
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Goiás
Resumo
This Course Completion Report aims to bring together the results of my journey to become an expert in GPU Model Acceleration. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.
Descrição
Citação
LIMA, Luis Ricardo Santos de. Otimização de operações fundamentais em GPU implementação de SGEMM e flashAttention em CUDA. 2025. 80 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.