2026-05-082026-05-082025-12-09LIMA, Luis Ricardo Santos de. Otimização de operações fundamentais em GPU implementação de SGEMM e flashAttention em CUDA. 2025. 80 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.https://repositorio.bc.ufg.br//handle/ri/30311This Course Completion Report aims to bring together the results of my journey to become an expert in GPU Model Acceleration. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.porAcesso Abertohttp://creativecommons.org/licenses/by-nc-nd/4.0/Inteligência artificialComputação de alto desempenhoCudaArtificial intelligenceHigh-performance computingCudaOtimização de operações fundamentais em GPU implementação de SGEMM e flashAttention em CUDATrabalho de conclusão de curso de graduação (TCCG)