Envelhecimento de características da voz

dc.contributor.advisor1Pinheiro Júnior, Carlos Galvão
dc.contributor.referee1Pinheiro Júnior, Carlos Galvão
dc.contributor.referee1Cardoso, Alisson Assis
dc.contributor.referee1Gris, Lucas Rafael Stefanel
dc.creatorSilva, Matheus Carlos Lima e
dc.date.accessioned2025-01-02T13:34:55Z
dc.date.available2025-01-02T13:34:55Z
dc.date.issued2024-12-19
dc.description.abstractThis work presents an approach based on linear models to recover the vocal identity of individuals with dysphonia, using recordings made before the onset of the disorder. The method applies transformations aimed at approximating the representation of vocal age to what the individual would have had if the disorder had not compromised voice quality. The classification models achieved a mean absolute error of 3.49 years in age prediction, although the analysis was limited by an imbalanced dataset with low representativeness across different age groups. Furthermore, a simple linear model applied to speaker embeddings showed promising performance within the scope of the available data. Despite the demonstrated potential, further validation with larger and more diverse datasets is needed to ensure its practical applicability and adaptation to individual particularities.
dc.description.resumoEste trabalho apresenta uma abordagem baseada em modelos lineares para recuperar a identidade vocal de indivíduos com disfonia, utilizando gravações realizadas antes do surgimento do distúrbio. O método aplica transformações destinadas a aproximar a representação da idade vocal àquela que o indivíduo teria caso o distúrbio não tivesse comprometido a qualidade da voz. Os modelos de classificação alcançaram um erro absoluto médio de 3,49 anos na predição de idade, embora a análise tenha sido limitada por um conjunto de dados desbalanceado e com baixa representatividade entre diferentes faixas etárias. Além disso, um modelo linear simples aplicado a speaker embeddings apresentou desempenho promissor no escopo dos dados disponíveis. Apesar do potencial demonstrado, é necessária uma validação adicional com datasets mais amplos e diversificados para assegurar sua aplicabilidade prática e adaptada às particularidades individuais.
dc.identifier.citationSILVA, Matheus Carlos Lima e. Envelhecimento de características da voz. 2024. 15 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Escola de Engenharia Elétrica, Mecânica e de Computação, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.urihttp://repositorio.bc.ufg.br//handle/ri/26124
dc.language.isopor
dc.publisher.countryBrasil
dc.publisher.courseEngenharia de Computação (RMG)
dc.publisher.departmentEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RMG)
dc.publisher.initialsUFG
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectVoice aging
dc.subjectSpeaker identity
dc.subjectStyle transfer
dc.subjectAge classification
dc.subjectVoice conversion
dc.subjectSpeech processing
dc.subjectEnvelhecimento vocal
dc.subjectIdentidade vocal
dc.subjectTransferencia de estilo
dc.subjectClassificação etária
dc.subjectConversão de voz
dc.subjectProcessamento de fala
dc.titleEnvelhecimento de características da voz
dc.typeTrabalho de conclusão de curso de graduação (TCCG)

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCCG - Engenharia de Computação - Matheus Carlos Lima e Silva - 2024.pdf
Tamanho:
997.2 KB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: