Envelhecimento de características da voz

Silva, Matheus Carlos Lima e

Envelhecimento de características da voz

dc.contributor.advisor1	Pinheiro Júnior, Carlos Galvão
dc.contributor.referee1	Pinheiro Júnior, Carlos Galvão
dc.contributor.referee1	Cardoso, Alisson Assis
dc.contributor.referee1	Gris, Lucas Rafael Stefanel
dc.creator	Silva, Matheus Carlos Lima e
dc.date.accessioned	2025-01-02T13:34:55Z
dc.date.available	2025-01-02T13:34:55Z
dc.date.issued	2024-12-19
dc.description.abstract	This work presents an approach based on linear models to recover the vocal identity of individuals with dysphonia, using recordings made before the onset of the disorder. The method applies transformations aimed at approximating the representation of vocal age to what the individual would have had if the disorder had not compromised voice quality. The classification models achieved a mean absolute error of 3.49 years in age prediction, although the analysis was limited by an imbalanced dataset with low representativeness across different age groups. Furthermore, a simple linear model applied to speaker embeddings showed promising performance within the scope of the available data. Despite the demonstrated potential, further validation with larger and more diverse datasets is needed to ensure its practical applicability and adaptation to individual particularities.
dc.description.resumo	Este trabalho apresenta uma abordagem baseada em modelos lineares para recuperar a identidade vocal de indivíduos com disfonia, utilizando gravações realizadas antes do surgimento do distúrbio. O método aplica transformações destinadas a aproximar a representação da idade vocal àquela que o indivíduo teria caso o distúrbio não tivesse comprometido a qualidade da voz. Os modelos de classificação alcançaram um erro absoluto médio de 3,49 anos na predição de idade, embora a análise tenha sido limitada por um conjunto de dados desbalanceado e com baixa representatividade entre diferentes faixas etárias. Além disso, um modelo linear simples aplicado a speaker embeddings apresentou desempenho promissor no escopo dos dados disponíveis. Apesar do potencial demonstrado, é necessária uma validação adicional com datasets mais amplos e diversificados para assegurar sua aplicabilidade prática e adaptada às particularidades individuais.
dc.identifier.citation	SILVA, Matheus Carlos Lima e. Envelhecimento de características da voz. 2024. 15 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Escola de Engenharia Elétrica, Mecânica e de Computação, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.uri	http://repositorio.bc.ufg.br//handle/ri/26124
dc.language.iso	por
dc.publisher.country	Brasil
dc.publisher.course	Engenharia de Computação (RMG)
dc.publisher.department	Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RMG)
dc.publisher.initials	UFG
dc.rights	Acesso Aberto
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	Voice aging
dc.subject	Speaker identity
dc.subject	Style transfer
dc.subject	Age classification
dc.subject	Voice conversion
dc.subject	Speech processing
dc.subject	Envelhecimento vocal
dc.subject	Identidade vocal
dc.subject	Transferencia de estilo
dc.subject	Classificação etária
dc.subject	Conversão de voz
dc.subject	Processamento de fala
dc.title	Envelhecimento de características da voz
dc.type	Trabalho de conclusão de curso de graduação (TCCG)

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: TCCG - Engenharia de Computação - Matheus Carlos Lima e Silva - 2024.pdf
Tamanho:: 997.2 KB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

EMC - Trabalhos de Conclusão de Curso