Envelhecimento de características da voz
| dc.contributor.advisor1 | Pinheiro Júnior, Carlos Galvão | |
| dc.contributor.referee1 | Pinheiro Júnior, Carlos Galvão | |
| dc.contributor.referee1 | Cardoso, Alisson Assis | |
| dc.contributor.referee1 | Gris, Lucas Rafael Stefanel | |
| dc.creator | Silva, Matheus Carlos Lima e | |
| dc.date.accessioned | 2025-01-02T13:34:55Z | |
| dc.date.available | 2025-01-02T13:34:55Z | |
| dc.date.issued | 2024-12-19 | |
| dc.description.abstract | This work presents an approach based on linear models to recover the vocal identity of individuals with dysphonia, using recordings made before the onset of the disorder. The method applies transformations aimed at approximating the representation of vocal age to what the individual would have had if the disorder had not compromised voice quality. The classification models achieved a mean absolute error of 3.49 years in age prediction, although the analysis was limited by an imbalanced dataset with low representativeness across different age groups. Furthermore, a simple linear model applied to speaker embeddings showed promising performance within the scope of the available data. Despite the demonstrated potential, further validation with larger and more diverse datasets is needed to ensure its practical applicability and adaptation to individual particularities. | |
| dc.description.resumo | Este trabalho apresenta uma abordagem baseada em modelos lineares para recuperar a identidade vocal de indivíduos com disfonia, utilizando gravações realizadas antes do surgimento do distúrbio. O método aplica transformações destinadas a aproximar a representação da idade vocal àquela que o indivíduo teria caso o distúrbio não tivesse comprometido a qualidade da voz. Os modelos de classificação alcançaram um erro absoluto médio de 3,49 anos na predição de idade, embora a análise tenha sido limitada por um conjunto de dados desbalanceado e com baixa representatividade entre diferentes faixas etárias. Além disso, um modelo linear simples aplicado a speaker embeddings apresentou desempenho promissor no escopo dos dados disponíveis. Apesar do potencial demonstrado, é necessária uma validação adicional com datasets mais amplos e diversificados para assegurar sua aplicabilidade prática e adaptada às particularidades individuais. | |
| dc.identifier.citation | SILVA, Matheus Carlos Lima e. Envelhecimento de características da voz. 2024. 15 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Escola de Engenharia Elétrica, Mecânica e de Computação, Universidade Federal de Goiás, Goiânia, 2024. | |
| dc.identifier.uri | http://repositorio.bc.ufg.br//handle/ri/26124 | |
| dc.language.iso | por | |
| dc.publisher.country | Brasil | |
| dc.publisher.course | Engenharia de Computação (RMG) | |
| dc.publisher.department | Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RMG) | |
| dc.publisher.initials | UFG | |
| dc.rights | Acesso Aberto | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Voice aging | |
| dc.subject | Speaker identity | |
| dc.subject | Style transfer | |
| dc.subject | Age classification | |
| dc.subject | Voice conversion | |
| dc.subject | Speech processing | |
| dc.subject | Envelhecimento vocal | |
| dc.subject | Identidade vocal | |
| dc.subject | Transferencia de estilo | |
| dc.subject | Classificação etária | |
| dc.subject | Conversão de voz | |
| dc.subject | Processamento de fala | |
| dc.title | Envelhecimento de características da voz | |
| dc.type | Trabalho de conclusão de curso de graduação (TCCG) |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCCG - Engenharia de Computação - Matheus Carlos Lima e Silva - 2024.pdf
- Tamanho:
- 997.2 KB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: