Meta-aprendizado para a verificação de falante com áudios de curta duração
dc.contributor.advisor1 | Soares, Anderson da Silva | |
dc.contributor.advisor1Lattes | Link do currículo Lattes: http://lattes.cnpq.br/1096941114079527 | pt_BR |
dc.contributor.referee1 | Soares, Anderson da Silva | |
dc.contributor.referee2 | Cândido Júnior, Arnaldo | |
dc.contributor.referee3 | Galvão Filho, Arlindo Rodrigues | |
dc.creator | Souza, Lucas Alcântara | |
dc.creator.Lattes | http://lattes.cnpq.br/9436330957771918 | pt_BR |
dc.date.accessioned | 2022-05-17T15:34:22Z | |
dc.date.available | 2022-05-17T15:34:22Z | |
dc.date.issued | 2022-04-18 | |
dc.description.abstract | In practical scenarios, a speaker verification model system must be able to identify a person given audios of any durations. However, existing speaker verification systems have low performance when dealing with short-length audios. To face this problem, the MLVL (Meta-Learning Variable-Length) approach was proposed, which consists of using audios with different durations within the same episode in the meta-learning of a prototypical network. The objective is to become text-independent speaker verification more robust to the context in which the verification audio is short-length. Models trained with the MLVL approach were evaluated in three different scenarios of short-length audios, obtaining 2.55% as the lowest EER (Equal Error Rate) value. Evaluating such models in audios with longer durations, the lowest EER value obtained was 2.40%. The results surpassed those obtained by several studies in the same scenarios, demonstrating the potential practical application of the proposed MLVL approach in a voice biometrics system. | eng |
dc.description.provenance | Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2022-05-17T12:09:27Z No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2022-05-17T15:34:22Z (GMT) No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Made available in DSpace on 2022-05-17T15:34:22Z (GMT). No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2022-04-18 | en |
dc.description.resumo | Um sistema de biometria por voz deve ser capaz de identificar, na prática, um indivíduo através de áudios de quaisquer durações. Entretanto, os modelos existentes de verificação de falante tem redução de desempenho ao operar com áudios de durações reduzidas. Para enfrentar este problema, foi proposta a abordagem MLVL (Meta-Learning Variable-Length), que consiste em utilizar áudios com durações distintas dentro de um mesmo episódio durante o meta-aprendizado de uma rede prototypical. O objetivo é tornar a verificação de falante, independente do conteúdo, mais robusta ao contexto em que o áudio de confirmação possui curta duração. Os modelos treinados com a abordagem MLVL foram avaliados em três cenários distintos de áudios com curta duração, obtendo 2,55% como menor valor de EER (Equal Error Rate). Avaliando tais modelos em áudios com durações maiores, o menor valor de EER obtido foi de 2,40%. Os resultados superaram os obtidos por diversas pesquisas comparadas nos mesmos cenários, mostrando o potencial de aplicação prática da abordagem MLVL proposta em um sistema de biometria por voz. | pt_BR |
dc.description.sponsorship | Fundação de Apoio à Pesquisa | pt_BR |
dc.identifier.citation | SOUZA, L. A. Meta-aprendizado para a verificação de falante com áudios de curta duração. 2022. 74 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022. | pt_BR |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/12072 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Goiás | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Informática - INF (RG) | pt_BR |
dc.publisher.initials | UFG | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Verificação de falante | por |
dc.subject | Biometria por voz | por |
dc.subject | Meta-aprendizado | por |
dc.subject | Voice biometrics | eng |
dc.subject | Curta duração | por |
dc.subject | Independente do conteúdo | por |
dc.subject | Speaker verification | eng |
dc.subject | Meta-learning | eng |
dc.subject | Short duration | eng |
dc.subject | Text-independent | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.title | Meta-aprendizado para a verificação de falante com áudios de curta duração | pt_BR |
dc.title.alternative | Meta-learning for speaker verification with short-length audios | eng |
dc.type | Dissertação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Dissertação - Lucas Alcântara Souza - 2022.pdf
- Tamanho:
- 6.73 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: