Meta-aprendizado para a verificação de falante com áudios de curta duração

Souza, Lucas Alcântara

Meta-aprendizado para a verificação de falante com áudios de curta duração

dc.contributor.advisor1	Soares, Anderson da Silva
dc.contributor.advisor1Lattes	Link do currículo Lattes: http://lattes.cnpq.br/1096941114079527	pt_BR
dc.contributor.referee1	Soares, Anderson da Silva
dc.contributor.referee2	Cândido Júnior, Arnaldo
dc.contributor.referee3	Galvão Filho, Arlindo Rodrigues
dc.creator	Souza, Lucas Alcântara
dc.creator.Lattes	http://lattes.cnpq.br/9436330957771918	pt_BR
dc.date.accessioned	2022-05-17T15:34:22Z
dc.date.available	2022-05-17T15:34:22Z
dc.date.issued	2022-04-18
dc.description.abstract	In practical scenarios, a speaker verification model system must be able to identify a person given audios of any durations. However, existing speaker verification systems have low performance when dealing with short-length audios. To face this problem, the MLVL (Meta-Learning Variable-Length) approach was proposed, which consists of using audios with different durations within the same episode in the meta-learning of a prototypical network. The objective is to become text-independent speaker verification more robust to the context in which the verification audio is short-length. Models trained with the MLVL approach were evaluated in three different scenarios of short-length audios, obtaining 2.55% as the lowest EER (Equal Error Rate) value. Evaluating such models in audios with longer durations, the lowest EER value obtained was 2.40%. The results surpassed those obtained by several studies in the same scenarios, demonstrating the potential practical application of the proposed MLVL approach in a voice biometrics system.	eng
dc.description.provenance	Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2022-05-17T12:09:27Z No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)	en
dc.description.provenance	Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2022-05-17T15:34:22Z (GMT) No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)	en
dc.description.provenance	Made available in DSpace on 2022-05-17T15:34:22Z (GMT). No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2022-04-18	en
dc.description.resumo	Um sistema de biometria por voz deve ser capaz de identificar, na prática, um indivíduo através de áudios de quaisquer durações. Entretanto, os modelos existentes de verificação de falante tem redução de desempenho ao operar com áudios de durações reduzidas. Para enfrentar este problema, foi proposta a abordagem MLVL (Meta-Learning Variable-Length), que consiste em utilizar áudios com durações distintas dentro de um mesmo episódio durante o meta-aprendizado de uma rede prototypical. O objetivo é tornar a verificação de falante, independente do conteúdo, mais robusta ao contexto em que o áudio de confirmação possui curta duração. Os modelos treinados com a abordagem MLVL foram avaliados em três cenários distintos de áudios com curta duração, obtendo 2,55% como menor valor de EER (Equal Error Rate). Avaliando tais modelos em áudios com durações maiores, o menor valor de EER obtido foi de 2,40%. Os resultados superaram os obtidos por diversas pesquisas comparadas nos mesmos cenários, mostrando o potencial de aplicação prática da abordagem MLVL proposta em um sistema de biometria por voz.	pt_BR
dc.description.sponsorship	Fundação de Apoio à Pesquisa	pt_BR
dc.identifier.citation	SOUZA, L. A. Meta-aprendizado para a verificação de falante com áudios de curta duração. 2022. 74 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022.	pt_BR
dc.identifier.uri	http://repositorio.bc.ufg.br/tede/handle/tede/12072
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Goiás	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Instituto de Informática - INF (RG)	pt_BR
dc.publisher.initials	UFG	pt_BR
dc.publisher.program	Programa de Pós-graduação em Ciência da Computação (INF)	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Verificação de falante	por
dc.subject	Biometria por voz	por
dc.subject	Meta-aprendizado	por
dc.subject	Voice biometrics	eng
dc.subject	Curta duração	por
dc.subject	Independente do conteúdo	por
dc.subject	Speaker verification	eng
dc.subject	Meta-learning	eng
dc.subject	Short duration	eng
dc.subject	Text-independent	eng
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
dc.title	Meta-aprendizado para a verificação de falante com áudios de curta duração	pt_BR
dc.title.alternative	Meta-learning for speaker verification with short-length audios	eng
dc.type	Dissertação	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Dissertação - Lucas Alcântara Souza - 2022.pdf
Tamanho:: 6.73 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Mestrado em Ciência da Computação (INF)