Meta-aprendizado para a verificação de falante com áudios de curta duração

dc.contributor.advisor1Soares, Anderson da Silva
dc.contributor.advisor1LattesLink do currículo Lattes: http://lattes.cnpq.br/1096941114079527pt_BR
dc.contributor.referee1Soares, Anderson da Silva
dc.contributor.referee2Cândido Júnior, Arnaldo
dc.contributor.referee3Galvão Filho, Arlindo Rodrigues
dc.creatorSouza, Lucas Alcântara
dc.creator.Latteshttp://lattes.cnpq.br/9436330957771918pt_BR
dc.date.accessioned2022-05-17T15:34:22Z
dc.date.available2022-05-17T15:34:22Z
dc.date.issued2022-04-18
dc.description.abstractIn practical scenarios, a speaker verification model system must be able to identify a person given audios of any durations. However, existing speaker verification systems have low performance when dealing with short-length audios. To face this problem, the MLVL (Meta-Learning Variable-Length) approach was proposed, which consists of using audios with different durations within the same episode in the meta-learning of a prototypical network. The objective is to become text-independent speaker verification more robust to the context in which the verification audio is short-length. Models trained with the MLVL approach were evaluated in three different scenarios of short-length audios, obtaining 2.55% as the lowest EER (Equal Error Rate) value. Evaluating such models in audios with longer durations, the lowest EER value obtained was 2.40%. The results surpassed those obtained by several studies in the same scenarios, demonstrating the potential practical application of the proposed MLVL approach in a voice biometrics system.eng
dc.description.provenanceSubmitted by Luciana Ferreira (lucgeral@gmail.com) on 2022-05-17T12:09:27Z No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2022-05-17T15:34:22Z (GMT) No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceMade available in DSpace on 2022-05-17T15:34:22Z (GMT). No. of bitstreams: 2 Dissertação - Lucas Alcântara Souza - 2022.pdf: 7052229 bytes, checksum: 46d2727ec8f26525e7ad692e4c10727d (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2022-04-18en
dc.description.resumoUm sistema de biometria por voz deve ser capaz de identificar, na prática, um indivíduo através de áudios de quaisquer durações. Entretanto, os modelos existentes de verificação de falante tem redução de desempenho ao operar com áudios de durações reduzidas. Para enfrentar este problema, foi proposta a abordagem MLVL (Meta-Learning Variable-Length), que consiste em utilizar áudios com durações distintas dentro de um mesmo episódio durante o meta-aprendizado de uma rede prototypical. O objetivo é tornar a verificação de falante, independente do conteúdo, mais robusta ao contexto em que o áudio de confirmação possui curta duração. Os modelos treinados com a abordagem MLVL foram avaliados em três cenários distintos de áudios com curta duração, obtendo 2,55% como menor valor de EER (Equal Error Rate). Avaliando tais modelos em áudios com durações maiores, o menor valor de EER obtido foi de 2,40%. Os resultados superaram os obtidos por diversas pesquisas comparadas nos mesmos cenários, mostrando o potencial de aplicação prática da abordagem MLVL proposta em um sistema de biometria por voz.pt_BR
dc.description.sponsorshipFundação de Apoio à Pesquisapt_BR
dc.identifier.citationSOUZA, L. A. Meta-aprendizado para a verificação de falante com áudios de curta duração. 2022. 74 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022.pt_BR
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/12072
dc.languageporpt_BR
dc.publisherUniversidade Federal de Goiáspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Informática - INF (RG)pt_BR
dc.publisher.initialsUFGpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)pt_BR
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectVerificação de falantepor
dc.subjectBiometria por vozpor
dc.subjectMeta-aprendizadopor
dc.subjectVoice biometricseng
dc.subjectCurta duraçãopor
dc.subjectIndependente do conteúdopor
dc.subjectSpeaker verificationeng
dc.subjectMeta-learningeng
dc.subjectShort durationeng
dc.subjectText-independenteng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleMeta-aprendizado para a verificação de falante com áudios de curta duraçãopt_BR
dc.title.alternativeMeta-learning for speaker verification with short-length audioseng
dc.typeDissertaçãopt_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertação - Lucas Alcântara Souza - 2022.pdf
Tamanho:
6.73 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: