Future-Shot: Few-Shot Learning to tackle new labels on high-dimensional classification problems

dc.contributor.advisor1Soares, Anderson da Silva
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1096941114079527
dc.contributor.referee1Soares, Anderson da Silva
dc.contributor.referee2Galvão Filho, Arlindo Rodrigues
dc.contributor.referee3Vieira, Flávio Henrique Teles
dc.contributor.referee4Gomes, Herman Martins
dc.contributor.referee5Lotufo, Roberto de Alencar
dc.creatorCamargo, Fernando Henrique Fernandes de
dc.creator.Latteshttp://lattes.cnpq.br/0401456515486306
dc.date.accessioned2024-09-16T18:20:52Z
dc.date.available2024-09-16T18:20:52Z
dc.date.issued2024-02-23
dc.description.abstractThis thesis introduces a novel approach to address high-dimensional multiclass classification challenges, particularly in dynamic environments where new classes emerge. Named Future-Shot, the method employs metric learning, specifically triplet learning, to train a model capable of generating embeddings for both data points and classes within a shared vector space. This facilitates efficient similarity comparisons using techniques like k-nearest neighbors (\acrshort{knn}), enabling seamless integration of new classes without extensive retraining. Tested on lab-of-origin prediction tasks using the Addgene dataset, Future-Shot achieves top-10 accuracy of $90.39\%$, surpassing existing methods. Notably, in few-shot learning scenarios, it achieves an average top-10 accuracy of $81.2\%$ with just $30\%$ of the data for new classes, demonstrating robustness and efficiency in adapting to evolving class structureseng
dc.description.resumoEsta tese introduz uma nova abordagem para enfrentar desafios de classificação multiclasse de alta dimensão, particularmente em ambientes dinâmicos onde surgem novas classes. Chamado de Future-Shot, o método emprega metric learning, especificamente triplet learning, para treinar um modelo capaz de gerar embeddings para pontos de dados e classes dentro de um espaço vetorial compartilhado. Isso facilita comparações eficientes de similaridade usando técnicas como k-nearest neighbors (KNN), permitindo integração de novas classes sem extenso treinamento. Testado em tarefas de previsão de laboratório de origem usando o conjunto de dados Addgene, o Future-Shot atinge a acurácia de top10 de 90,39%, superando os métodos existentes. Notavelmente, em cenários de few-shot learning, ele atinge uma acuråcia de top-10 média de 81,2% com apenas 30% dos dados para novas classes, demonstrando robustez e eficiência na adaptação às estruturas em que novas classes são inseridas com o passar do tempo
dc.identifier.citationCAMARGO, F. H. F. Future-Shot: Few-Shot Learning to tackle new labels on high-dimensional classification problems. 2024. 75 f. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/13342
dc.languageeng
dc.publisherUniversidade Federal de Goiás
dc.publisher.countryBrasil
dc.publisher.departmentInstituto de Informática - INF (RMG)
dc.publisher.initialsUFG
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectClassificação em alta dimensãopor
dc.subjectPredição de laboratório de origempor
dc.subjectFew-shot learningeng
dc.subjectMachine learningeng
dc.subjectMetric learningeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleFuture-Shot: Few-Shot Learning to tackle new labels on high-dimensional classification problems
dc.title.alternativeFuture-Shot: Few-Shot Learning para lidar com novos rótulos em problemas de classificação de alta dimensãopor
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese - Fernando Henrique Fernandes de Camargo - 2024.pdf
Tamanho:
20.55 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: