Future-Shot: Few-Shot Learning to tackle new labels on high-dimensional classification problems
| dc.contributor.advisor1 | Soares, Anderson da Silva | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1096941114079527 | |
| dc.contributor.referee1 | Soares, Anderson da Silva | |
| dc.contributor.referee2 | Galvão Filho, Arlindo Rodrigues | |
| dc.contributor.referee3 | Vieira, Flávio Henrique Teles | |
| dc.contributor.referee4 | Gomes, Herman Martins | |
| dc.contributor.referee5 | Lotufo, Roberto de Alencar | |
| dc.creator | Camargo, Fernando Henrique Fernandes de | |
| dc.creator.Lattes | http://lattes.cnpq.br/0401456515486306 | |
| dc.date.accessioned | 2024-09-16T18:20:52Z | |
| dc.date.available | 2024-09-16T18:20:52Z | |
| dc.date.issued | 2024-02-23 | |
| dc.description.abstract | This thesis introduces a novel approach to address high-dimensional multiclass classification challenges, particularly in dynamic environments where new classes emerge. Named Future-Shot, the method employs metric learning, specifically triplet learning, to train a model capable of generating embeddings for both data points and classes within a shared vector space. This facilitates efficient similarity comparisons using techniques like k-nearest neighbors (\acrshort{knn}), enabling seamless integration of new classes without extensive retraining. Tested on lab-of-origin prediction tasks using the Addgene dataset, Future-Shot achieves top-10 accuracy of $90.39\%$, surpassing existing methods. Notably, in few-shot learning scenarios, it achieves an average top-10 accuracy of $81.2\%$ with just $30\%$ of the data for new classes, demonstrating robustness and efficiency in adapting to evolving class structures | eng |
| dc.description.resumo | Esta tese introduz uma nova abordagem para enfrentar desafios de classificação multiclasse de alta dimensão, particularmente em ambientes dinâmicos onde surgem novas classes. Chamado de Future-Shot, o método emprega metric learning, especificamente triplet learning, para treinar um modelo capaz de gerar embeddings para pontos de dados e classes dentro de um espaço vetorial compartilhado. Isso facilita comparações eficientes de similaridade usando técnicas como k-nearest neighbors (KNN), permitindo integração de novas classes sem extenso treinamento. Testado em tarefas de previsão de laboratório de origem usando o conjunto de dados Addgene, o Future-Shot atinge a acurácia de top10 de 90,39%, superando os métodos existentes. Notavelmente, em cenários de few-shot learning, ele atinge uma acuråcia de top-10 média de 81,2% com apenas 30% dos dados para novas classes, demonstrando robustez e eficiência na adaptação às estruturas em que novas classes são inseridas com o passar do tempo | |
| dc.identifier.citation | CAMARGO, F. H. F. Future-Shot: Few-Shot Learning to tackle new labels on high-dimensional classification problems. 2024. 75 f. Tese (Doutorado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. | |
| dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/13342 | |
| dc.language | eng | |
| dc.publisher | Universidade Federal de Goiás | |
| dc.publisher.country | Brasil | |
| dc.publisher.department | Instituto de Informática - INF (RMG) | |
| dc.publisher.initials | UFG | |
| dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Classificação em alta dimensão | por |
| dc.subject | Predição de laboratório de origem | por |
| dc.subject | Few-shot learning | eng |
| dc.subject | Machine learning | eng |
| dc.subject | Metric learning | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
| dc.title | Future-Shot: Few-Shot Learning to tackle new labels on high-dimensional classification problems | |
| dc.title.alternative | Future-Shot: Few-Shot Learning para lidar com novos rótulos em problemas de classificação de alta dimensão | por |
| dc.type | Tese |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Tese - Fernando Henrique Fernandes de Camargo - 2024.pdf
- Tamanho:
- 20.55 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: