Mínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dados
dc.contributor.advisor1 | Barbosa, Rommel Melgaço | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6228227125338610 | pt_BR |
dc.contributor.referee1 | Barbosa, Rommel Melgaço | |
dc.contributor.referee2 | Santos, Helton Saulo Bezerra dos | |
dc.contributor.referee3 | Lozano, Kátia Kelvis Cassiano | |
dc.contributor.referee4 | Costa, Ronaldo Martins da | |
dc.contributor.referee5 | Rosa, Thierson Couto | |
dc.creator | Lima, Márcio Dias de | |
dc.creator.Lattes | http://lattes.cnpq.br/0871622130269869 | pt_BR |
dc.date.accessioned | 2021-01-26T14:04:28Z | |
dc.date.available | 2021-01-26T14:04:28Z | |
dc.date.issued | 2018-12-07 | |
dc.description.abstract | Data mining is an emerging area due to the increasing amount of data available in a variety of fields. In this context twin support vector machine (TWSVM) has attracted the attention of several researchers. In this thesis, we developed a feature selector algorithm and an algorithm for multi-class problems based on TWSVM. This learning algorithm with ternary outputs {- 1,0,+1 } is based on the Vapnik support vector theory, and evaluates all training samples with a 1-×-1-×-rest structure during the decomposition phase. One of the main advantages of the proposed algorithm is the use of the least squares version for multi-class problems, where it is necessary to solve two systems of linear equations instead of two quadratic programming problems in TWSVM. We also implemented the principle of minimization of structural risk in order to improve the generalizability. The Sherman-Morisson-Woodbury formula is applied to reduce the complexity of the non-linear formulation of the algorithm. We also apply data mining techniques that combine the use of analytical technique with data mining algorithms in the classification of several samples. The developed framework could be an excellent tool for detecting different types of fraud, verifying if products were grown in organic or conventional systems, as well as tracing the region of origin of wine made from a given type of grape. | eng |
dc.description.provenance | Submitted by Marlene Santos (marlene.bc.ufg@gmail.com) on 2021-01-25T21:22:24Z No. of bitstreams: 2 Tese - Márcio Dias de Lima - 2018.pdf: 2238484 bytes, checksum: 3488de15a7663f59f36675e2169a4958 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-01-26T14:04:28Z (GMT) No. of bitstreams: 2 Tese - Márcio Dias de Lima - 2018.pdf: 2238484 bytes, checksum: 3488de15a7663f59f36675e2169a4958 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Made available in DSpace on 2021-01-26T14:04:28Z (GMT). No. of bitstreams: 2 Tese - Márcio Dias de Lima - 2018.pdf: 2238484 bytes, checksum: 3488de15a7663f59f36675e2169a4958 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2018-12-07 | en |
dc.description.resumo | Mineração de dados é uma área emergente, devido à quantidade crescente de dados produzidos nas mais variadas áreas. Neste contexto, as máquinas de vetores de suportes duplos (TWSVM) têm recebido muita atenção por partes de pesquisadores. Elaboramos um algoritmo seletor de variáveis e um algoritmo para problemas de múltiplas classes baseado no TWSVM. Esse algoritmo de aprendizagem com saídas ternárias {-1,0,+1} é baseado na teoria de vetores de suporte de Vapnik, e avalia todas as amostras de treinamento com uma estrutura 1-×-1-×-restante, durante a fase de decomposição. Uma das principais vantagens do algoritmo proposto é que utilizamos a versão mínimos quadrados para problemas de múltiplas classes, onde é necessário resolver dois sistemas de equações lineares, ao contrário do TWSVM em que é necessário resolver dois problemas de programação quadrática. Implementamos o princípio de minimização do risco estrutural, a fim de melhorar a habilidade de generalização. Utilizamos a fórmula de Sherman-Morisson-Woodbury com o intuito de reduzir a complexidade na formulação não linear do algoritmo. Abordamos também aplicações de técnicas de mineração de dados que combinam a utilização de técnicas analíticas com algoritmos de mineração de dados na classificação de diversas amostras, podendo ser considerada uma excelente ferramenta na detecção de fraudes de diversos tipos, como na verificação de produtos cultivados nos sistemas orgânicos ou convencional, a fim de diferenciá-los, e também na verificação quanto a origem geográfica de vinhos produzidos de um determinado tipo de uva. | pt_BR |
dc.description.sponsorship | Outro | pt_BR |
dc.identifier.citation | LIMA, M. D. Mínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dados. 2018. 127 f. Tese (Doutorado em Ciência da Computação em Rede) - Universidade Federal de Goiás, Goiânia, 2018. | pt_BR |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/11066 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Goiás | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Informática - INF (RG) | pt_BR |
dc.publisher.initials | UFG | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação em Rede UFG/UFMS (INF) | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Mineração de dados | por |
dc.subject | SVM | por |
dc.subject | TWSVM | por |
dc.subject | Mínimos quadrados | por |
dc.subject | Classificação | por |
dc.subject | Data Mining | eng |
dc.subject | Least squares | eng |
dc.subject | Classification | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO | pt_BR |
dc.title | Mínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dados | pt_BR |
dc.title.alternative | Least squares for multiple class problems involving twin support vector machine and data mining applications | eng |
dc.type | Tese | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Tese - Márcio Dias de Lima - 2018.pdf
- Tamanho:
- 2.13 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: