Mínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dados

dc.contributor.advisor1Barbosa, Rommel Melgaço
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6228227125338610pt_BR
dc.contributor.referee1Barbosa, Rommel Melgaço
dc.contributor.referee2Santos, Helton Saulo Bezerra dos
dc.contributor.referee3Lozano, Kátia Kelvis Cassiano
dc.contributor.referee4Costa, Ronaldo Martins da
dc.contributor.referee5Rosa, Thierson Couto
dc.creatorLima, Márcio Dias de
dc.creator.Latteshttp://lattes.cnpq.br/0871622130269869pt_BR
dc.date.accessioned2021-01-26T14:04:28Z
dc.date.available2021-01-26T14:04:28Z
dc.date.issued2018-12-07
dc.description.abstractData mining is an emerging area due to the increasing amount of data available in a variety of fields. In this context twin support vector machine (TWSVM) has attracted the attention of several researchers. In this thesis, we developed a feature selector algorithm and an algorithm for multi-class problems based on TWSVM. This learning algorithm with ternary outputs {- 1,0,+1 } is based on the Vapnik support vector theory, and evaluates all training samples with a 1-×-1-×-rest structure during the decomposition phase. One of the main advantages of the proposed algorithm is the use of the least squares version for multi-class problems, where it is necessary to solve two systems of linear equations instead of two quadratic programming problems in TWSVM. We also implemented the principle of minimization of structural risk in order to improve the generalizability. The Sherman-Morisson-Woodbury formula is applied to reduce the complexity of the non-linear formulation of the algorithm. We also apply data mining techniques that combine the use of analytical technique with data mining algorithms in the classification of several samples. The developed framework could be an excellent tool for detecting different types of fraud, verifying if products were grown in organic or conventional systems, as well as tracing the region of origin of wine made from a given type of grape.eng
dc.description.provenanceSubmitted by Marlene Santos (marlene.bc.ufg@gmail.com) on 2021-01-25T21:22:24Z No. of bitstreams: 2 Tese - Márcio Dias de Lima - 2018.pdf: 2238484 bytes, checksum: 3488de15a7663f59f36675e2169a4958 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-01-26T14:04:28Z (GMT) No. of bitstreams: 2 Tese - Márcio Dias de Lima - 2018.pdf: 2238484 bytes, checksum: 3488de15a7663f59f36675e2169a4958 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceMade available in DSpace on 2021-01-26T14:04:28Z (GMT). No. of bitstreams: 2 Tese - Márcio Dias de Lima - 2018.pdf: 2238484 bytes, checksum: 3488de15a7663f59f36675e2169a4958 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2018-12-07en
dc.description.resumoMineração de dados é uma área emergente, devido à quantidade crescente de dados produzidos nas mais variadas áreas. Neste contexto, as máquinas de vetores de suportes duplos (TWSVM) têm recebido muita atenção por partes de pesquisadores. Elaboramos um algoritmo seletor de variáveis e um algoritmo para problemas de múltiplas classes baseado no TWSVM. Esse algoritmo de aprendizagem com saídas ternárias {-1,0,+1} é baseado na teoria de vetores de suporte de Vapnik, e avalia todas as amostras de treinamento com uma estrutura 1-×-1-×-restante, durante a fase de decomposição. Uma das principais vantagens do algoritmo proposto é que utilizamos a versão mínimos quadrados para problemas de múltiplas classes, onde é necessário resolver dois sistemas de equações lineares, ao contrário do TWSVM em que é necessário resolver dois problemas de programação quadrática. Implementamos o princípio de minimização do risco estrutural, a fim de melhorar a habilidade de generalização. Utilizamos a fórmula de Sherman-Morisson-Woodbury com o intuito de reduzir a complexidade na formulação não linear do algoritmo. Abordamos também aplicações de técnicas de mineração de dados que combinam a utilização de técnicas analíticas com algoritmos de mineração de dados na classificação de diversas amostras, podendo ser considerada uma excelente ferramenta na detecção de fraudes de diversos tipos, como na verificação de produtos cultivados nos sistemas orgânicos ou convencional, a fim de diferenciá-los, e também na verificação quanto a origem geográfica de vinhos produzidos de um determinado tipo de uva.pt_BR
dc.description.sponsorshipOutropt_BR
dc.identifier.citationLIMA, M. D. Mínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dados. 2018. 127 f. Tese (Doutorado em Ciência da Computação em Rede) - Universidade Federal de Goiás, Goiânia, 2018.pt_BR
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/11066
dc.languageporpt_BR
dc.publisherUniversidade Federal de Goiáspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Informática - INF (RG)pt_BR
dc.publisher.initialsUFGpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação em Rede UFG/UFMS (INF)pt_BR
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectMineração de dadospor
dc.subjectSVMpor
dc.subjectTWSVMpor
dc.subjectMínimos quadradospor
dc.subjectClassificaçãopor
dc.subjectData Miningeng
dc.subjectLeast squareseng
dc.subjectClassificationeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOpt_BR
dc.titleMínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dadospt_BR
dc.title.alternativeLeast squares for multiple class problems involving twin support vector machine and data mining applicationseng
dc.typeTesept_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Tese - Márcio Dias de Lima - 2018.pdf
Tamanho:
2.13 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: