Aprimoramento do modelo de seleção dos padrões associativos: uma abordagem de mineração de dados
dc.contributor.advisor1 | Barbosa, Rommel Melgaço | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6228227125338610 | pt_BR |
dc.contributor.referee1 | Barbosa, Rommel Melgaço | |
dc.contributor.referee2 | Costa, Ronaldo Martins da | |
dc.contributor.referee3 | Costa, Nattane Luíza da | |
dc.contributor.referee4 | Rocha, Marcelo Lisboa | |
dc.contributor.referee5 | Jorge, Lúcio de Castro | |
dc.creator | Rodrigues, Diego de Castro | |
dc.creator.Lattes | http://lattes.cnpq.br/9582612733423890 | pt_BR |
dc.date.accessioned | 2022-01-19T12:29:17Z | |
dc.date.available | 2022-01-19T12:29:17Z | |
dc.date.issued | 2021-12-20 | |
dc.description.abstract | The objective of this study is to improve the association rule selection model through a set of asymmetric probabilistic metrics. We present the Health Association Rules - HAR, based on Apriori, the algorithm is composed of six functions and uses alternative metrics to the Support/Confidence model to identify the implication X → Y . Initially, the application of our solution was focused only on health data, but we realized that asymmetrical associative patterns could be applied in other contexts that seek to address the cause and effect of a pattern. Our experiments were composed of 60 real datasets taken from specialist websites, research partnerships and open data. We empirically observed the behavior of HAR in all data sets, and a comparison was performed with the classical Apriori algorithm. We realized that it has overcome the main problems of the Support/Confidence model. We were able to identify the most relevant patterns for the observed datasets, eliminating logical contradictions and redundancies. We also perform a statistical analysis of the experiments where the statistical effect is positive for HAR. HAR was able to discover more representative patterns and rare patterns, in addition to being able to perform rule grouping, filtering and ranking. Our solution presented a linear behavior in the experiments, being able to be applied in health, social, content suggestion, product indication and educational data. Not limited to these data domains, HAR is prepared to receive large amounts of data by using a customized parallel architecture. | eng |
dc.description.provenance | Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2022-01-18T13:00:15Z No. of bitstreams: 2 Tese - Diego de Castro Rodrigues - 2021.pdf: 25933905 bytes, checksum: d986febf6f91b5c564368b1d9d3c206b (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2022-01-19T12:29:17Z (GMT) No. of bitstreams: 2 Tese - Diego de Castro Rodrigues - 2021.pdf: 25933905 bytes, checksum: d986febf6f91b5c564368b1d9d3c206b (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Made available in DSpace on 2022-01-19T12:29:17Z (GMT). No. of bitstreams: 2 Tese - Diego de Castro Rodrigues - 2021.pdf: 25933905 bytes, checksum: d986febf6f91b5c564368b1d9d3c206b (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2021-12-20 | en |
dc.description.resumo | O objetivo deste estudo é aprimorar o modelo de seleção de regras de associação através de um conjunto de métricas probabilísticas assimétricas. Apresentamos o Health Association Rules - HAR, baseado no Apriori o algoritmo é composto por seis funções e usa métricas alternativas ao modelo Suporte/Confiança para identificar a implicação X → Y . Inicial- mente, a aplicação de nossa solução era focada apenas em dados de saúde, mas percebemos que padrões associativos assimétricos poderiam ser aplicados em outros contextos que buscam abordar a causa e o efeito de um padrão. Nossos experimentos foram compostos de 60 conjuntos de dados reais retirados de sites especializados, parcerias de pesquisa e dados abertos. Observamos empiricamente o comportamento do HAR em todos os conjuntos de dados e uma comparação foi realizada com o algoritmo clássico Apriori. Percebemos que superou os principais problemas do modelo Suporte/Confiança. Conseguimos identificar os padrões mais relevantes para os conjuntos de dados observados, eliminando contradições lógicas e redundâncias. Também realizamos uma análise estatística dos experimentos em que o efeito estatístico é positivo para HAR. O HAR conseguiu descobrir padrões mais representativos e padrões raros, além de consegui realizar agrupamento de regras, filtro e ranqueamento. Nossa solução apresentou um comportamento linear nos experimentos, po- dendo ser aplicada em dados de saúde, sociais, sugestão de conteúdo, indicação de produto e educacional. Não se limitando a esses domínios de dados, o HAR está preparado para receber grandes quantidades de dados por utilizar uma arquitetura paralela customizada. | pt_BR |
dc.identifier.citation | RODRIGUES, D. C. Aprimoramento do modelo de seleção dos padrões associativos: uma abordagem de mineração de dados. 2021. 184 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2021. | pt_BR |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/11850 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Goiás | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Informática - INF (RG) | pt_BR |
dc.publisher.initials | UFG | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Mineração de dados | por |
dc.subject | Padrões associativos | por |
dc.subject | Métricas assimétricas | por |
dc.subject | Regras de associação | por |
dc.subject | Data Mining | eng |
dc.subject | Associative patterns | eng |
dc.subject | Asymmetric metrics | eng |
dc.subject | Association rules | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.title | Aprimoramento do modelo de seleção dos padrões associativos: uma abordagem de mineração de dados | pt_BR |
dc.title.alternative | Improving the standards selection model associatives: a data mining approach | eng |
dc.type | Tese | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Tese - Diego de Castro Rodrigues - 2021.pdf
- Tamanho:
- 24.73 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: