Algoritmos de aprendizado de máquina na predição e avaliação de evasão de clientes em ambiente de produção
dc.contributor.advisor1 | Soares, Anderson da Silva | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1096941114079527 | pt_BR |
dc.contributor.referee1 | Soares, Anderson da Silva | |
dc.contributor.referee2 | Soares, Telma Woerle de Lima | |
dc.contributor.referee3 | Sousa, Rafael Teixeira | |
dc.creator | Oliveira, Breno | |
dc.creator.Lattes | http://lattes.cnpq.br/3843157752512003 | pt_BR |
dc.date.accessioned | 2021-08-02T11:35:46Z | |
dc.date.available | 2021-08-02T11:35:46Z | |
dc.date.issued | 2021-07-02 | |
dc.description.abstract | The development of machine learning solutions involves several well-established stages. However, scientific studies have a concentration on stages such as data engineering, model training, and performance evaluation metrics. The advent of machine learning solutions implementation in business environments at an unprecedented level inspires the revisiting of some problems previously mentioned in the literature, but little explored. Among them, monitoring and evaluating the deterioration of the solution over time. During machine learning models training, it is assumed that the data not seen by the model in production presents the same distribution as the data used during the training stage. However, production models can decrease/lose performance as data changes over time. This phenomenon is defined in the literature as concept deviation. In this context, this work proposes a methodology that uses Auto Machine Learning with data stream learning capable of mitigating eventual concept deviations that may arise in the models implemented in a production environment. Real data from a customer avoidance problem (Churn) of a large-circulation regional newspaper were used. Three machine learning models were implemented using two methodologies: the proposed methodology called autoML-DS and the reference methodology that makes use of conventional model retraining. The results showed that the reference methodology presents performance losses of the implemented models, while the autoML-DS has its predictive capacity preserved. AutoML-DS was able to adapt the models over time, without having to perform a complete retraining, keeping small variations in the error rate. | eng |
dc.description.provenance | Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2021-07-29T12:21:26Z No. of bitstreams: 2 Dissertação - Breno Oliveira - 2021.pdf: 3559015 bytes, checksum: 13b790a2df242d1fa7e05a02716b37eb (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-08-02T11:35:46Z (GMT) No. of bitstreams: 2 Dissertação - Breno Oliveira - 2021.pdf: 3559015 bytes, checksum: 13b790a2df242d1fa7e05a02716b37eb (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) | en |
dc.description.provenance | Made available in DSpace on 2021-08-02T11:35:46Z (GMT). No. of bitstreams: 2 Dissertação - Breno Oliveira - 2021.pdf: 3559015 bytes, checksum: 13b790a2df242d1fa7e05a02716b37eb (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2021-07-02 | en |
dc.description.resumo | O desenvolvimento de soluções de aprendizado de máquina prevê diversas etapas bem estabelecidas. No entanto, os estudos científicos possuem uma concentração em etapas como engenharia de dados, treinamento do modelo e métricas de avaliação de desempenho. O advento da implantação de soluções de aprendizado de máquina em ambientes empresariais em um nível sem precedentes inspira a revisitação de alguns problemas anteriormente apontados na literatura, porém pouco explorados como o monitoramento e avaliação da deterioração da solução ao longo do tempo. Durante o treinamento dos modelos de aprendizado de máquina, supõe-se que os dados não vistos pelo modelo em produção apresentem a mesma distribuição dos dados utilizados durante a etapa de treinamento. Modelos em produção podem perder desempenho à medida que os dados sofram alterações com o passar do tempo. Este fenômeno é definido na literatura como desvio de conceito. Nesse contexto, este trabalho propõe uma metodologia que utiliza Auto Machine Learning com aprendizado de dados em stream capazes de mitigar eventuais desvios de conceito que possam surgir nos modelos implementados em ambiente de produção. Foram utilizados dados reais de um problema de evasão de clientes (Churn) de um jornal de grande circulação regional. Foram implementados três modelos de aprendizado de máquina utilizando duas metodologias: a metodologia proposta denominada autoML-DS e a metodologia de referência que faz uso de retreinamento convencional dos modelos. Os resultados demonstraram que a metodologia de referência apresenta perdas de desempenho dos modelos implementados enquanto o autoML-DS tem sua capacidade preditiva preservada. O autoML-DS foi capaz de adaptar os modelos ao longo do tempo, sem a necessidade da realização de um retreino completo, mantendo pequenas variações na proporção de erros. | pt_BR |
dc.identifier.citation | OLIVEIRA, B. Algoritmos de aprendizado de máquina na predição e avaliação de evasão de clientes em ambiente de produção. 2021. 87 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, 2021. | pt_BR |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/11522 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Goiás | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Informática - INF (RG) | pt_BR |
dc.publisher.initials | UFG | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Desvio de conceito | por |
dc.subject | Auto machine laerning | por |
dc.subject | Dados em stream | por |
dc.subject | Machine learning | eng |
dc.subject | Algorithms in predicting | eng |
dc.subject | Evaluating customer evasion in a production environment | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.title | Algoritmos de aprendizado de máquina na predição e avaliação de evasão de clientes em ambiente de produção | pt_BR |
dc.title.alternative | Machine learning algorithms in predicting and evaluating customer evasion in a production environment | eng |
dc.type | Dissertação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Dissertação - Breno Oliveira - 2021.pdf
- Tamanho:
- 3.39 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: