Algoritmos de aprendizado de máquina na predição e avaliação de evasão de clientes em ambiente de produção

dc.contributor.advisor1Soares, Anderson da Silva
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1096941114079527pt_BR
dc.contributor.referee1Soares, Anderson da Silva
dc.contributor.referee2Soares, Telma Woerle de Lima
dc.contributor.referee3Sousa, Rafael Teixeira
dc.creatorOliveira, Breno
dc.creator.Latteshttp://lattes.cnpq.br/3843157752512003pt_BR
dc.date.accessioned2021-08-02T11:35:46Z
dc.date.available2021-08-02T11:35:46Z
dc.date.issued2021-07-02
dc.description.abstractThe development of machine learning solutions involves several well-established stages. However, scientific studies have a concentration on stages such as data engineering, model training, and performance evaluation metrics. The advent of machine learning solutions implementation in business environments at an unprecedented level inspires the revisiting of some problems previously mentioned in the literature, but little explored. Among them, monitoring and evaluating the deterioration of the solution over time. During machine learning models training, it is assumed that the data not seen by the model in production presents the same distribution as the data used during the training stage. However, production models can decrease/lose performance as data changes over time. This phenomenon is defined in the literature as concept deviation. In this context, this work proposes a methodology that uses Auto Machine Learning with data stream learning capable of mitigating eventual concept deviations that may arise in the models implemented in a production environment. Real data from a customer avoidance problem (Churn) of a large-circulation regional newspaper were used. Three machine learning models were implemented using two methodologies: the proposed methodology called autoML-DS and the reference methodology that makes use of conventional model retraining. The results showed that the reference methodology presents performance losses of the implemented models, while the autoML-DS has its predictive capacity preserved. AutoML-DS was able to adapt the models over time, without having to perform a complete retraining, keeping small variations in the error rate.eng
dc.description.provenanceSubmitted by Luciana Ferreira (lucgeral@gmail.com) on 2021-07-29T12:21:26Z No. of bitstreams: 2 Dissertação - Breno Oliveira - 2021.pdf: 3559015 bytes, checksum: 13b790a2df242d1fa7e05a02716b37eb (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-08-02T11:35:46Z (GMT) No. of bitstreams: 2 Dissertação - Breno Oliveira - 2021.pdf: 3559015 bytes, checksum: 13b790a2df242d1fa7e05a02716b37eb (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceMade available in DSpace on 2021-08-02T11:35:46Z (GMT). No. of bitstreams: 2 Dissertação - Breno Oliveira - 2021.pdf: 3559015 bytes, checksum: 13b790a2df242d1fa7e05a02716b37eb (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2021-07-02en
dc.description.resumoO desenvolvimento de soluções de aprendizado de máquina prevê diversas etapas bem estabelecidas. No entanto, os estudos científicos possuem uma concentração em etapas como engenharia de dados, treinamento do modelo e métricas de avaliação de desempenho. O advento da implantação de soluções de aprendizado de máquina em ambientes empresariais em um nível sem precedentes inspira a revisitação de alguns problemas anteriormente apontados na literatura, porém pouco explorados como o monitoramento e avaliação da deterioração da solução ao longo do tempo. Durante o treinamento dos modelos de aprendizado de máquina, supõe-se que os dados não vistos pelo modelo em produção apresentem a mesma distribuição dos dados utilizados durante a etapa de treinamento. Modelos em produção podem perder desempenho à medida que os dados sofram alterações com o passar do tempo. Este fenômeno é definido na literatura como desvio de conceito. Nesse contexto, este trabalho propõe uma metodologia que utiliza Auto Machine Learning com aprendizado de dados em stream capazes de mitigar eventuais desvios de conceito que possam surgir nos modelos implementados em ambiente de produção. Foram utilizados dados reais de um problema de evasão de clientes (Churn) de um jornal de grande circulação regional. Foram implementados três modelos de aprendizado de máquina utilizando duas metodologias: a metodologia proposta denominada autoML-DS e a metodologia de referência que faz uso de retreinamento convencional dos modelos. Os resultados demonstraram que a metodologia de referência apresenta perdas de desempenho dos modelos implementados enquanto o autoML-DS tem sua capacidade preditiva preservada. O autoML-DS foi capaz de adaptar os modelos ao longo do tempo, sem a necessidade da realização de um retreino completo, mantendo pequenas variações na proporção de erros.pt_BR
dc.identifier.citationOLIVEIRA, B. Algoritmos de aprendizado de máquina na predição e avaliação de evasão de clientes em ambiente de produção. 2021. 87 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, 2021.pt_BR
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/11522
dc.languageporpt_BR
dc.publisherUniversidade Federal de Goiáspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Informática - INF (RG)pt_BR
dc.publisher.initialsUFGpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)pt_BR
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectDesvio de conceitopor
dc.subjectAuto machine laerningpor
dc.subjectDados em streampor
dc.subjectMachine learningeng
dc.subjectAlgorithms in predictingeng
dc.subjectEvaluating customer evasion in a production environmenteng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleAlgoritmos de aprendizado de máquina na predição e avaliação de evasão de clientes em ambiente de produçãopt_BR
dc.title.alternativeMachine learning algorithms in predicting and evaluating customer evasion in a production environmenteng
dc.typeDissertaçãopt_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertação - Breno Oliveira - 2021.pdf
Tamanho:
3.39 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: