Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina

dc.contributor.advisor1Lemos, Rodrigo Pinto
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3333000136853156pt_BR
dc.contributor.referee1Lemos, Rodrigo Pinto
dc.contributor.referee2Vieira, Flávio Henrique Teles
dc.contributor.referee3Calixto, Wesley Pacheco
dc.contributor.referee4Almeida, Anselmo Guerra de
dc.creatorBertoni, André Augusto
dc.creator.Latteshttp://lattes.cnpq.br/5924224953025095pt_BR
dc.date.accessioned2021-05-26T11:27:23Z
dc.date.available2021-05-26T11:27:23Z
dc.date.issued2021-04-13
dc.description.abstractThis work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained.eng
dc.description.provenanceSubmitted by Luciana Ferreira (lucgeral@gmail.com) on 2021-05-20T11:13:32Z No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-05-26T11:27:23Z (GMT) No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)en
dc.description.provenanceMade available in DSpace on 2021-05-26T11:27:23Z (GMT). No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2021-04-13en
dc.description.resumoEste trabalho tem por intuito desenvolver algoritmos capazes de prever se uma canção popular brasileira pode se tornar um sucesso comercial, utilizando-se do auxílio de técnicas de Aprendizado de Máquina. Para alcançar este objetivo, foi criado um banco de canções populares brasileiras executadas nas rádios no período de 2014 a 2019, aplicando-se o número de execuções em rádios como o critério para separação das canções em um grupo de sucesso e noutro de canções de não-sucesso. Foram estudadas e aplicadas diversas técnicas de Análise de Dados (Data Analytics) para otimizar os bancos de dados e extrair características estatísticas das canções. A partir do estudo de teoria musical, definiu-se também um conjunto de características semânticas musicais extraídas de cada canção para subsidiar os algoritmos de Aprendizado de Máquina, para, em seguida, empregar-se técnicas de Ciência de Dados (Data Science) para prever se uma canção pode se tornar um sucesso comercial. Utilizaram-se algoritmos de classificação com treinamento supervisionado, tanto por abordagem clássica quanto por meio de Redes Neurais Profundas. Para treinamento e validação, empregou-se validação cruzada com dez subconjuntos para a abordagem com técnicas clássicas, e cinco subconjuntos para as redes convolucionais. Os desempenhos dos algoritmos foram comparados basicamente em termos de acurácia, precisão, sensibilidade e especificidade. A discussão dos resultados deste trabalho demonstrou que características estatísticas extraídas das canções trouxeram resultados satisfatórios em várias métricas, como: Acurácia (69,63%), Precisão: (69,03%), Sensibilidade (71,55%), Acurácia Balanceada (69,75%) e ROC (69,75%), utilizando-se Técnicas Clássicas, como: Naive Bayes, Árvore de Decisões, Floresta Aleatória, kNN, Regressão Logística, Máquina de Vetores de Suporte (SVM) e Multi Layer Perceptron (MLP) - o que representa um excelente resultado, quando comparado à vários outros trabalhos da literatura. As Redes Neurais Profundas do tipo Convolucionais não trouxeram bons resultados, com acurácia pouco melhor do que um sorteio aleatório. O melhor cenário foi conseguido através da junção de três bancos distintos de características: a) estatísticas; b) espectrográficas extraídas da Melodia Principal da Voz; c) informações Semânticas Melódicas Musicais. Com a junção destes três bancos distintos de características obteve-se 74,54% de Precisão.pt_BR
dc.identifier.citationBERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021.pt_BR
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/11387
dc.languageporpt_BR
dc.publisherUniversidade Federal de Goiáspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)pt_BR
dc.publisher.initialsUFGpt_BR
dc.publisher.programPrograma de Pós-graduação em Engenharia Elétrica e da Computação (EMC)pt_BR
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectCiência das canções de sucessopor
dc.subjectAprendizado de máquinapor
dc.subjectExtração de característicaspor
dc.subjectRecuperação de Informações Musicais (RIM)por
dc.subjectMelodia predominante da vozpor
dc.subjectHit song scienceeng
dc.subjectMachine learningeng
dc.subjectFeature extractioneng
dc.subjectMusic Information Retrieval (MIR)eng
dc.subjectPredominant voice melodyeng
dc.subject.cnpqENGENHARIASpt_BR
dc.titleAvaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquinapt_BR
dc.title.alternativeCharacteristics evaluation and prediction of success of popular brazilian songs through machine learningeng
dc.typeDissertaçãopt_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertação - André Augusto Bertoni - 2021.pdf
Tamanho:
7.47 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: