Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina

Bertoni, André Augusto

Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina

dc.contributor.advisor1	Lemos, Rodrigo Pinto
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/3333000136853156	pt_BR
dc.contributor.referee1	Lemos, Rodrigo Pinto
dc.contributor.referee2	Vieira, Flávio Henrique Teles
dc.contributor.referee3	Calixto, Wesley Pacheco
dc.contributor.referee4	Almeida, Anselmo Guerra de
dc.creator	Bertoni, André Augusto
dc.creator.Lattes	http://lattes.cnpq.br/5924224953025095	pt_BR
dc.date.accessioned	2021-05-26T11:27:23Z
dc.date.available	2021-05-26T11:27:23Z
dc.date.issued	2021-04-13
dc.description.abstract	This work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained.	eng
dc.description.resumo	Este trabalho tem por intuito desenvolver algoritmos capazes de prever se uma canção popular brasileira pode se tornar um sucesso comercial, utilizando-se do auxílio de técnicas de Aprendizado de Máquina. Para alcançar este objetivo, foi criado um banco de canções populares brasileiras executadas nas rádios no período de 2014 a 2019, aplicando-se o número de execuções em rádios como o critério para separação das canções em um grupo de sucesso e noutro de canções de não-sucesso. Foram estudadas e aplicadas diversas técnicas de Análise de Dados (Data Analytics) para otimizar os bancos de dados e extrair características estatísticas das canções. A partir do estudo de teoria musical, definiu-se também um conjunto de características semânticas musicais extraídas de cada canção para subsidiar os algoritmos de Aprendizado de Máquina, para, em seguida, empregar-se técnicas de Ciência de Dados (Data Science) para prever se uma canção pode se tornar um sucesso comercial. Utilizaram-se algoritmos de classificação com treinamento supervisionado, tanto por abordagem clássica quanto por meio de Redes Neurais Profundas. Para treinamento e validação, empregou-se validação cruzada com dez subconjuntos para a abordagem com técnicas clássicas, e cinco subconjuntos para as redes convolucionais. Os desempenhos dos algoritmos foram comparados basicamente em termos de acurácia, precisão, sensibilidade e especificidade. A discussão dos resultados deste trabalho demonstrou que características estatísticas extraídas das canções trouxeram resultados satisfatórios em várias métricas, como: Acurácia (69,63%), Precisão: (69,03%), Sensibilidade (71,55%), Acurácia Balanceada (69,75%) e ROC (69,75%), utilizando-se Técnicas Clássicas, como: Naive Bayes, Árvore de Decisões, Floresta Aleatória, kNN, Regressão Logística, Máquina de Vetores de Suporte (SVM) e Multi Layer Perceptron (MLP) - o que representa um excelente resultado, quando comparado à vários outros trabalhos da literatura. As Redes Neurais Profundas do tipo Convolucionais não trouxeram bons resultados, com acurácia pouco melhor do que um sorteio aleatório. O melhor cenário foi conseguido através da junção de três bancos distintos de características: a) estatísticas; b) espectrográficas extraídas da Melodia Principal da Voz; c) informações Semânticas Melódicas Musicais. Com a junção destes três bancos distintos de características obteve-se 74,54% de Precisão.	pt_BR
dc.identifier.citation	BERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021.	pt_BR
dc.identifier.uri	http://repositorio.bc.ufg.br/tede/handle/tede/11387
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Goiás	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)	pt_BR
dc.publisher.initials	UFG	pt_BR
dc.publisher.program	Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC)	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Ciência das canções de sucesso	por
dc.subject	Aprendizado de máquina	por
dc.subject	Extração de características	por
dc.subject	Recuperação de Informações Musicais (RIM)	por
dc.subject	Melodia predominante da voz	por
dc.subject	Hit song science	eng
dc.subject	Machine learning	eng
dc.subject	Feature extraction	eng
dc.subject	Music Information Retrieval (MIR)	eng
dc.subject	Predominant voice melody	eng
dc.subject.cnpq	ENGENHARIAS	pt_BR
dc.title	Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina	pt_BR
dc.title.alternative	Characteristics evaluation and prediction of success of popular brazilian songs through machine learning	eng
dc.type	Dissertação	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Dissertação - André Augusto Bertoni - 2021.pdf
Tamanho:: 7.47 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Mestrado em Engenharia Elétrica e da Computação (EMC)