Mineração de opinião em mídias sociais com aprendizado de máquina
dc.contributor.advisor1 | Calixto, Wesley Pacheco | |
dc.contributor.advisor1Lattes | https://orcid.org/0000-0002-1928-4432 | pt_BR |
dc.contributor.referee1 | Calixto, Wesley Pacheco | |
dc.contributor.referee2 | Ribeiro, Luiz Eduardo Bento | |
dc.contributor.referee3 | Reis, Márcio Rodrigues da Cunha | |
dc.contributor.referee4 | Cruz Junior, Gelson da | |
dc.contributor.referee5 | Marques, Leonardo Garcia | |
dc.creator | Brandão, Jhonathan de Godoi | |
dc.creator.Lattes | http://lattes.cnpq.br/7322489654843870 | pt_BR |
dc.date.accessioned | 2021-03-23T19:43:18Z | |
dc.date.available | 2021-03-23T19:43:18Z | |
dc.date.issued | 2020-10-14 | |
dc.description.abstract | The aim of this work is to develop a tool for that optimizes supervised machine learning models in order to classify polarity of opinions in tweets. Five different datasets are used, which are prepared, preprocessed and then used as input for the training and evaluation stage of machine learning models. The best accuracy results obtained in the training and evaluation of the models are 82.45% for the data without preprocessing × 78.83% with all the proposed preprocessing for the dataset using the Naive Bayes classifier. Finally, hyperparametric optimization of the classifiers and selection of the model that obtains the best accuracy is performed. The optimized model achieves an accuracy greater than 90% for some data sets. The supervised learning techniques depend on labeled data for training, the proposed method produces similar performances for datasets of varying sizes, which allows the development of optimized classification models with reduced amount of labeled data. | eng |
dc.description.provenance | Submitted by Franciele Moreira (francielemoreyra@gmail.com) on 2021-03-19T19:23:14Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5) | en |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-03-23T19:43:18Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5) | en |
dc.description.provenance | Made available in DSpace on 2021-03-23T19:43:18Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Dissertação - Jhonathan de Godoi Brandão - 2020.pdf: 2630291 bytes, checksum: e8f23b1d577fd2e62bc013e64ad8a02a (MD5) Previous issue date: 2020-10-14 | en |
dc.description.resumo | O objetivo deste trabalho é desenvolver ferramenta que otimize modelos de aprendizado supervisionado de máquina para classificar polaridade de opiniões em tuítes. São utilizados cinco conjuntos de dados distintos que são preparados, preprocessados e então utilizados como entrada para a etapa de treinamento e avaliação dos modelos de aprendizado de máquina. Os melhores resultados de acurácia obtidos no treinamento e avaliação dos modelos são de 82,45% para os dados sem preprocessamento × 78,83% com todos os preprocessamentos propostos para o conjunto de dados utilizando classificador Naive Bayes. Por fim, é realizada otimização hiperparamétrica dos classificadores e seleção do modelo que obtém a melhor acurácia. O modelo otimizado obtém acurácia maior que 90% para alguns conjuntos de dados. As técnicas de aprendizado supervisionados apresentam dependência de dados rotulados para treinamento, o método proposto produz desempenhos semelhantes para conjuntos de dados de tamanhos variados, o que possibilita o desenvolvimento de modelos de classificação otimizados com quantidade reduzida de dados rotulados. | pt_BR |
dc.description.sponsorship | Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq | pt_BR |
dc.identifier.citation | BRANDÃO, J. G. Mineração de opinião em mídias sociais com aprendizado de máquina. 2020. 70 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2020. | pt_BR |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/11185 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Goiás | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG) | pt_BR |
dc.publisher.initials | UFG | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC) | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Análise de sentimentos | por |
dc.subject | Mineração de opinião | por |
dc.subject | Aprendizado de máquina | por |
dc.subject | Sentiment analysis | eng |
dc.subject | Opinion mining | eng |
dc.subject | Machine learning | eng |
dc.subject.cnpq | ENGENHARIAS | pt_BR |
dc.title | Mineração de opinião em mídias sociais com aprendizado de máquina | pt_BR |
dc.title.alternative | Opinion mining on social media with machine learning | eng |
dc.type | Dissertação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Dissertação - Jhonathan de Godoi Brandão - 2020.pdf
- Tamanho:
- 2.51 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: