Detecção de posicionamento do cidadão em Projetos de Lei

Maia, Dyonnatan Ferreira

Detecção de posicionamento do cidadão em Projetos de Lei

dc.contributor.advisor1	Silva, Nádia Félix Felipe da
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/7864834001694765
dc.contributor.referee1	Silva, Nádia Félix Felipe da
dc.contributor.referee2	Pereira, Fabíola Souza Fernande
dc.contributor.referee3	Fernandes, Deborah Silva Alves
dc.creator	Maia, Dyonnatan Ferreira
dc.creator.Lattes	http://lattes.cnpq.br/0742505090314413
dc.date.accessioned	2024-09-16T18:07:03Z
dc.date.available	2024-09-16T18:07:03Z
dc.date.issued	2024-03-22
dc.description.abstract	Background: Comments on political projects on the internet reflect the aspirations of a significant portion of the population. The automatic stance detection of these comments regarding specific topics can help better understand public opinion. This study aims to develop a computational model with supervised learning capable of estimating the stance of comments on legislative propositions, considering the challenge of diversity and the constant emergence of new bills. Method: For the domain studied, a specific corpus was constructed by collecting comments from surveys available on the Chamber of Deputies website. The experiments included the evaluation of classic machine learning models, such as Logistic Regression, Naive Bayes, Support Vector Machine, Random Forest, and Multilayer Perceptron, in addition to the fine-tuning of BERT language models. Automatic data annotation was also performed using the zero-shot approach based on prompts from the generative GPT-3.5 model, aiming to overcome the difficulties related to human annotation and the scarcity of annotated data, generating approximately three times the size of the manually annotated corpus. Results: The results indicate that the adjusted BERTimbau model surpassed the classic approaches, achieving an average F1- score of 70.4% on unseen topics. Moreover, the application of automatically annotated data in the initial stage of BERTimbau fine-tuning resulted in performance improvement, reaching an F1-score of 73.3%. The results present deep learning models as options with positive performance for the task under the conditions of this domain. Conclusion: It was observed that the ability to generate contextualized representations, along with the number of topics and comments trained, can directly interfere with performance. This makes automatic annotation and the exploration of topic diversity with Transformer architectures, promising approaches for the task	por
dc.description.resumo	Contextualização: os comentários sobre projetos políticos na internet refletem os anseios de uma parte significativa da população. A detecção automática do posicionamento desses comentários em relação a tópicos específicos pode ajudar a compreender melhor a opinião pública. Este estudo visa desenvolver um modelo computacional com aprendizado supervisionado, capaz de estimar o posicionamento de comentários sobre Proposições Legislativas (PLs), considerando o desafio da diversidade e surgimento constante de novas PLs. Método: para o domínio estudado, construiu-se um corpus específico, coletando-se comentários de enquetes disponíveis no site da Câmara dos Deputados. Os experimentos incluíram a avaliação de modelos clássicos de aprendizado de máquina, como Regressão Logística, Naive Bayes, Máquina de Vetores de Suporte (SVM), Random Forest e Per-ceptron Multicamada, além do fine-tuning de modelos de linguagem BERT. Também se realizou a anotação automática de dados com abordagem zero-shot, baseada em prompt do modelo generativo GPT-3.5, visando superar as dificuldades relacionadas à anotação humana e à escassez de dados anotados, gerando três vezes o tamanho do corpus manualmente anotado. Resultados: os resultados indicam que o modelo BERTimbau com ajuste fino superou as abordagens clássicas, alcançando F1-score de 70,4% em tópicos não vistos. Além disso, a aplicação de dados anotados automaticamente na etapa inicial do fine-tuning do BERTimbau resultou em uma melhora do desempenho, atingindo um F1-score de 73,3%. Os resultados apresentam os modelos de aprendizado profundo como opções com desempenho positivo para a tarefa nas condições deste domínio. Conclusão: observou-se que a capacidade de gerar representações contextualizadas, juntamente à quantidade de tópicos e comentários treinados, pode interferir, diretamente, no desempenho dos modelos. Tornando-se a anotação automática e a exploração da diversidade de tópicos e da arquitetura Transformer, abordagens promissoras para a tarefa
dc.identifier.citation	MAIA, D. F. Detecção de posicionamento do cidadão em Projetos de Lei. 2024. 111 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.uri	http://repositorio.bc.ufg.br/tede/handle/tede/13338
dc.language	por
dc.publisher	Universidade Federal de Goiás
dc.publisher.country	Brasil
dc.publisher.department	Instituto de Informática - INF (RMG)
dc.publisher.initials	UFG
dc.publisher.program	Programa de Pós-graduação em Ciência da Computação (INF)
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	Detecção de posicionamento	por
dc.subject	Detecção de posicionamento	por
dc.subject	Aprendizado de máquina	por
dc.subject	Processamento de linguagem natural	por
dc.subject	Comentários políticos	por
dc.subject	Stance detection	eng
dc.subject	Machine learning	eng
dc.subject	Natural language processing	eng
dc.subject	Political comments	eng
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.title	Detecção de posicionamento do cidadão em Projetos de Lei
dc.title.alternative	Stance detection of citizen opinions on bills	eng
dc.type	Dissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Dissertação - Dyonnatan Ferreira Maia - 2024.pdf
Tamanho:: 1.89 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Mestrado em Ciência da Computação (INF)