Classificação de documentos da administração pública utilizando inteligência artificial

Carvalho, Rogerio Rodrigues

Classificação de documentos da administração pública utilizando inteligência artificial

dc.contributor.advisor1	Costa, Ronaldo Martins da
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/7080590204832262
dc.contributor.referee1	Costa, Ronaldo Martins da
dc.contributor.referee2	Souza, Rodrigo Gonçalves de
dc.contributor.referee3	Silva, Nádia Félix Felipe da
dc.creator	Carvalho, Rogerio Rodrigues
dc.creator.Lattes	http://lattes.cnpq.br/6731355656093216
dc.date.accessioned	2024-09-16T19:45:18Z
dc.date.available	2024-09-16T19:45:18Z
dc.date.issued	2024-04-30
dc.description.abstract	Public organizations face difficulties in classifying and promoting transparency of the numerous documents produced during the execution of their activities. Correct classification of documents is critical to prevent public access to sensitive information and protect individuals and organizations from malicious use. This work proposes two approachs to perform the task of classifying sensitive documents, using state-of-the-art artificial intelligence techniques and best practices found in the literature: a conventional method, which uses artificial intelligence techniques and regular expressions to analyze the textual content of documents, and an alternative method, which employs the CBIR technique to classify documents when text extraction is not viable. Using real data from the Electronic Information System (SEI) of the Federal University of Goiás (UFG), the results achieved demonstrated that the application of regular expressions as a preliminary check can improve the computational efficiency of the classification process, despite showing a modest increase in classification precision. The conventional method proved to be effective in document classification, with the BERT model standing out for its performance with an accuracy rate of 94%. The alternative method, in turn, offered a viable solution for challenging scenarios, showing promising results with an accuracy rate of 87% in classifying public documents	eng
dc.description.resumo	As organizações públicas enfrentam dificuldades para realizar a devida classificação e promover a transparência dos inúmeros documentos produzidos durante a execução de suas atividades. A classificação correta dos documentos é fundamental para prevenir o acesso público a informações sensíveis e proteger indivíduos e organizações contra o uso malicioso. Este trabalho propõe dois métodos para realizar a tarefa de classificação de documentos sensíveis, utilizando técnicas de inteligência artificial do estado da arte e melhores práticas encontradas na literatura: um método convencional, que utiliza técnicas de inteligência artificial e expressões regulares analisando o conteúdo textual dos documentos, e um método alternativo, que emprega a técnica de CBIR para a classificação de documentos quando a extração de texto não é viável, baseando-se nas imagens dos documentos. Utilizando dados reais do Sistema Eletrônico de Informações (SEI) da Universidade Federal de Goiás (UFG), os resultados alcançados demonstraram que a aplicação de expressões regulares como uma verificação preliminar pode melhorar a eficiência computacional do processo de classificação, apesar de apresentar um aumento modesto na precisão da classificação. O método convencional mostrou-se eficaz na classificação de documentos, com o modelo BERT destacando-se por seu desempenho com taxa de acerto de 94%. O método alternativo, por sua vez, ofereceu uma solução viável para cenários desafiadores, apresentando resultados promissores com taxa de acerto de 87% na classificação de documentos públicos
dc.identifier.citation	CARVALHO, R. R. Classificação de documentos da administração pública utilizando inteligência artificial. 2004. 64 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.uri	http://repositorio.bc.ufg.br/tede/handle/tede/13362
dc.language	por
dc.publisher	Universidade Federal de Goiás
dc.publisher.country	Brasil
dc.publisher.department	Instituto de Informática - INF (RMG)
dc.publisher.initials	UFG
dc.publisher.program	Programa de Pós-graduação em Ciência da Computação (INF)
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	Classificação de documentos	por
dc.subject	Dados sensíveis	por
dc.subject	Organização pública	por
dc.subject	Inteligência artificial	por
dc.subject	Document classification	eng
dc.subject	Sensitive data	eng
dc.subject	Public organization	eng
dc.subject	Artificial intelligence	eng
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.title	Classificação de documentos da administração pública utilizando inteligência artificial
dc.title.alternative	Classification of public administration documents using artificial intelligence	eng
dc.type	Dissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Dissertação - Rogerio Rodrigues Carvalho - 2024.pdf
Tamanho:: 1.79 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Mestrado em Ciência da Computação (INF)