Classificação de documentos da administração pública utilizando inteligência artificial
| dc.contributor.advisor1 | Costa, Ronaldo Martins da | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/7080590204832262 | |
| dc.contributor.referee1 | Costa, Ronaldo Martins da | |
| dc.contributor.referee2 | Souza, Rodrigo Gonçalves de | |
| dc.contributor.referee3 | Silva, Nádia Félix Felipe da | |
| dc.creator | Carvalho, Rogerio Rodrigues | |
| dc.creator.Lattes | http://lattes.cnpq.br/6731355656093216 | |
| dc.date.accessioned | 2024-09-16T19:45:18Z | |
| dc.date.available | 2024-09-16T19:45:18Z | |
| dc.date.issued | 2024-04-30 | |
| dc.description.abstract | Public organizations face difficulties in classifying and promoting transparency of the numerous documents produced during the execution of their activities. Correct classification of documents is critical to prevent public access to sensitive information and protect individuals and organizations from malicious use. This work proposes two approachs to perform the task of classifying sensitive documents, using state-of-the-art artificial intelligence techniques and best practices found in the literature: a conventional method, which uses artificial intelligence techniques and regular expressions to analyze the textual content of documents, and an alternative method, which employs the CBIR technique to classify documents when text extraction is not viable. Using real data from the Electronic Information System (SEI) of the Federal University of Goiás (UFG), the results achieved demonstrated that the application of regular expressions as a preliminary check can improve the computational efficiency of the classification process, despite showing a modest increase in classification precision. The conventional method proved to be effective in document classification, with the BERT model standing out for its performance with an accuracy rate of 94%. The alternative method, in turn, offered a viable solution for challenging scenarios, showing promising results with an accuracy rate of 87% in classifying public documents | eng |
| dc.description.resumo | As organizações públicas enfrentam dificuldades para realizar a devida classificação e promover a transparência dos inúmeros documentos produzidos durante a execução de suas atividades. A classificação correta dos documentos é fundamental para prevenir o acesso público a informações sensíveis e proteger indivíduos e organizações contra o uso malicioso. Este trabalho propõe dois métodos para realizar a tarefa de classificação de documentos sensíveis, utilizando técnicas de inteligência artificial do estado da arte e melhores práticas encontradas na literatura: um método convencional, que utiliza técnicas de inteligência artificial e expressões regulares analisando o conteúdo textual dos documentos, e um método alternativo, que emprega a técnica de CBIR para a classificação de documentos quando a extração de texto não é viável, baseando-se nas imagens dos documentos. Utilizando dados reais do Sistema Eletrônico de Informações (SEI) da Universidade Federal de Goiás (UFG), os resultados alcançados demonstraram que a aplicação de expressões regulares como uma verificação preliminar pode melhorar a eficiência computacional do processo de classificação, apesar de apresentar um aumento modesto na precisão da classificação. O método convencional mostrou-se eficaz na classificação de documentos, com o modelo BERT destacando-se por seu desempenho com taxa de acerto de 94%. O método alternativo, por sua vez, ofereceu uma solução viável para cenários desafiadores, apresentando resultados promissores com taxa de acerto de 87% na classificação de documentos públicos | |
| dc.identifier.citation | CARVALHO, R. R. Classificação de documentos da administração pública utilizando inteligência artificial. 2004. 64 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. | |
| dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/13362 | |
| dc.language | por | |
| dc.publisher | Universidade Federal de Goiás | |
| dc.publisher.country | Brasil | |
| dc.publisher.department | Instituto de Informática - INF (RMG) | |
| dc.publisher.initials | UFG | |
| dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Classificação de documentos | por |
| dc.subject | Dados sensíveis | por |
| dc.subject | Organização pública | por |
| dc.subject | Inteligência artificial | por |
| dc.subject | Document classification | eng |
| dc.subject | Sensitive data | eng |
| dc.subject | Public organization | eng |
| dc.subject | Artificial intelligence | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
| dc.title | Classificação de documentos da administração pública utilizando inteligência artificial | |
| dc.title.alternative | Classification of public administration documents using artificial intelligence | eng |
| dc.type | Dissertação |