Classificação de documentos da administração pública utilizando inteligência artificial

dc.contributor.advisor1Costa, Ronaldo Martins da
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7080590204832262
dc.contributor.referee1Costa, Ronaldo Martins da
dc.contributor.referee2Souza, Rodrigo Gonçalves de
dc.contributor.referee3Silva, Nádia Félix Felipe da
dc.creatorCarvalho, Rogerio Rodrigues
dc.creator.Latteshttp://lattes.cnpq.br/6731355656093216
dc.date.accessioned2024-09-16T19:45:18Z
dc.date.available2024-09-16T19:45:18Z
dc.date.issued2024-04-30
dc.description.abstractPublic organizations face difficulties in classifying and promoting transparency of the numerous documents produced during the execution of their activities. Correct classification of documents is critical to prevent public access to sensitive information and protect individuals and organizations from malicious use. This work proposes two approachs to perform the task of classifying sensitive documents, using state-of-the-art artificial intelligence techniques and best practices found in the literature: a conventional method, which uses artificial intelligence techniques and regular expressions to analyze the textual content of documents, and an alternative method, which employs the CBIR technique to classify documents when text extraction is not viable. Using real data from the Electronic Information System (SEI) of the Federal University of Goiás (UFG), the results achieved demonstrated that the application of regular expressions as a preliminary check can improve the computational efficiency of the classification process, despite showing a modest increase in classification precision. The conventional method proved to be effective in document classification, with the BERT model standing out for its performance with an accuracy rate of 94%. The alternative method, in turn, offered a viable solution for challenging scenarios, showing promising results with an accuracy rate of 87% in classifying public documentseng
dc.description.resumoAs organizações públicas enfrentam dificuldades para realizar a devida classificação e promover a transparência dos inúmeros documentos produzidos durante a execução de suas atividades. A classificação correta dos documentos é fundamental para prevenir o acesso público a informações sensíveis e proteger indivíduos e organizações contra o uso malicioso. Este trabalho propõe dois métodos para realizar a tarefa de classificação de documentos sensíveis, utilizando técnicas de inteligência artificial do estado da arte e melhores práticas encontradas na literatura: um método convencional, que utiliza técnicas de inteligência artificial e expressões regulares analisando o conteúdo textual dos documentos, e um método alternativo, que emprega a técnica de CBIR para a classificação de documentos quando a extração de texto não é viável, baseando-se nas imagens dos documentos. Utilizando dados reais do Sistema Eletrônico de Informações (SEI) da Universidade Federal de Goiás (UFG), os resultados alcançados demonstraram que a aplicação de expressões regulares como uma verificação preliminar pode melhorar a eficiência computacional do processo de classificação, apesar de apresentar um aumento modesto na precisão da classificação. O método convencional mostrou-se eficaz na classificação de documentos, com o modelo BERT destacando-se por seu desempenho com taxa de acerto de 94%. O método alternativo, por sua vez, ofereceu uma solução viável para cenários desafiadores, apresentando resultados promissores com taxa de acerto de 87% na classificação de documentos públicos
dc.identifier.citationCARVALHO, R. R. Classificação de documentos da administração pública utilizando inteligência artificial. 2004. 64 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/13362
dc.languagepor
dc.publisherUniversidade Federal de Goiás
dc.publisher.countryBrasil
dc.publisher.departmentInstituto de Informática - INF (RMG)
dc.publisher.initialsUFG
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectClassificação de documentospor
dc.subjectDados sensíveispor
dc.subjectOrganização públicapor
dc.subjectInteligência artificialpor
dc.subjectDocument classificationeng
dc.subjectSensitive dataeng
dc.subjectPublic organizationeng
dc.subjectArtificial intelligenceeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleClassificação de documentos da administração pública utilizando inteligência artificial
dc.title.alternativeClassification of public administration documents using artificial intelligenceeng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação - Rogerio Rodrigues Carvalho - 2024.pdf
Tamanho:
1.79 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: