Análise de um Fluxo Completo Automatizado de Etapas Voltado ao Reconhecimento de Texto em Imagens de Prescrições Médicas Manuscritas

dc.contributor.advisor-co1Lima, Eliomar Araújo de
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/1362170231777201
dc.contributor.advisor1Nascimento, Hugo Alexandre Dantas do
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2920005922426876
dc.contributor.referee1Nascimento, Hugo Alexandre Dantas do
dc.contributor.referee2Costa, Ronaldo Martins da
dc.contributor.referee3Pedrini, Hélio
dc.contributor.referee4Lima, Eliomar Araújo de
dc.creatorCorrêa, André Pires
dc.creator.Latteshttps://lattes.cnpq.br/4549926436446347
dc.date.accessioned2024-12-18T13:08:48Z
dc.date.available2024-12-18T13:08:48Z
dc.date.issued2024-01-10
dc.description.abstractCompounding pharmacies deal with large volumes of medical prescriptions on a daily basis, whose data needs to be manually inputted into information management systems to properly process their customers’ orders. A considerable portion of these prescriptions tend to be written by doctors with poorly legible handwriting, which can make decoding them an arduous and time-consuming process. Previous works have investigated the use of machine learning for medical prescription recognition. However, the accuracy rates in these works are still fairly low and their approaches tend to be rather limited, as they typically utilize small datasets, focus only on specific steps of the automated analysis pipeline or use proprietary tools, which makes it difficult to replicate and analyse their results. The present work contributes towards filling this gap by presenting an end-toend process for automated data extraction from handwritten medical prescriptions, from text segmentation, to recognition and post-processing. The approach was built based on an evaluation and adaptation of multiple existing methods for each step of the pipeline. The methods were evaluated on a dataset of 993 images of medical prescriptions with 27,933 annotated words, produced with the support of a compounding pharmacy that participated in the project. The results obtained by the best performing methods indicate that the developed approach is reasonably effective, reaching an accuracy of 68% in the segmentation step, and a character accuracy rate of 86.8% in the text recognition step.eng
dc.description.resumoFarmacias de manipulac¸ ´ ao lidam diariamente com grandes volumes de prescric¸ ˜ oes ˜ medicas, cujos dados precisam ser manualmente introduzidos em sistemas de gest ´ ao de ˜ informac¸ao para o acompanhamento dos pedidos de seus clientes. Uma parcela consi- ˜ deravel dessas prescric¸ ´ oes tende a ser escrita por m ˜ edicos com caligrafia de baixa legibi- ´ lidade, o que contribui para tornar a decodificac¸ao˜ ardua e demorada. Trabalhos anteri- ´ ores investigaram o uso de aprendizado de maquina para reconhecimento de prescric¸ ´ oes ˜ medicas. No entanto, as taxas de acerto nesses trabalhos ainda s ´ ao muito baixas e as ˜ abordagens empregadas comumente sao limitadas, pois envolveram uma quantidade pe- ˜ quena de casos, focaram em poucas etapas do processo de automac¸ao da an ˜ alise de ´ prescric¸oes m ˜ edicas ou utilizaram ferramentas propriet ´ arias, o que dificulta a replicac¸ ´ ao˜ e a analise cient ´ ´ıfica dos resultados. O presente trabalho contribui para preencher essa lacuna, apresentando um processo completo de segmentac¸ao, reconhecimento e processa- ˜ mento de prescric¸oes m ˜ edicas que foi constru ´ ´ıdo com base em uma avaliac¸ao e adaptac¸ ˜ ao˜ de multiplos m ´ etodos existentes na literatura para cada etapa do processo. Os m ´ etodos ´ foram avaliados usando uma base de 993 imagens de prescric¸oes m ˜ edicas com 27.933 ´ palavras anotadas, produzida com o apoio de uma farmacia de manipulac¸ ´ ao parceira do ˜ projeto. Os resultados obtidos pelos melhores metodos indicam que a abordagem ´ e razoa- ´ velmente eficaz, atingindo uma acuracia de 68% no processo de segmentac¸ ´ ao, e uma taxa ˜ de acuracia de caractere de 86,8% no processo de reconhecimento de texto
dc.identifier.citationCORRÊA, A. P. Análise de um Fluxo Completo Automatizado de Etapas Voltado ao Reconhecimento de Texto em Imagens de Prescrições Médicas Manuscritas. 2024. 79 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/13759
dc.languagepor
dc.publisherUniversidade Federal de Goiás
dc.publisher.countryBrasil
dc.publisher.departmentInstituto de Informática - INF (RMG)
dc.publisher.initialsUFG
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectPrescrições médicaspor
dc.subjectReconhecimento de texto manuscritopor
dc.subjectAprendizado de máquinapor
dc.subjectMedical prescriptionseng
dc.subjectHandwritten text recognitioneng
dc.subjectMachine learningeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleAnálise de um Fluxo Completo Automatizado de Etapas Voltado ao Reconhecimento de Texto em Imagens de Prescrições Médicas Manuscritas
dc.title.alternativeAnalysis of an automated pipeline for text recognition in images of handwritten medical prescriptionseng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação - André Pires Corrêa - 2024.pdf
Tamanho:
3.6 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: