Análise de um Fluxo Completo Automatizado de Etapas Voltado ao Reconhecimento de Texto em Imagens de Prescrições Médicas Manuscritas
dc.contributor.advisor-co1 | Lima, Eliomar Araújo de | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/1362170231777201 | |
dc.contributor.advisor1 | Nascimento, Hugo Alexandre Dantas do | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2920005922426876 | |
dc.contributor.referee1 | Nascimento, Hugo Alexandre Dantas do | |
dc.contributor.referee2 | Costa, Ronaldo Martins da | |
dc.contributor.referee3 | Pedrini, Hélio | |
dc.contributor.referee4 | Lima, Eliomar Araújo de | |
dc.creator | Corrêa, André Pires | |
dc.creator.Lattes | https://lattes.cnpq.br/4549926436446347 | |
dc.date.accessioned | 2024-12-18T13:08:48Z | |
dc.date.available | 2024-12-18T13:08:48Z | |
dc.date.issued | 2024-01-10 | |
dc.description.abstract | Compounding pharmacies deal with large volumes of medical prescriptions on a daily basis, whose data needs to be manually inputted into information management systems to properly process their customers’ orders. A considerable portion of these prescriptions tend to be written by doctors with poorly legible handwriting, which can make decoding them an arduous and time-consuming process. Previous works have investigated the use of machine learning for medical prescription recognition. However, the accuracy rates in these works are still fairly low and their approaches tend to be rather limited, as they typically utilize small datasets, focus only on specific steps of the automated analysis pipeline or use proprietary tools, which makes it difficult to replicate and analyse their results. The present work contributes towards filling this gap by presenting an end-toend process for automated data extraction from handwritten medical prescriptions, from text segmentation, to recognition and post-processing. The approach was built based on an evaluation and adaptation of multiple existing methods for each step of the pipeline. The methods were evaluated on a dataset of 993 images of medical prescriptions with 27,933 annotated words, produced with the support of a compounding pharmacy that participated in the project. The results obtained by the best performing methods indicate that the developed approach is reasonably effective, reaching an accuracy of 68% in the segmentation step, and a character accuracy rate of 86.8% in the text recognition step. | eng |
dc.description.resumo | Farmacias de manipulac¸ ´ ao lidam diariamente com grandes volumes de prescric¸ ˜ oes ˜ medicas, cujos dados precisam ser manualmente introduzidos em sistemas de gest ´ ao de ˜ informac¸ao para o acompanhamento dos pedidos de seus clientes. Uma parcela consi- ˜ deravel dessas prescric¸ ´ oes tende a ser escrita por m ˜ edicos com caligrafia de baixa legibi- ´ lidade, o que contribui para tornar a decodificac¸ao˜ ardua e demorada. Trabalhos anteri- ´ ores investigaram o uso de aprendizado de maquina para reconhecimento de prescric¸ ´ oes ˜ medicas. No entanto, as taxas de acerto nesses trabalhos ainda s ´ ao muito baixas e as ˜ abordagens empregadas comumente sao limitadas, pois envolveram uma quantidade pe- ˜ quena de casos, focaram em poucas etapas do processo de automac¸ao da an ˜ alise de ´ prescric¸oes m ˜ edicas ou utilizaram ferramentas propriet ´ arias, o que dificulta a replicac¸ ´ ao˜ e a analise cient ´ ´ıfica dos resultados. O presente trabalho contribui para preencher essa lacuna, apresentando um processo completo de segmentac¸ao, reconhecimento e processa- ˜ mento de prescric¸oes m ˜ edicas que foi constru ´ ´ıdo com base em uma avaliac¸ao e adaptac¸ ˜ ao˜ de multiplos m ´ etodos existentes na literatura para cada etapa do processo. Os m ´ etodos ´ foram avaliados usando uma base de 993 imagens de prescric¸oes m ˜ edicas com 27.933 ´ palavras anotadas, produzida com o apoio de uma farmacia de manipulac¸ ´ ao parceira do ˜ projeto. Os resultados obtidos pelos melhores metodos indicam que a abordagem ´ e razoa- ´ velmente eficaz, atingindo uma acuracia de 68% no processo de segmentac¸ ´ ao, e uma taxa ˜ de acuracia de caractere de 86,8% no processo de reconhecimento de texto | |
dc.identifier.citation | CORRÊA, A. P. Análise de um Fluxo Completo Automatizado de Etapas Voltado ao Reconhecimento de Texto em Imagens de Prescrições Médicas Manuscritas. 2024. 79 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. | |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/13759 | |
dc.language | por | |
dc.publisher | Universidade Federal de Goiás | |
dc.publisher.country | Brasil | |
dc.publisher.department | Instituto de Informática - INF (RMG) | |
dc.publisher.initials | UFG | |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Prescrições médicas | por |
dc.subject | Reconhecimento de texto manuscrito | por |
dc.subject | Aprendizado de máquina | por |
dc.subject | Medical prescriptions | eng |
dc.subject | Handwritten text recognition | eng |
dc.subject | Machine learning | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
dc.title | Análise de um Fluxo Completo Automatizado de Etapas Voltado ao Reconhecimento de Texto em Imagens de Prescrições Médicas Manuscritas | |
dc.title.alternative | Analysis of an automated pipeline for text recognition in images of handwritten medical prescriptions | eng |
dc.type | Dissertação |