Detecção de depressão pela fala empregando rede neurais profundas

dc.contributor.advisor1Soares, Anderson da Silva
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1096941114079527eng
dc.contributor.referee1Soares, Anderson da Silva
dc.contributor.referee2Galvão Filho, Arlindo Rodrigues
dc.contributor.referee3Salvini, Rogerio Lopes
dc.creatorMoraes, Larissa Vasconcellos de
dc.creator.Latteshttp://lattes.cnpq.br/4247400830548951eng
dc.date.accessioned2020-03-19T15:31:46Z
dc.date.issued2020-02-10
dc.description.abstractDepression is a mental disorder that represents a major public health problem, with a 20% increase in the number of cases in the last decade. The presentation of depressive symptoms is not padronized, causing isolation and impairment in work, studies, sleep and eating. Early diagnosis remains one of the main challenges. Recent advances in machine learning methods make it possible to analyze speech, text, and facial expressions for early diagnosis and detection. This paper proposes the use of deep neural networks to detect depression, based on the patient's speech analysis, recorded during a clinical interview. For this, the pre-processing of the audios was performed, thus generating the spectrograms, mel-frequency cepstral spectrograms and the mel-frequency cepstral coefficients. These measurements were then used in the training and testing of the architectures developed here. Different combinations of network hyperparameters and spectrogram dimensions were analyzed. The results show lower root mean square error values for the application of cepstral coefficients (5.07), compared to the literature (6.50). Therefore, the potential of this method to further assist in detecting depression is envisaged. Future studies are needed to improve and validate this method applied to a sample of national data.eng
dc.description.provenanceSubmitted by Liliane Ferreira (ljuvencia30@gmail.com) on 2020-03-19T13:18:28Z No. of bitstreams: 2 Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf: 1154060 bytes, checksum: d1942c2af95e6d923089830133483575 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2020-03-19T15:31:46Z (GMT) No. of bitstreams: 2 Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf: 1154060 bytes, checksum: d1942c2af95e6d923089830133483575 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceMade available in DSpace on 2020-03-19T15:31:46Z (GMT). No. of bitstreams: 2 Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf: 1154060 bytes, checksum: d1942c2af95e6d923089830133483575 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2020-02-10eng
dc.description.resumoDepressão é um transtorno mental que representa um importante problema para a saúde pública, com aumento de 20% no número de casos na última década. A apresentação dos sintomas depressivos é variada, causando isolamento e prejuízo no trabalho, estudos, sono e alimentação. O diagnóstico precoce continua sendo um dos principais desafios. A literatura do problema apresenta uma prevalência de propostas que utilizam dados de imagem e vídeo, entretanto, avanços recentes de métodos de aprendizado de máquina possibilitam a análise da fala e/ou de textos. Este trabalho propõe o uso de redes neurais profundas para detecção de depressão, a partir da análise da fala do paciente, gravada durante uma entrevista clínica. Para tal, realizou-se o pré-processamento dos áudios, gerando, assim, os espectrogramas, espectrogramas cepstrais de frequência mel e os coeficientes cepstrais de frequência mel. Em seguida, estas medidas foram usadas no treinamento e testes das arquiteturas aqui desenvolvidas. Diferentes combinações de hiper parâmetros de rede e dimensões dos espectrogramas foram analisadas. Os resultados obtidos demonstram menores valores da raiz do erro quadrático médio para aplicação dos coeficientes cepstrais (5,07), em comparação com a literatura (6,50). Apesar de ainda apresentar limitações quanto a um possível uso comercial, foi possível evoluir o estado da arte do problema.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESeng
dc.formatapplication/pdf*
dc.identifier.citationMORAES, Larissa Vasconcellos de. Detecção de depressão pela fala empregando rede neurais profundas. 2020. 62 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020.eng
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/10449
dc.languageporeng
dc.publisherUniversidade Federal de Goiáseng
dc.publisher.countryBrasileng
dc.publisher.departmentInstituto de Informática - INF (RG)eng
dc.publisher.initialsUFGeng
dc.publisher.programPrograma de Pós-graduação em Ciência da Computação (INF)eng
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectReconhecimento de emoção de falapor
dc.subjectReconhecimento de falapor
dc.subjectRede neuralpor
dc.subjectClassificação de depressãopor
dc.subjectSpeech emotion recognitioneng
dc.subjectSpeech recognitioneng
dc.subjectNeural networkeng
dc.subjectDepression classificationeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOeng
dc.titleDetecção de depressão pela fala empregando rede neurais profundaseng
dc.title.alternativeDetecting speech depression using deep neural networkseng
dc.typeDissertaçãoeng

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf
Tamanho:
1.1 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.11 KB
Formato:
Item-specific license agreed upon to submission
Descrição: