Detecção de depressão pela fala empregando rede neurais profundas
dc.contributor.advisor1 | Soares, Anderson da Silva | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1096941114079527 | eng |
dc.contributor.referee1 | Soares, Anderson da Silva | |
dc.contributor.referee2 | Galvão Filho, Arlindo Rodrigues | |
dc.contributor.referee3 | Salvini, Rogerio Lopes | |
dc.creator | Moraes, Larissa Vasconcellos de | |
dc.creator.Lattes | http://lattes.cnpq.br/4247400830548951 | eng |
dc.date.accessioned | 2020-03-19T15:31:46Z | |
dc.date.issued | 2020-02-10 | |
dc.description.abstract | Depression is a mental disorder that represents a major public health problem, with a 20% increase in the number of cases in the last decade. The presentation of depressive symptoms is not padronized, causing isolation and impairment in work, studies, sleep and eating. Early diagnosis remains one of the main challenges. Recent advances in machine learning methods make it possible to analyze speech, text, and facial expressions for early diagnosis and detection. This paper proposes the use of deep neural networks to detect depression, based on the patient's speech analysis, recorded during a clinical interview. For this, the pre-processing of the audios was performed, thus generating the spectrograms, mel-frequency cepstral spectrograms and the mel-frequency cepstral coefficients. These measurements were then used in the training and testing of the architectures developed here. Different combinations of network hyperparameters and spectrogram dimensions were analyzed. The results show lower root mean square error values for the application of cepstral coefficients (5.07), compared to the literature (6.50). Therefore, the potential of this method to further assist in detecting depression is envisaged. Future studies are needed to improve and validate this method applied to a sample of national data. | eng |
dc.description.provenance | Submitted by Liliane Ferreira (ljuvencia30@gmail.com) on 2020-03-19T13:18:28Z No. of bitstreams: 2 Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf: 1154060 bytes, checksum: d1942c2af95e6d923089830133483575 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) | eng |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2020-03-19T15:31:46Z (GMT) No. of bitstreams: 2 Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf: 1154060 bytes, checksum: d1942c2af95e6d923089830133483575 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) | eng |
dc.description.provenance | Made available in DSpace on 2020-03-19T15:31:46Z (GMT). No. of bitstreams: 2 Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf: 1154060 bytes, checksum: d1942c2af95e6d923089830133483575 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2020-02-10 | eng |
dc.description.resumo | Depressão é um transtorno mental que representa um importante problema para a saúde pública, com aumento de 20% no número de casos na última década. A apresentação dos sintomas depressivos é variada, causando isolamento e prejuízo no trabalho, estudos, sono e alimentação. O diagnóstico precoce continua sendo um dos principais desafios. A literatura do problema apresenta uma prevalência de propostas que utilizam dados de imagem e vídeo, entretanto, avanços recentes de métodos de aprendizado de máquina possibilitam a análise da fala e/ou de textos. Este trabalho propõe o uso de redes neurais profundas para detecção de depressão, a partir da análise da fala do paciente, gravada durante uma entrevista clínica. Para tal, realizou-se o pré-processamento dos áudios, gerando, assim, os espectrogramas, espectrogramas cepstrais de frequência mel e os coeficientes cepstrais de frequência mel. Em seguida, estas medidas foram usadas no treinamento e testes das arquiteturas aqui desenvolvidas. Diferentes combinações de hiper parâmetros de rede e dimensões dos espectrogramas foram analisadas. Os resultados obtidos demonstram menores valores da raiz do erro quadrático médio para aplicação dos coeficientes cepstrais (5,07), em comparação com a literatura (6,50). Apesar de ainda apresentar limitações quanto a um possível uso comercial, foi possível evoluir o estado da arte do problema. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | eng |
dc.format | application/pdf | * |
dc.identifier.citation | MORAES, Larissa Vasconcellos de. Detecção de depressão pela fala empregando rede neurais profundas. 2020. 62 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020. | eng |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/10449 | |
dc.language | por | eng |
dc.publisher | Universidade Federal de Goiás | eng |
dc.publisher.country | Brasil | eng |
dc.publisher.department | Instituto de Informática - INF (RG) | eng |
dc.publisher.initials | UFG | eng |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação (INF) | eng |
dc.rights | Acesso Aberto | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Reconhecimento de emoção de fala | por |
dc.subject | Reconhecimento de fala | por |
dc.subject | Rede neural | por |
dc.subject | Classificação de depressão | por |
dc.subject | Speech emotion recognition | eng |
dc.subject | Speech recognition | eng |
dc.subject | Neural network | eng |
dc.subject | Depression classification | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | eng |
dc.title | Detecção de depressão pela fala empregando rede neurais profundas | eng |
dc.title.alternative | Detecting speech depression using deep neural networks | eng |
dc.type | Dissertação | eng |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Dissertação - Larissa Vasconcellos de Moraes - 2020.pdf
- Tamanho:
- 1.1 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 2.11 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: