多模态抑郁辅助检测情感分析

乔 羿, 段金 英*
西京学院

摘要


情感计算作为人工智能与认知科学交叉领域的重要研究方向,在心理健康智能评估领域展现出重要应用价
值。抑郁症具有高发病率、高隐匿性、高危害性等特征,传统诊断方式依赖量表与临床访谈,存在主观性强、效率
偏低、早期识别困难等问题。多模态情感分析通过融合文本、语音、视觉等多源信息,能够客观、连续地捕捉抑郁
相关情感特征,已成为抑郁智能辅助检测的关键技术路径。本文围绕抑郁辅助检测场景,数据集建设、特征提取、
模态融合、缺失模态处理、评测指标等关键内容,总结当前研究面临的数据稀缺、隐私敏感、泛化性不足、可解释
性弱等核心挑战,并对未来研究方向与实用化路径进行展望。

关键词


多模态情感分析;抑郁辅助检测;模态缺失;特征融合

全文:

PDF


参考


[1]Shen Y, Yang H, Lin L. Automatic depression

detection: An emotional audio-textual corpus and a gru/

bilstm-based model[C].IEEE, 2022:6247-6251.

[2]Lin L, Chen X, Shen Y, et al. Towards automatic

depression detection: A BiLSTM/1D CNN-based model[J].

Applied Sciences, 2020, 10(23): 8701.

[3]Cummins N, Joshi J, Dhall A, et al. Diagnosis of

depression by behavioural signals: a multimodal approach[C].

2013: 11-20.

[4]宋冠军,张树东,卫飞高.音视频双模态情感识

别融合框架研究[J].计算机工程与应用,2020.

[5]Ray A, Kumar S, Reddy R, et al. Multi-level

attention network using text, audio and video for depression

prediction[C]. Nice: ACM, 2019: 81-88.

[6]Muzammel M, Salam H, Othmani A. End-to-end

multimodal clinical depression recognition using deep neural

networks: A comparative analysis[J]. 2021 .

[7]Guo L, Song Y, Ding S. Speaker-aware cognitive

network with cross-modal attention for multimodal emotion

recognition in conversation[J]. 2024.


Refbacks

  • 当前没有refback。