基于卷积神经网络的音像与手写体档案智能识别 及语义化归档系统

李 彤, 邹 德芳
沈阳建筑大学 机械工程学院

摘要


本文研究基于卷积神经网络的音像档案与手写体档案智能识别及语义化归档系统,解决数字化转型中海量
历史档案处理的挑战。在语音识别模块中,采用改进的ResNet-50结合双向LSTM与自注意力机制,提升语音转写
准确性,并通过对抗训练增强方言鲁棒性。在手写体OCR模块中,利用MobileNetV3和CycleGAN扩增小样本数据,
提高识别精度。为确保档案安全,引入Hyperledger Fabric构建分层哈希链,实现高效存证与篡改检测。实验表明,
该系统在字符错误率、词错误率及篡改检测准确率等关键指标上均优于传统方法,推动档案管理向自动化、知识化
与可信化转型,为未来研究提供了重要参考和技术支持,具有广泛的应用前景。

关键词


卷积神经网络;语音识别;手写体OCR;区块链存证;多模态融合

全文:

PDF


参考


[1]Radford, A., Kim, J. W., Hallacy, C., et al. (2021).

Learning transferable visual models from natural language

supervision. Proceedings of the 38th International Conference

on Machine Learning, 8748-8763.

[2]杨文刚.卷积神经网络在图像档案管理中的应用

研究[J].中国档案,2024,(03):46-47.


Refbacks

  • 当前没有refback。