基于深度学习的数字人驱动技术研究与软件实现

段 超1, 张杭 凯*2
1、杭州硅基聚欢科技有限公司
2、杭州伏特机器人科技有限公司

摘要


随着人工智能和深度学习技术的快速发展,数字人作为一种融合计算机图形学、语音合成、自然语言处理与行为驱动等多学科技术的智能体,正广泛应用于虚拟客服、虚拟主播、在线教育等领域。本文围绕基于深度学习的数字人驱动技术展开系统研究,深入分析了当前主流的面部表情生成、语音驱动唇形同步、动作捕捉与行为建模等关键技术,并基于深度神经网络构建了完整的数字人驱动系统软件架构。本文首先阐述了数字人的定义与分类,分析其在不同场景下的应用需求,介绍了开发一套可实时交互的数字人软件系统的框架,为推动虚拟人技术的实用化和智能化发展提供了理论基础与技术支撑。

关键词


深度学习;数字人驱动;实时交互;神经网络

全文:

PDF


参考


[1]祝智庭,胡姣.教育数字化转型的本质探析与研究展望[J].中国电化教育,2022(4):1-8,25.

[2]刘月霞,郭华.深度学习:走向核心素养(理论普及读本)[M].北京:教育科学出版社,2018.

[3]夏峰平.数字化赋能深度学习:数据驱动与个性化路径的融合[J].中学教学参考,2024(6):28-31.

[4]齐勇,门泽木,解思源,成润泽.基于数字孪生和深度学习的风力与光伏发电预测方法研究[J].软件工程,2024,28(3):57-63.

[5]润治,王瑞琪,刘继彦,等.基于CNN-Bi-LSTM功率预测的海岛综合能源系统优化调度[J.全球能源互联网,2023,6(1):88-100.


Refbacks

  • 当前没有refback。