🌟【快速了解】
此文档介绍数智人声音录制相关注意事项目。目的是为小样本数智人声音复刻提供较好的音频素材。
一:音频录制
1、 场地选择
▸ 选择安静没有噪音(如空调出风口噪音、室外人声、汽车、施工噪音)、没有回声、软装较多的的环境空间(如卧室,车里)。
2、 录制设备
▸ 选择一:iPhone手机录制,按以下图片步骤设置

▸ 选择二:专业麦克风录制
3、 录制内容
▸ 录制文本:可自行准备一段约1500字文稿。稿件内容不限,尽量口语化,语句越多且不同,训练效果越好。
▸文本要求:中文汉字文本;单句子最长不超过50字,平均句子控制在20字左右。
▸录制音频时长:5-10分钟。
▸音频格式:录制时推荐无损 WAV 格式(具体格式不限制),不低于24k采样率。
二:注意事项
▸环境要安静无杂音,建议麦克风有防风罩且与嘴的距离在10cm内,音量保持适中;
▸尽量避免在光滑墙面、地板房间录制,如大面积玻璃墙面或大理石地板房间,以避免引入混响;
▸提前熟悉朗读文本,避免录制断断续续;
▸注意尽量不要喷麦;
▸每个句子结束自然停顿;句子中按照文本正常表达进行自然停顿;
▸按照本身说话的风格,有韵律的朗读;语气、语速请按照日常工作和后续数字人出镜视频的场景进行,切忌刻意调整自己的语气语速进行录制
▸吐字清晰,保证台词读音正确;
▸除了讲话之外,不要做其余动作,避免多余声音(如衣服摩擦等声音、吞咽声)。
定制音频的效果和原视音频的质量息息相关,若音频质量好,最终的声音复刻效果也越好;音频质量差,最终定制效果也会差。
如:原音频中包含噪声,最终定制的效果也将包含噪声。
其它视频训练素材准备请参考🔗《小样本数智人拍摄及后期制作指引》