pbs
发布于 2025-03-24 / 107 阅读
0
0

🎙️小样本数智人音频录制指引

🌟【快速了解】

此文档介绍数智人声音录制相关注意事项目。目的是为小样本数智人声音复刻提供较好的音频素材。

 

一:音频录制

1、 场地选择

选择安静没有噪音(如空调出风口噪音、室外人声、汽车、施工噪音)、没有回声、软装较多的的环境空间(如卧室,车里)。

2、 录制设备

▸ 选择一:iPhone手机录制,按以下图片步骤设置

▸ 选择二:专业麦克风录制

3、 录制内容

录制文本:可自行准备一段约1500字文稿。稿件内容不限,尽量口语化,语句越多且不同,训练效果越好。

文本要求:中文汉字文本;单句子最长不超过50字,平均句子控制在20字左右。

▸录制音频时长:5-10分钟。

音频格式:录制时推荐无损 WAV 格式(具体格式不限制),不低于24k采样率。

 

二:注意事项

环境要安静无杂音,建议麦克风有防风罩且与嘴的距离在10cm内,音量保持适中;

尽量避免在光滑墙面、地板房间录制,如大面积玻璃墙面或大理石地板房间,以避免引入混响;

提前熟悉朗读文本,避免录制断断续续;

注意尽量不要喷麦;

每个句子结束自然停顿;句子中按照文本正常表达进行自然停顿;

按照本身说话的风格,有韵律的朗读;语气、语速请按照日常工作和后续数字人出镜视频的场景进行,切忌刻意调整自己的语气语速进行录制

吐字清晰,保证台词读音正确;

除了讲话之外,不要做其余动作,避免多余声音(如衣服摩擦等声音、吞咽声)。

定制音频的效果和原视音频的质量息息相关,若音频质量好,最终的声音复刻效果也越好;音频质量差,最终定制效果也会差。

如:原音频中包含噪声,最终定制的效果也将包含噪声。

 

其它视频训练素材准备请参考🔗《小样本数智人拍摄及后期制作指引》


评论