科技博览

您当前的位置：首页> > 科技博览

AI时代，警惕声音被克隆

发布时间：2024-07-17 作者：张英贤来源：科普时报分享到：

数字科技与声乐艺术深度融合，会擦出怎样的火花？

在人工智能（AI）的加持下，我们已经可以利用AI作曲、编曲、即兴演奏辅助，完成一首歌曲的创作；也可以通过AI提取片段式声音进行声音克隆，让声音被“造”出来……而这也容易在声音的真伪判别上，给人带来极强的不安全感。

7月5日，在全球数字经济大会组委会主办、北京市科协支持，北京乐器学会、北京声学学会等协办的“为未来做好准备——数字音乐科技创新发展论坛”上，与会专家介绍了AI在音乐、声学方面给生活带来的变化，以及可能伴随的种种挑战。

给声音打上“水印”

在石景山首钢园中关村科幻创新中心一层报告厅，一段二胡“模仿秀”之后，中国科学院声学研究所首席专家、中国科学院大学特聘教授王秀明深入浅出地阐述了音高、音色、音强等名词背后的科学原理，“在科学家的眼里，音调是由频率决定的。”

在随后的视频演示环节，王秀明带领观众走进声音的世界，展示了声音的拆分与合成技术，也引出了一个让人深思的话题——声音克隆。在音乐原理中，除了发音体整体振动产生的最低的音是基音，其他均为泛音。泛音的幅度和组合决定了特定的音色。“我们抓住了基音和泛音的声音特征，再结合声音的频率分析，就意味着可以‘造声音’。”王秀明说。

中国科学院大学企业导师、声智科技创始人陈孝良介绍说，结合大模型，人们已经可以通过一段较短的声音片段，抓取声音的主要特征进行声音克隆了。

此前，通过模型训练和后期处理，“AI歌手”能模拟真人歌手声音进行翻唱，“AI孙燕姿”就曾走红网络。声音克隆技术在引发社会广泛关注的同时，也带来了新的挑战——我们该如何保护声音的版权与隐私？

当前，声音水印成为一个新的研究方向。陈孝良说，声音水印技术通过在声音信号中嵌入不可察觉的标识信息，实现对声音的追踪和验证。“这种技术不仅可以有效防止声音数据的非法复制和传播，还能为声音内容的版权保护提供强有力的支持。”

声音水印可广泛应用于多种场景，如音乐版权保护、广播监控、音频文件的防伪溯源等。“未来，随着大模型和深度学习技术的进一步发展，声音水印技术有望变得更加智能化，应用也将更加广泛，为声音安全和版权保护提供全面的解决方案。”陈孝良说。

数据安全仍是痛点

当前，人工智能、虚拟现实等新兴技术正在重塑音乐的创作、传播和消费方式，为音乐行业带来前所未有的机遇和挑战。

“AI为音乐创作和生产带来了新的可能，AI作曲、智能混音、自动编曲等技术激发了人类的创作灵感，让音乐创作变得更加便捷和多样化。但与此同时，我们也必须正视新技术所带来的伦理和法律问题。”中国社会科学院中国文化中心副主任张晓明表示，AI可以分析海量的音乐数据，生成具有创意和独特风格的音乐作品，甚至定制个性化的音乐体验。但是，如何有效地收集、管理和利用这些数据，也是一个巨大的挑战。

陈孝良提醒，声音克隆带来的数据安全风险不容小觑。此外，由于声音分类、音乐合成等技术的出现，音乐产品的数字版权问题也有待解决。

未来，我们还需要在数据、模型和应用上下功夫，特别是要重视音乐数据的有效获取与隐私保护。“呼吁建设开放共享的数据平台，以实现数据的合法、安全利用。”张晓明说，在模型应用上还需在技术革新与人文关怀之间寻找到恰当的平衡点，确保技术为艺术服务，以推动音乐科技行业的健康持续发展。”

【我们尊重原创，也注重分享。版权原作者所有，如有侵犯您的权益请及时联系，我们将第一时间删除。分享内容不代表本网观点，仅供参考。】

上一篇：中国科技企业加速出海

下一篇：脑机接口正从科幻走进现实