科技博览

您当前的位置: 首页>   >  科技博览
AI时代,警惕声音被克隆
发布时间:2024-07-17  作者:张英贤  来源:科普时报  分享到:

数字科技与声乐艺术深度融合,会擦出怎样的火花?

在人工智能(AI)的加持下,我们已经可以利用AI作曲、编曲、即兴演奏辅助,完成一首歌曲的创作;也可以通过AI提取片段式声音进行声音克隆,让声音被“造”出来……而这也容易在声音的真伪判别上,给人带来极强的不安全感。

7月5日,在全球数字经济大会组委会主办、北京市科协支持,北京乐器学会、北京声学学会等协办的“为未来做好准备——数字音乐科技创新发展论坛”上,与会专家介绍了AI在音乐、声学方面给生活带来的变化,以及可能伴随的种种挑战。

给声音打上“水印”

在石景山首钢园中关村科幻创新中心一层报告厅,一段二胡“模仿秀”之后,中国科学院声学研究所首席专家、中国科学院大学特聘教授王秀明深入浅出地阐述了音高、音色、音强等名词背后的科学原理,“在科学家的眼里,音调是由频率决定的。”

在随后的视频演示环节,王秀明带领观众走进声音的世界,展示了声音的拆分与合成技术,也引出了一个让人深思的话题——声音克隆。在音乐原理中,除了发音体整体振动产生的最低的音是基音,其他均为泛音。泛音的幅度和组合决定了特定的音色。“我们抓住了基音和泛音的声音特征,再结合声音的频率分析,就意味着可以‘造声音’。”王秀明说。

中国科学院大学企业导师、声智科技创始人陈孝良介绍说,结合大模型,人们已经可以通过一段较短的声音片段,抓取声音的主要特征进行声音克隆了。

此前,通过模型训练和后期处理,“AI歌手”能模拟真人歌手声音进行翻唱,“AI孙燕姿”就曾走红网络。声音克隆技术在引发社会广泛关注的同时,也带来了新的挑战——我们该如何保护声音的版权与隐私?

当前,声音水印成为一个新的研究方向。陈孝良说,声音水印技术通过在声音信号中嵌入不可察觉的标识信息,实现对声音的追踪和验证。“这种技术不仅可以有效防止声音数据的非法复制和传播,还能为声音内容的版权保护提供强有力的支持。”

声音水印可广泛应用于多种场景,如音乐版权保护、广播监控、音频文件的防伪溯源等。“未来,随着大模型和深度学习技术的进一步发展,声音水印技术有望变得更加智能化,应用也将更加广泛,为声音安全和版权保护提供全面的解决方案。”陈孝良说。

数据安全仍是痛点

当前,人工智能、虚拟现实等新兴技术正在重塑音乐的创作、传播和消费方式,为音乐行业带来前所未有的机遇和挑战。

“AI为音乐创作和生产带来了新的可能,AI作曲、智能混音、自动编曲等技术激发了人类的创作灵感,让音乐创作变得更加便捷和多样化。但与此同时,我们也必须正视新技术所带来的伦理和法律问题。”中国社会科学院中国文化中心副主任张晓明表示,AI可以分析海量的音乐数据,生成具有创意和独特风格的音乐作品,甚至定制个性化的音乐体验。但是,如何有效地收集、管理和利用这些数据,也是一个巨大的挑战。

陈孝良提醒,声音克隆带来的数据安全风险不容小觑。此外,由于声音分类、音乐合成等技术的出现,音乐产品的数字版权问题也有待解决。

未来,我们还需要在数据、模型和应用上下功夫,特别是要重视音乐数据的有效获取与隐私保护。“呼吁建设开放共享的数据平台,以实现数据的合法、安全利用。”张晓明说,在模型应用上还需在技术革新与人文关怀之间寻找到恰当的平衡点,确保技术为艺术服务,以推动音乐科技行业的健康持续发展。”


【我们尊重原创,也注重分享。版权原作者所有,如有侵犯您的权益请及时联系,我们将第一时间删除。分享内容不代表本网观点,仅供参考。】

Baidu
map