来源:21世纪商业评论
本文字数:3059|预计5分钟读完
普通人的音乐创作时代已经来临。
撰文丨潘己鹤
有“音乐圈DeepSeek”称号的Mureka,又有大动作。
7月23日,昆仑万维宣布,旗下AI音乐生成平台Mureka,基座模型再次迭代,全新音乐模型Mureka V7正式上线。
Mureka的新版本,将AI音乐的效果,猛拉一个台阶,单曲时长延伸到5.5分钟,且可以输出更具吸引力的旋律与编曲。
昆仑万维官方出品的《杜甫》歌曲
“不论人声、混声还是作曲旋律,都基本超越Suno,尤其人声拟真度,新版本有大幅提升。”有创作者忍不住感叹。
昆仑万维埋头修炼产品力和技术力,打造AI视频SkyReels、AI社交Linky、AI Agent Skywork等在内的多元应用矩阵,提速商业化。
AI音乐领域,Mureka V6 3月底发布后,新增注册用户近300万,充分证明其市场号召力。
这一“AI大杀器”再次更新,昆仑万维毫不掩饰其在AI音乐赛道的野心:
它要改写游戏规则,给那些被主流体系忽略的、表达欲望无法释放的普通人,插上自由创作的翅膀。
1
Mureka V7 + TTS V1双模型上线,
AI音乐进入个性化时代
实测Mureka V7,创作者最大的感受是,Mureka干活细致,生成的内容自然流畅,质量稳定。
这背后是V7升级技术,让音乐品质产生质变——增强音乐人声与乐器真实度,大幅改善旋律动机与编曲质量,令用户制作出质感细腻的个人独家BGM。
先放一段官方Demo,大家体验下。
官方对Mureka V7的介绍,耐人寻味,称之为“一座24小时不打烊的私人录音棚”。多项技术,支撑听感提升。
先看关键的良品率,从V6的43.4%到V7的57.7%,输入提示词后,获得好听歌曲的概率大幅提升。
人声真实度和表达力,提升44%,这让AI音乐不再生硬,有了“呼吸感”;整体音质提升近一倍。
相较V6的单曲最长4.5分钟,V7延长到5.5分钟,同样是2积分/每2首歌,可谓加量不加价。
和之前版本一样的是,Mureka V7划分为简单、高级两种模式。
简单模式下,用户输入大白话描述自己对歌曲的需求,在对话框里填写文字,适配各种场景的音乐作品,一键入耳。
高级模式下,输入关键词,让AI生成歌词后,可精准选择风格,对歌曲进行细致调整。
比如,在输入框输入“夏天,蝉鸣,毕业季”三个关键词,一两秒时间,Mureka自动生成几段歌词:
夏日蝉鸣毕业季/每一声都藏着秘密/树荫下笑语轻起/青春回忆在风里飘逸……
简单的字句,递进押韵,铺开离别情绪,旋律层次丰富,且自动划分主歌、副歌等段落。
用户若对歌词不满意,可标记进行优化,还能续写,生成歌词窗口的最大容量,能够达到3000字符。
接下来,点击“创作”,一首2分20秒的音乐作品,立等可听。
Mureka还有个独特的音乐参考功能。
用户可上传参考歌曲,提供相似曲风、自定义歌手、描述想要的音乐风格以及自行哼唱旋律,Mureka会识别音乐类型、节奏、配器和情绪等要素,由此确保作品风格的一致性。
这可以衍生出更多玩法,比如用邓丽君的温柔嗓音,演绎周杰伦风格的歌曲。
总而言之,Mureka竭尽全力帮用户洞察需求,捕捉那微妙而难以言明的表达要点,精准戳中爽感。
Mureka还有很多亮点。比如,支持纯音乐生成,支持10种语言的AI音乐创作,用户还可以自定义歌手音色,甚至上传自己的声音。
2
自研MusiCoT思维链颠覆音乐创作,
中国技术领跑新赛道
怎么干好“AI音乐生成”这件事,昆仑万维想得很早、很深,走出迥然不同的一条技术路线。
过去主流AI音乐模型,采用自回归(Autoregressive, AR)模型路线,其基于逐token预测的范式,连贯性与情感建构带有拼接感。
直白点说,就是能听,但“差点意思”。
Mureka的特点是,其采用自研的MusiCoT技术,可显著提升模型生成结果的整体性与发声表现。
其专为音乐生成而设计的链式思维(Chain-of-Thought, CoT)提示方法,打通了高保真AI音乐的技术堵点,音乐模型生成质量更高,推动打破“AI音乐没有灵魂”这一刻板印象。
2025年3月,公司正式推出 Mureka O1 模型及 Mureka V6 模型。作为全球首个音乐推理大模型的 Mureka O1,其性能全面超越 Suno,成功登顶 SOTA。
此次升级,在V6的基础上,V7进一步优化MusiCoT技术。
它重要的一个创新,是“先结构,后生成”的做法。在正式生成音频token之前,引导模型生成一份全局音乐结构规划,明确整体的段落、情绪、编配等布局。
打个比方,新手绘画时,常常缺乏规划,想到哪画到哪,成品会缺乏整体性,一些AI音乐生成模型,也有“顾局部不顾全局”的毛病。
MusiCoT先打“草稿”后创作,类似人类创作逻辑,AI不只是即兴演奏者,还是思考严谨的作曲家,其生成的作品,乐章推进与情绪递进非常自然。
基于CLAP模型,MusiCoT还有“音乐思维链”,具备明确的语义指向。
音乐创作的整体结构,可分析、可控制,允许输入任意长度的参考音频作为风格提示,由此,提升模型在复刻、变奏等创作需求中的灵活性,规避直接复制的风险。
昆仑万维称,基于大量实验,主观与客观双重指标下,MusiCoT技术均展现领先效果,在多项评测中的表现,达到行业一流水准。
新版本中,在结构层面,MusiCoT的思考逻辑,更像人类作曲家,还通过Mureka团队数据的scale-up以及Embedding信息粒度的细化,完善可控性与可扩展性,努力化解文本和音频之间,模态差异的那道鸿沟。
怎么把AI音乐玩出新花样,Mureka团队下了番功夫。此次推出的Mureka TTS V1,支持Voice Design能力,用户可使用文本控制音色生成。
不论真实人物、虚拟人物还是配音角色,通通能用文字调度,“菜色”更丰富,不似过去只能在特定音色库里挑选。
从技术指标来看,Mureka单是语音质量,就达到4.6分,超过Elevenlabs(4.36),整体听感远超同行。
以MusiCoT为核心的一系列技术创新,拉动Mureka“人人可用、好用、易用”,具有开创性意义,推动AI音乐快速走向工业化。
音乐终究服务于人的耳朵。如果AI音乐生成,停留在模板化、套路化阶段,劣质内容就无法打动听众,更别说产生情感共鸣。
只有AI音乐工具更好用,生成的音乐品质更高,“AI造富人类”才不会沦为一句空话。
3
昆仑万维AI矩阵厚积薄发,
加速跑通商业化
本质上,Mureka的定位,仍是工具,未介入到渠道层面。
这意味着,昆仑万维对所有音乐平台敞开大门,持开放态度,用户亦然——无论来自什么领域,只要爱好音乐或有创作需求,Mureka都提供一揽子工具包,人人触手可及。
Mureka支持10种语言作曲
它承载着“文化平权”“AI平权”的命题,亦寄托着昆仑万维“让每个人更好地塑造和表达自我”的重大使命。
纵观人类历史,文化创作一直是高阶层的特权。
尤其在音乐创作领域,复杂的乐理知识、昂贵的作曲设备、专业的制作软件,让创作音乐成为小部分人的闭门派对。
以编曲来说,有音乐基础的人,也需要付出很多时间成本和资金投入。这种生产环节,非常适合用AI来简化和提效。
Mureka V7的意义,正在于此——AI音乐平台不是“玩具”,而是一款可“创作”的专业级产品。
普通人的灵感火花和表达欲望,需要一个出口释放;手头不宽裕、愿意拥抱变化的音乐人,AI能成为他们的阶梯。
不久的将来,我们将看到,AI音乐进入权威音乐排行榜,成为金曲。
届时,创作壁垒瓦解,音乐产业迎接“个体化时代”,文化话语权实现再分配,点燃新的大众文艺火花。
改变,已在悄然发生。比如,有博主靠一首2分多钟的AI音乐,变现超5万元,在网易云音乐上的日播放量,最高达到15万。
昆仑万维推动AI与人文艺术融合,使文化产业发展走向去中心化。反过来讲,音乐创作这个30多亿美元的市场,只要公司能吃下2%,规模已非常可观。
从数据来看,Mureka推出的3月,月访问量高达333万,一举成为全球AI音乐品类增速最高。截至3月底,AI音乐年化流水收入ARR达到约1200万美金。
爆发的市场、亮眼的收入,都在证明赛道热度和公司战略前瞻性。
沿着“All in AGI与AIGC”的战略方向,昆仑万维坚定前进。
作为中国领先的人工智能科技公司,近年来昆仑万维在AI大模型、AI搜索、AI短剧、AI音乐、AI游戏、AI社交等多个领域取得了显著进展,构建了全面的AI业务布局。2024年度财报显示,昆仑万维实现营业总收入56.6亿元,同比增长15.2%,整体毛利率达73.6%。
大模型技术,正加速从“技术验证”向“商业闭环”跨越,在迈向全球AI巨头的道路上,昆仑万维悄然加速。