中国首个音乐SOTA模型「天工音乐大模型」今日公测

2024-04-17 11:46:07 来源：亿欧网作者：　

摘要：「天工3.0」拥有4000亿参数，超越了3140亿参数的Grok-1，是全球最大的开源MoE大模型。

2024年4月17日，在「天工」大模型一周年之际，昆仑万维重磅宣布，「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测！一年前的今天，第一版天工大模型正式对外发布上线，一年来我们不断迭代模型，迭代应用产品，模型和应用都越做越好，以此回报广大用户的支持。

「天工3.0」拥有4000亿参数，超越了3140亿参数的Grok-1，是全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升，数学/推理/代码/文创能力提升超过30%。

（天工3.0模型参数超越Grok-1，成全球最大开源MoE专家混合大模型）

强大的模型技术实力赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中，「天工3.0」超越GPT-4V，全球领先。

（天工3.0多模态性能超越GPT-4V，全球领先）

同时，「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开放公测。「天工SkyMusic」是中国首个音乐SOTA模型，更是中国的自研大模型技术第一次在AIGC领域领跑全球。

（天工SkyMusic综合性能超越Suno V3，取得音乐大模型SOTA，领跑全球）

天工SkyMusic：中国首个音乐AIGC SOTA模型

此前，大模型已经在文本、图像等多个技术领域取得突破，带来产业全面变革。然而，在AI音乐生成领域，全球迟迟等不到一款产品，开启「音乐ChatGPT时刻」。

这是因为一直以来，AI音乐行业大量研究都集中在符号音乐生成技术路线上，并且大多只能实现无人声背景音乐（Background Music，BGM）的生成，音乐的质量、效果、审美都远远达不到可用水平，产业迟迟未能爆发。

（「天工SkyMusic」自研AI音乐大模型技术架构）

与行业主流路径不同，「天工SkyMusic」采用自研大模型音乐音频生成技术路线。这一路线直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成，技术难度极大，全球只有包括昆仑万维在内的极少数顶尖玩家参与。

在与海外顶尖的AI音乐大模型Suno V3的横向测评中，「天工SkyMusic」在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手，并以6.65分的综合得分超越Suno V3，成为全球AI音乐SOTA模型。

此外，「天工SkyMusic」还拥有独创的参考音乐生成与方言歌曲生成能力。

参考音乐生成：用户可上传自有参考音乐，或选择「天工SkyMusic」资料库中现有的参考音乐，从而生成风格、唱腔类似的歌曲，进一步降低音乐大模型的使用门槛，让不熟悉乐理知识的用户也能轻松玩转。

方言歌曲生成：「天工SkyMusic」生成的音乐不仅在人声自然度、发声可懂度等领域表现优秀，更能够支持粤语、成都话、北京话等众多方言，让用户能够更自由地实现音乐表达，传播方言文化。

「天工SkyMusic」是中国首个公开可用的AI音乐生成模型，更是中国自研大模型技术第一次在AIGC领域领跑全球。

当前，在文本大模型领域，OpenAI吸引了全球的注意力；但是在AI搜索、AI音乐生成等细分领域，中国玩家们正在奋勇前行，不断通过自研技术取得细分领域顶尖的SOTA表现，共同建设中国大模型产业，打造自主可控的大模型产业生态。

天工3.0：4000亿参数，全球最大开源MoE大模型

在上一代「天工2.0」MoE大模型的领先基础上，「天工3.0」实现了全面的性能升级，采用了4000亿级参数MoE混合专家模型架构，是目前全球模型参数最大、性能最强的开源MoE模型。

「天工3.0」的逻辑推理能力、语义理解能力、应对复杂需求能力、内容创作能力全面升级，并新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项AI能力，为用户带来全新AI体验。

多轮搜索与综合工具调用：「天工3.0」针对模型独立规划、调用、组合外部工具及整合信息的能力进行了专项训练，使其能够独立生成并调用代码，完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求。

同时，「天工3.0」能够通过强大的语义理解能力将用户任务拆解成细分环节，实时判断是否需要联网或调用工具，进行单轮或多轮的联网搜索、工具调用，完成包括多轮搜索、热点信息分析、图片生成等复杂用户需求。

（Query：查询最新中国历史电影票房排行，图表展示）

图表绘制：「天工3.0」全面提高了逻辑推理能力与用户自然语言Query的理解能力，使其能够更精准地判断用户需求，独立生成并调用代码，结合文本需求实时进行内容分析及图表构建，为用户带来更直观、高效的对比结果。

（Query：北京、上海、重庆哪个好玩？）

多轮搜索、综合工具调用、图表绘制等都是「天工3.0」所独有的大模型综合能力，其从底层打通了「天工3.0」的AI搜索、AI对话、AI代码生成、AI图片识别、AI图像生成等底层能力，通过语义识别能力直接触发，为用户带来更加便捷、高效的AI体验，成为真正的AI生产力工具。

此外，「天工3.0」中还增加了研究模式、增强模式、改图扩图等多项AI能力。

研究模式：在研究模式中，「天工3.0」能够围绕用户的某个简单指令进行相关问题的延伸，自动生成研究大纲、图谱、实践总结、思维导图，帮助用户快速清晰地把握核心内容，完成用户复杂的研究需求。

（Query：康乾盛世年代）

增强模式：在增强模式中，「天工3.0」能够针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全，使其在自然语义理解方面性能更强，面对不确定性知识时表现更好，能够更精准、高效地满足用户需求。

（Query：2024年春节档电影；「天工3.0」理解并追问用户需求）

改图扩图：「天工3.0」多模态性能取得全面突破，超越GPT-4V，综合排名全球第一。在强大的技术底座支持下，「天工3.0」的AI绘图能力新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功能。

（「天工3.0」的AI改图、修图、扩图等功能）

关于昆仑万维

自去年4月17日「天工」大模型正式推出以来，昆仑万维已围绕「天工」系列大模型建起AI大模型、AI搜索、AI音乐、AI视频、AI社交、AI游戏等AI业务矩阵，是国内模型技术与工程能力最强、布局最全面的人工智能科技企业之一。

这一年里，除了对「天工」系列基座大模型进行不断升级迭代，昆仑万维还推出了国内第一款AI搜索引擎「天工AI搜索」、开源了百亿级大语言模型「天工Skywork-13B」、推出国内领先的AI Agent开发平台「天工SkyAgents」等一系列前沿大模型产品。

当前，「天工」系列大模型已集成了AI音乐、AI搜索、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项能力，并将在未来加入AI视频功能，对标“超级应用”，成为人工智能时代的“超级大模型”（Super Model）。在“实现通用人工智能，让每个人更好地塑造和表达自我”的公司使命驱动下，昆仑万维将始终致力于AI技术与产品的创新开拓，不断提高AI产品的用户体验，与用户、研究人员、开发者们携手，共创国产大模型的未来。

上一篇： 《蛋仔派对》辅助未成年远离充值诈骗陷阱
下一篇： 携手赫力昂发布新品叮当健康成企业营销、患教及数字化铺货新阵地

精彩阅读原创资讯投资人物专栏

直面科转堵点，西安成立“中试+投融资”创新联盟

金融科技西安财金

近日，在西安市委、市政府主办的第八届“硬科技大会”上，西安财金投资管理有限公司党委书记、董事长任纪刚...

2024-11-04

东北首单！沈阳国际软件园公募REITs项目由上交所正式受理

创新创业沈阳国际软件园

11月1日，中信建投沈阳国际软件园REITs项目已由上海证券交易所正式受理，这是东北地区首单正式受理...

2024-11-04

权益布局正当时，宏利价值驱动六个月持有混合火热发行中

金融科技宏利

9月中下旬以来，随着海外降息、国内货币政策组合拳以及监管重要会议释放的相关政策等多重利好提振，中国权...

2024-11-04

E-Tech DEMO DAY“新质引领智能制造产业高质量发展”投融交流会成功举办

峰会新质引领智能制造产业高质量发展

近日，由北京市昌平区人民政府主办，北京市昌平区财政局（基金办）、北京市昌平区发改委、昌发展集团、招商...

2024-11-04

高级感硬装必选，NVC雷士电工超薄轨道插座DPX系列真香

大消费 NVC雷士

近年来，轨道插座因兼具颜值、实用、安全等优势，已经逐渐演变成潮装主流。

2024-11-04

原创

北京未来科学城先进能源及制造产业基金成立

北京未来科学城先进能源及制造产业基金

【#北京未来科学城先进能源及制造产业基金成立# 出资额10亿元】

2024-11-04

原创

中国保险投资基金在合肥成立合伙企业

中国保险投资基金

【#中国保险投资基金在合肥成立合伙企业# 出资额200亿】

2024-11-04

原创

奢侈品巨头LVMH旗下路威凯腾等在广州成立消费股权基金

LVMH

【#奢侈品巨头LVMH旗下路威凯腾等在广州成立消费股权基金# 出资额9.4亿】

2024-11-04

重磅发布｜《大国竞争与世界秩序重构》

文化传媒大国竞争与世界秩序重构

希望通过这本书为老师、同学、普通大众提供理解大国竞争、国际贸易与金融争端、世界经济秩序的科学视角。

2024-11-04

瑞普晨创完成超亿元A轮融资

瑞普晨创

2024-11-04

投资家网（www.investorscn.com）是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务，包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流，并可加入微信群参与官方活动，赶快行动吧。