山海大模型迎来新一轮迭代，医疗能力超越Med-PaLM2

2023-06-25 19:53:31 来源：作者：　

摘要：5月24日，云知声山海大模型正式发布，交出其在AGI领域的第一份答卷，并进入有序迭代阶段。

5月24日，云知声山海大模型正式发布，交出其在AGI领域的第一份答卷，并进入有序迭代阶段。时隔一个月，山海大模型迎来了又一次比较大的升级——各项性能持续优化，且在核心能力上实现三大升级：通过迭代实现了在特定领域内的专业知识积累，诗词创作能力、数学计算能力实现突破。

技术加码，性能持续优化

● 吞吐效率接近理论上限60%

UniScale通过引入全新的Attention高效计算方式和相关底层算子的优化来提高浮点运算效率，另外，也进一步优化了训练框架中的通信策略，进一步提升了多机多卡的吞吐效率。UniScale目前在多机多卡大模型训练计算效率接近理论上限的60%，而当前公开的主流框架训练效率约45%左右，因此所提方法能够吞吐量在原有基础上提升了15个点。在推理部分，通过解码策略优化、量化和高效算子适配，相对原始推理性能翻倍，并适配了不同性能的显卡推理部署。这意味着训推一体框架UniScale 具有出色的并行计算能力，能够同时处理多个任务，大大提高了模型的训练速度。也表明在相同的时间内，UniScale可以完成更加高效的计算任务，降低推理部署成本。

● 微调速度提升15倍

UniScale通过集成QLoRA微调（Dettmers et al., 2023）技术，不仅极大地减少了微调所需的硬件资源，还提高了微调速度。QLoRA是在LoRA微调（Hu et al., 2021）基础上结合了4位量化、双量化和统一内存分页技术，是一种高效的模型参数微调方法，不仅可以在普通消费级GPU上完成大规模语言模型的微调，还能够在较少的迭代次数内快速收敛。与此同时，我们实现了一种多指令统一微调技术，能够进一步减少模型的计算和通信开销，加快微调的速度。我们经过实验验证，UniScale在使用QLoRA微调和统一微调技术之后，微调速度提升了约15倍。

这一改进对于微调任务非常重要，特别是当资源有限的情况下在大规模数据集上进行微调的场景。传统的微调方法需要耗费较长的时间来逐步调整模型参数，而QLoRA微调能够通过多种量化方法显著减少显存占用，大大减少了微调所需的内存，同时性能几乎与标准微调相当。与此同时，微调后的模型可以直接用于模型部署，符合UniScale训练与推理一体化的设计理念，这项改进使得UniScale成为一个非常有效的深度学习平台，提供了更快速、高效的微调实验方案。

能力突破，效果加速提升

● 医疗能力超越Med-PaLM 2

山海大模型实现了在特定领域内专业知识的快速积累，通过语料的不断迭代升级，专业能力持续突破。以医疗领域为例，山海大模型学习了大量教材、百科等高质量医学文献，使其能够提供更加全面、专业的医疗信息支持。在扩展了医疗大模型的领域知识的同时，山海大模型仍旧保持原有的高性能、高准确率等特点。医疗大模型的改进为医生们提供更强大的支持和指导，以提高医疗效果。目前该模型在MedQA任务上提升到了87.1%，超越Med-PaLM 2，临床执业医师资格考试提升到了523（总分600分），超过了99%的考生水平。

● 诗词创作能力升级

在诗词创作方面上，山海大模型不仅在预训练阶段增加了7万多首古诗词数据，补充诗词相关的知识，在指令学习阶段，也精心设计近40种不同的指令，基本覆盖日常对诗词数据相关知识考察的内容，充分发掘大模型的潜力，进一步提升创作能力。通过指令学习的方法，山海大模型学会了运用类似的修辞手法和表达方式，使其创作效果更富诗意、更具情感温度。不仅如此，山海大模型还能够根据主题和情感要求进行定制化创作——这一突破不仅得益于诗词相关的指令学习数据的引入，也归功于山海大模型自身强大的计算和学习能力。

● 数学能力提升

山海大模型的数学计算能力主要依赖预训练阶段扎实、系统的数学理论体系和指令学习阶段基于插件的具体题型的求解能力。为了进一步提升山海大模型的数学能力，我们主要针对以下两方面进行优化：

a) 我们在预训练阶段提供人工和模型精心挑选的高质量预训练数据，其中包括从小学到大学所有数学学科的教材、练习册等，通过这些数据的学习，模型就具备了系统的数学理论体系和解决各种数学问题的基础。

b) 基于 react 思想的指令学习是大模型数学能力的必要步骤。在此阶段，对每一种题型，我们给出具体的解题思路，包括 reasoning and acting，教会大模型解决各种问题的能力。解题过程中，为了解决大模型无法做精确数值计算的问题，将数值运算移交给插件完成，插件完成数值计算或者方程求解之后，将答案返回大模型，大模型继续问题求解，直到给出最终答案。

从5月24日正式发布以来，山海大模型始终在不断训练、调优，致力通过自身不断的迭代进化兑现AI应用价值；保持高速演进的同时，也在探索与具体场景深度融合的更多可能。

目前，云知声山海大模型已深入到智慧医疗、智慧教育、知识管理、智慧营销、智能客服等具体场景中，基于山海大模型打造的场景应用正不断丰富、不断拓展。

7月6日-7月8日，云知声将携山海大模型及其医疗、银行、车载、客服等最新场景应用亮相2023世界人工智能大会，欢迎大家届时莅临云知声展位参观交流。

从能力升级到场景应用，基于多年技术积累，云知声正加速推进山海大模型的迭代演变。未来山海会有怎样的惊喜和亮点，值得你的期待。

上一篇： 海德股份：全资子公司海徳资管获批接入人民银行征信系统
下一篇： 果郡王要开播了，带你现场直击嬛嬛煮糙米薏仁汤！

手握30家资本，4个博士要IPO

云知声

四个技术偏执狂！

2025-04-11

云知声入选工信部2024年未来产业创新发展优秀典型案例，打造智慧医疗创新范式

创新创业云知声

云知声"基于大模型和语音交互技术的医疗文书自动生成系统"成果入选未来信息方向典型应用场景，成为全国智...

2025-03-31

云知声创新事业部总裁陈吉胜受邀为上海师范大学作专题授课

创新创业云知声

12月4日，上海师范大学信息与机电工程学院第四届人工智能竞赛挑战周系列活动正式开幕。

2024-12-13

共启AI赋能智慧城市新篇章，云知声与上海仪电物联签署战略合作协议

智能+云知声

11月29日，云知声（上海）智能科技有限公司（以下简称“云知声”）与上海仪电物联技术股份有限公司（以...

2024-11-29

北京协和医院-云知声荣获2024全国智慧医保大赛一等奖

智能+云知声

近日，2024全国智慧医保大赛总决赛落下帷幕，由中国医学科学院北京协和医院（简称“北京协和医院”）与...

2024-11-21

精彩阅读原创资讯投资人物专栏

我国粮食总产量勇破1.4万亿斤大关，农业高质量发展开启新篇章

创新创业天眼查

大豆油料产业同样传来捷报，产量攀升至2065万吨新高，食用植物油自给率得到有效提升。

2025-02-06

中国外贸稳健前行：卓越经济韧性闪耀全球舞台

创新创业天眼查

中国始终秉持开放合作的理念，积极倡导开放型世界经济，与世界各国共享中国发展机遇，实现了互利共赢。

2025-02-06

新春佳节“菜篮子”工程稳健前行，全方位策略守护餐桌安全

大消费天眼查

值此新春佳节之际，农业农村部传来捷报，我国“菜篮子”工程稳扎稳打，保障能力再上新台阶。

2025-02-06

中国新能源车辆总数突破3000万大关，驶入高速发展快车道

新能源天眼查

业内人士普遍认为，我国新能源汽车市场拥有广阔的发展空间和巨大的内需潜力，这将为新能源汽车产业的蓬勃发...

2025-02-06

东峰集团：配合国有股东进行资源整合积极培育新的利润贡献点

创新创业东峰集团

国资入主后是否会调整并购策略？未来准备如何提升公司经营业绩？

2025-02-06

春晚“林黛玉”同款？益禾堂薄荷奶绿一夜爆红，国民饮品新宠儿震撼登场！

大消费益禾堂

益趣东方从来都不是简简单单的喊口号，是益禾堂认认真真一步一步在践行的目标。未来，期待益禾堂能够继续书...

2025-02-06

原创

春节复产复工潮，德邦快递架通企业发展振兴桥

创新创业德邦快递

春节假期过后，全国各地工厂与商家迎来复产复工的关键时期。

2025-02-06

汉通医疗完成亿元Pre-A轮融资

汉通医疗

2025-02-05

煜邦电力取得跨越式增长

上市公司煜邦电力

作为电力制造领域的创新先锋，煜邦电力不仅提升经营开发的质量和效率，实现了稳健的增长，而且顺利完成了年...

2025-02-05

《哪吒之魔童闹海》官方手办众筹破1200万，阿里鱼旗下造点新货打造春节档IP衍生品爆款

创新创业阿里鱼

据灯塔专业版，截至2月5日13时29分，2025年春节档上映新片总票房(含点映及预售)突破100亿。

2025-02-05

投资家网（www.investorscn.com）是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务，包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流，并可加入微信群参与官方活动，赶快行动吧。