更多精彩 >

山海大模型迎来新一轮迭代,医疗能力超越Med-PaLM2

2023-06-25 19:53:31   来源:  作者: 

摘要:5月24日,云知声山海大模型正式发布,交出其在AGI领域的第一份答卷,并进入有序迭代阶段。

5月24日,云知声山海大模型正式发布,交出其在AGI领域的第一份答卷,并进入有序迭代阶段。时隔一个月,山海大模型迎来了又一次比较大的升级——各项性能持续优化,且在核心能力上实现三大升级:通过迭代实现了在特定领域内的专业知识积累,诗词创作能力、数学计算能力实现突破。

技术加码,性能持续优化

 

● 吞吐效率接近理论上限60% 

UniScale通过引入全新的Attention高效计算方式和相关底层算子的优化来提高浮点运算效率,另外,也进一步优化了训练框架中的通信策略,进一步提升了多机多卡的吞吐效率。UniScale目前在多机多卡大模型训练计算效率接近理论上限的60%,而当前公开的主流框架训练效率约45%左右,因此所提方法能够吞吐量在原有基础上提升了15个点。在推理部分,通过解码策略优化、量化和高效算子适配,相对原始推理性能翻倍,并适配了不同性能的显卡推理部署。这意味着训推一体框架UniScale 具有出色的并行计算能力,能够同时处理多个任务,大大提高了模型的训练速度。也表明在相同的时间内,UniScale可以完成更加高效的计算任务,降低推理部署成本。

image.png

 

● 微调速度提升15倍 

UniScale通过集成QLoRA微调(Dettmers et al., 2023)技术,不仅极大地减少了微调所需的硬件资源,还提高了微调速度。QLoRA是在LoRA微调(Hu et al., 2021)基础上结合了4位量化、双量化和统一内存分页技术,是一种高效的模型参数微调方法,不仅可以在普通消费级GPU上完成大规模语言模型的微调,还能够在较少的迭代次数内快速收敛。与此同时,我们实现了一种多指令统一微调技术,能够进一步减少模型的计算和通信开销,加快微调的速度。我们经过实验验证,UniScale在使用QLoRA微调和统一微调技术之后,微调速度提升了约15倍。

这一改进对于微调任务非常重要,特别是当资源有限的情况下在大规模数据集上进行微调的场景。传统的微调方法需要耗费较长的时间来逐步调整模型参数,而QLoRA微调能够通过多种量化方法显著减少显存占用,大大减少了微调所需的内存,同时性能几乎与标准微调相当。与此同时,微调后的模型可以直接用于模型部署,符合UniScale训练与推理一体化的设计理念,这项改进使得UniScale成为一个非常有效的深度学习平台,提供了更快速、高效的微调实验方案。

image.png

能力突破,效果加速提升

● 医疗能力超越Med-PaLM 

山海大模型实现了在特定领域内专业知识的快速积累,通过语料的不断迭代升级,专业能力持续突破。以医疗领域为例,山海大模型学习了大量教材、百科等高质量医学文献,使其能够提供更加全面、专业的医疗信息支持。在扩展了医疗大模型的领域知识的同时,山海大模型仍旧保持原有的高性能、高准确率等特点。医疗大模型的改进为医生们提供更强大的支持和指导,以提高医疗效果。目前该模型在MedQA任务上提升到了87.1%,超越Med-PaLM 2,临床执业医师资格考试提升到了523(总分600分),超过了99%的考生水平。

image.png

● 诗词创作能力升级 

在诗词创作方面上,山海大模型不仅在预训练阶段增加了7万多首古诗词数据,补充诗词相关的知识,在指令学习阶段,也精心设计近40种不同的指令,基本覆盖日常对诗词数据相关知识考察的内容,充分发掘大模型的潜力,进一步提升创作能力。通过指令学习的方法,山海大模型学会了运用类似的修辞手法和表达方式,使其创作效果更富诗意、更具情感温度。不仅如此,山海大模型还能够根据主题和情感要求进行定制化创作——这一突破不仅得益于诗词相关的指令学习数据的引入,也归功于山海大模型自身强大的计算和学习能力。

● 数学能力提升 

山海大模型的数学计算能力主要依赖预训练阶段扎实、系统的数学理论体系和指令学习阶段基于插件的具体题型的求解能力。为了进一步提升山海大模型的数学能力,我们主要针对以下两方面进行优化:

a)  我们在预训练阶段提供人工和模型精心挑选的高质量预训练数据,其中包括从小学到大学所有数学学科的教材、练习册等,通过这些数据的学习,模型就具备了系统的数学理论体系和解决各种数学问题的基础。

b)   基于 react 思想的指令学习是大模型数学能力的必要步骤。在此阶段,对每一种题型,我们给出具体的解题思路,包括 reasoning and acting,教会大模型解决各种问题的能力。解题过程中,为了解决大模型无法做精确数值计算的问题,将数值运算移交给插件完成,插件完成数值计算或者方程求解之后,将答案返回大模型,大模型继续问题求解,直到给出最终答案。

从5月24日正式发布以来,山海大模型始终在不断训练、调优,致力通过自身不断的迭代进化兑现AI应用价值;保持高速演进的同时,也在探索与具体场景深度融合的更多可能。

目前,云知声山海大模型已深入到智慧医疗、智慧教育、知识管理、智慧营销、智能客服等具体场景中,基于山海大模型打造的场景应用正不断丰富、不断拓展。

7月6日-7月8日,云知声将携山海大模型及其医疗、银行、车载、客服等最新场景应用亮相2023世界人工智能大会,欢迎大家届时莅临云知声展位参观交流。

从能力升级到场景应用,基于多年技术积累,云知声正加速推进山海大模型的迭代演变。未来山海会有怎样的惊喜和亮点,值得你的期待。


猜你喜欢

云知声创新事业部总裁陈吉胜受邀为上海师范大学作专题授课

创新创业云知声

12月4日,上海师范大学信息与机电工程学院第四届人工智能竞赛挑战周系列活动正式开幕。

2024-12-13

共启AI赋能智慧城市新篇章,云知声与上海仪电物联签署战略合作协议

智能+云知声

11月29日,云知声(上海)智能科技有限公司(以下简称“云知声”)与上海仪电物联技术股份有限公司(以...

2024-11-29

北京协和医院-云知声荣获2024全国智慧医保大赛一等奖

智能+云知声

近日,2024全国智慧医保大赛总决赛落下帷幕,由中国医学科学院北京协和医院(简称“北京协和医院”)与...

2024-11-21

中国科大&云知声联合团队斩获ACM MM 2024竞赛5冠2亚

智能+云知声中国科大

近日,第32届ACM国际多媒体会议在澳大利亚墨尔本圆满落幕。

2024-11-18

MMMU权威评测榜更新,云知声山海UniGPT-mMed荣登榜首

智能+云知声

近日,多模态人工智能模型基准评测集MMMU更新榜单,云知声山海多模态大模型UniGPT-mMed以通...

2024-10-08

原创

荷兰水展见证“行业销量第一”,安吉尔空间大师系列获权威机构认证

大消费安吉尔

3月11日到14日,全球最大的水处理行业盛会——2025荷兰阿姆斯特丹国际水处理展览会(以下简称“荷...

2025-03-14

Tik Tok平台如何“杀出重围”?Icloud Box给出科学解决方案!

智能+Tik Tok

在人工智能AI技术问世之前,很多人对于智能技术的想象和理解,大多数都停留在影视剧和科幻小说当中。

2025-03-14

图森罗生门,一家明星 AI 公司的三重漩涡

创新创业图森

从全球首个 IPO 的无人驾驶明星,到股价跌去 99%、创始人出走、风波不断的麻烦,图森只用了 3 ...

2025-03-14

小度与阳光保险集团达成战略合作,助力“银发经济”高质量发展

金融科技小度科技阳光保险集团

3月12日,小度科技与阳光保险集团签订战略合作协议,双方将围绕康养、寿险、科技三大版块开展深度合作,...

2025-03-14

助推新质生产力,华夏上证科创板综合ETF联接3月17日发行

金融科技华夏上证科创板综合ETF

自3月5日上市以来,华夏上证科创板综合ETF(扩位简称:科创综指ETF华夏,证券代码:589000)...

2025-03-14

创新之城走出的这一“隐形冠军”正德智控:专注驱动未来的核心力量

创新创业正德智控

当下,全球科技竞争焦点转移,人形机器人、大模型、量子计算等成为国际竞争新高地。

2025-03-14

打造制造业出海人才招引指南,科锐国际等联合发布《2025年中国制造业出海人才白皮书》

创新创业科锐国际

2024年,中国出口规模达到25.45万亿元,同比增长7.1%,规模再创历史新高,标志着中国企业在全...

2025-03-14

摊余成本法债基优势凸显,民生加银半年理财正当时

金融科技民生加银家

​在风云变幻的金融市场中,投资者始终在寻找风险与收益平衡的投资产品。债券市场作为金融市场的重要组成部...

2025-03-14

兆讯传媒:数智传播革新品牌营销场景, 加速赋能户外行业发展

上市公司兆讯传媒

在数字技术与实体经济深度融合的浪潮中,户外广告行业正经历结构性变革。

2025-03-14

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

沙特天空塔投资设立专项基金带领中国氢能独角兽扎根沙特

2016年注册于北京的中氢新能技术有限公司,下设位于大兴的装备制造公司、位于海淀区的技术研究院、材料...

挑战奔驰的明星车企,突然“翻车”了

一度无比高光的理想汽车,猝不及防遭遇重挫。

深圳天使母基金姚小雄:将来股权投资行业竞争是服务能力的竞争

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

2024年的一级市场,“耐心”是最高命题,也引发了持续全年的讨论。

不响不辍|第18届中国投资年会·年度峰会在沪召开

不响不辍|第18届中国投资年会·年度峰会在沪召开

5月8-10日,由投中信息、投中网主办的“第18届中国投资年会·年度峰会”在上海外滩W酒店盛大召开。