更多精彩 >

政府招商

活动

研究

投资家 > 创新创业

重磅发现！DeepSeekR1方法成功迁移到视觉领域，多模态AI迎来新突破！

2025-02-23 14:41:12 来源：网易作者：　

摘要：近日,从杭州一家知名大模型公司联汇科技获悉,赵天成博士带领OmAILab团队成功把DeepSeekR1从纯文本领域成功迁移到了视觉语言领域

近日，浙江大学博导赵天成博士带领Om AI Lab团队成功把DeepSeek R1从纯文本领域成功迁移到了视觉语言领域，这是DeepSeek R1模型首次突破到视觉推理层面。该模型为VLM-R1视觉语言模型,已经具备精确的视频理解和推理能力,证实了R1方法的通用性,为多模态模型的训练打开了想象空间。

这个项目的灵感来自去年DeepSeek开源的那个R1方法,靠着GRPO(Generative Reward Processing Optimization)强化学习方法,在纯文本大模型上取得了惊人的效果。

现在,VLM-R1团队直接把它应用到了视觉语言模型上,打开了一扇新的大门!

#VLM-R1验证结果惊艳#

这个项目的团队在 Qwen2.5-VL 的基础上,同时对比了 R1 和传统的 SFT 方法。结果相当惊艳:

1、稳定性拉满:R1 方法在各种复杂场景下都能保持稳定的高性能,这在实际应用至关重要!

2. 泛化能力卓越:更让人震惊的是,在领域外的测试数据上,随着训练步数增加,传统 SFT 模型的性能开始下滑,而 R1 模型却能持续提升!这意味着 R1 方法帮助模型真正“学会”了理解视觉内容,而不是简单地记忆!

(训练和测试领域的差异对比)

(泛化性对比,绿线是VLM-R1,在领域外泛化性显著更优)

3、上手超简单:VLM-R1项目团队还贴心地提供了完整的训练和评估流程,四步就能开始训练,对开发者十分友好。

#小编亲测#之后,在此分享一个实际案例,结果让人意外

图片里展示了一桌子丰盛的美食,包括各种蔬菜、面饼和点心。针对图片,我们向模型提出了一个问题:“在图片中找出蛋白质含量最高的食物”。

模型不仅回答得准确:

“图片中展示了桌上的各种菜品,包括蔬菜、面饼和点心。从蛋白质含量来看,面饼或面点可能含量最高,因为它们通常由全谷物制成,面粉中含有蛋白质。虽然蔬菜也含有蛋白质,但比起这些主食来说含量较少。”

更厉害的是,它还精准地在图片中框选出了那个蛋白质含量最高的鸡蛋饼!

这种精确的视觉理解能力和推理能力,让人印象深刻!

完美展示了 VLM-R1 在实际应用中的优势:

- 准确的视觉识别能力

- 专业的知识推理能力

- 清晰的文本表达能力

#全新思路#

作为一个AI领域的观察者,VLM-R1的出现也为开发者和行业提供了许多新的思路,比如:

1、证明了R1方法的通用性,不止文本领域玩得转;

2、为多模态模型的训练提供了新思路;

3、或许能够引领一种全新的视觉语言模型训练潮流;

#完全开源#

最棒的是,这个优秀的项目完全开源!

项目地址:[VLM-R1](https://github.com/om-ai-lab/VLM-R1)

对视觉语言模型感兴趣的同学,强烈建议去看看这个项目。说不定你的下一个突破性研究就从这里开始!

最后,期待看到更多开发者加入进来,一起推动多模态 AI 技术的发展。如果你也对这个项目感兴趣,欢迎加群讨论!

上一篇： 瑞德林完成超5亿元C轮融资
下一篇： 唯琴科技完成数千万元人民币Pre-A轮融资

猜你喜欢

原创

支付宝“乳腺医生天团”AI智能体受欢迎，用户量大涨150%

支付宝创新创业

这届网友开始流行“AI求医”了。

5小时前

一汽解放以创新科技开启发展新篇章

创新创业一汽解放

一汽解放积极贯彻落实国家“双碳”战略，2021年9月发布“15333”新能源战略，吹响了向新能源转型...

6小时前

原创

蚂蚁百宝箱推出“MCP专区”，为智能体提供一站式AI服务

创新创业蚂蚁百宝箱

4月16日消息，为提升智能体（AI Agent）与外部工具的配置效率，蚂蚁智能体平台—百宝箱推出了“...

6小时前

中免集团深度参与第五届消博会文旅融合引领消费新时尚

创新创业中免集团

4月13日至18日，由商务部和海南省人民政府共同主办的第五届中国国际消费品博览会（以下简称“消博会”...

6小时前

强脑科技与北京脑科学与类脑研究所共建脑机接口联合创新中心，打造国家脑机接口创新高地

创新创业强脑科技

在3月31日举办的中关村论坛脑机接口创新发展与应用论坛上，BrainCo强脑科技与北京脑科学与类脑研...

6小时前

精彩阅读原创资讯投资人物专栏

春节前“美丽经济”全面升温，民众热捧美容美发迎接新春

大消费天眼查

美发行业无疑是这股“美丽经济”热潮中的佼佼者。

2025-02-06

电动自行车新安全标准发布，护航民众出行安全

大消费天眼查

此次新标准的发布，不仅体现了政府对民众出行安全的重视，也为电动自行车行业的健康发展提供了有力保障。

2025-02-06

我国粮食总产量勇破1.4万亿斤大关，农业高质量发展开启新篇章

创新创业天眼查

大豆油料产业同样传来捷报，产量攀升至2065万吨新高，食用植物油自给率得到有效提升。

2025-02-06

中国外贸稳健前行：卓越经济韧性闪耀全球舞台

创新创业天眼查

中国始终秉持开放合作的理念，积极倡导开放型世界经济，与世界各国共享中国发展机遇，实现了互利共赢。

2025-02-06

新春佳节“菜篮子”工程稳健前行，全方位策略守护餐桌安全

大消费天眼查

值此新春佳节之际，农业农村部传来捷报，我国“菜篮子”工程稳扎稳打，保障能力再上新台阶。

2025-02-06

中国新能源车辆总数突破3000万大关，驶入高速发展快车道

新能源天眼查

业内人士普遍认为，我国新能源汽车市场拥有广阔的发展空间和巨大的内需潜力，这将为新能源汽车产业的蓬勃发...

2025-02-06

东峰集团：配合国有股东进行资源整合积极培育新的利润贡献点

创新创业东峰集团

国资入主后是否会调整并购策略？未来准备如何提升公司经营业绩？

2025-02-06

春晚“林黛玉”同款？益禾堂薄荷奶绿一夜爆红，国民饮品新宠儿震撼登场！

大消费益禾堂

益趣东方从来都不是简简单单的喊口号，是益禾堂认认真真一步一步在践行的目标。未来，期待益禾堂能够继续书...

2025-02-06

原创

春节复产复工潮，德邦快递架通企业发展振兴桥

创新创业德邦快递

春节假期过后，全国各地工厂与商家迎来复产复工的关键时期。

2025-02-06

汉通医疗完成亿元Pre-A轮融资

2025-02-05

投资家网（www.investorscn.com）是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务，包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流，并可加入微信群参与官方活动，赶快行动吧。

MORE+投资趋势

小米领投纬钛近亿天使轮！MIT团队造机器人触觉“超人手”

泛半导体设备商韵申科技A轮融资落地，同创伟业领投助力国产替代

会员制健康管理革新者获资本加持！爱连健康Pre-A轮落地

微创植入式给药装置新锐获资本押注！炜璨医疗斩获数千万元天使轮

崇辉半导体完成B轮融资

MORE+财经大事记

MEMS新锐迷思科技A轮融资落地，上海科创领投加速国产替代

MEMS新锐迷思科技A轮融资落地，上海科创领投加速国产替代

高端电子浆料突围战！海外华昇C轮融资近亿，协鑫、诺铁押注国产替代

全球首创人工半月板技术获资本加持！中杰超润Pre-A轮融资落地

具身智能新星穹彻再获数亿融资，机器人“大脑”加速多场景落地

睿健医药B+轮再获超2亿，帕金森细胞疗法冲刺中美临床

睿健医药B+轮再获超2亿，帕金森细胞疗法冲刺中美临床

瀚天天成A股折戟转战港股，获工银投资10亿元注资加码碳化硅扩产

瀚天天成A股折戟转战港股，获工银投资10亿元注资加码碳化硅扩产

MORE+峰会/论坛

分化浪潮中的坚守与突破 | 第19届中国投资年会，即将启幕

分化浪潮中的坚守与突破 | 第19届中国投资年会，即将启幕

产业与技术双向奔赴，具身智能产业供需交流会成功举办！

产业与技术双向奔赴，具身智能产业供需交流会成功举办！

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

热门投资话题

网站介绍

投资家网（http://www.investorscn.com/）隶属于北京微金科技有限公司，是国内知名的资本与产业创新综合服务平台。平台聚集数百万优秀创业者、资深PE/VC、投资银行家、上市公司及实业高管、专家学者等，致力于构建起资本、产业与政府之间的桥梁与生态服务体系。

商业计划书投递

邮箱：bp@wefinances.com

市场合作

微信：yangqin6060

媒体合作

微信：15201337588

查看更多 >微金科技自媒体矩阵

Copyright © 投资家网 | 京ICP备16014291号-1 | 京公安备11010502031933号网站地图

微博
微信公众平台