您的位置 首页 科技

超越OpenAI?国产推理模型的2025半年“狂飙时刻”

文 | 智能相对论作者 | 陈泊丞今年年初,DeepSeek-R1以低成本、高性能以及开源特性在全球AI圈内爆火走红,风头一度压过OpenAI,同时也开启了国产推理模型持续“狂飙”时刻。

文 | 智能相对论

作者 | 陈泊丞

今年年初,DeepSeek-R1以低成本、高性能以及开源特性在全球AI圈内爆火走红,风头一度压过OpenAI,同时也开启了国产推理模型持续“狂飙”时刻。

回顾过去的2025上半年,「智能相对论」统计发现,在DeepSeek之外,阿里、科大讯飞、小米、月之暗面、商汤科技等厂商都陆续宣告自家大模型对OpenAI系列模型产品的追赶或是超越。

超越OpenAI?国产推理模型的2025半年“狂飙时刻”

智能相对论制图

国产模型的加速“狂飙”有目共睹。OpenAI在今年4月一改口风,发布了o3/o4 mini模型,或许也有来自后来者追赶的压力。但是,对于国产模型而言,比起性能上的追赶和超越,自我的发展节奏也在上半年逐渐形成,初见端倪。

国产模型的“弯道超车”

展开全文

DeepSeek的走红并非是其性能完全超越OpenAI,而是来自于低成本优势和开源生态带来的颠覆性体验,使其迅速“破圈”,成为全球热门AI模型。在过去的半年内,延续DeepSeek的破圈逻辑,国产模型似乎也瞄准了类似的路径。

一、低成本突围,用更少的算力追赶OpenAI的性能。

前不久,阿里千问3登顶全球最强开源模型,也在一定程度上完成了国产模型的破圈。成就这次现象的关键除了模型快速上线通义App之外,还有就是自身的高性能与低成本特性,其性能在超越OpenAI-o1与DeepSeek-R1的同时,部署成本大幅降低,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

超越OpenAI?国产推理模型的2025半年“狂飙时刻”

尽管在性能上,国产模型很难跟OpenAI拉开太大的差距,但是在部署成本上的持续优化,从另一个角度真正意义上完成了对OpenAI的追赶。几乎是同一时间,星火X1也完成升级,整体效果对标OpenAI-o1与DeepSeek-R1。而在算力成本上,星火X1不仅是业界唯一基于全国产算力训练的深度推理模型,还成功实现了只需4张华为910B芯片即可完成部署,把国产模型的低成本特性再度“打爆”。

超越OpenAI?国产推理模型的2025半年“狂飙时刻”

中美博弈态势加剧,美国对华的算力管控越来越严格,从某种程度来说,这是一种无奈之举,但同时也是一个强势突围的方向,依托低成本部署优势,国产模型在AI普惠与行业应用中具备更强的适配性。若能继续沿着这一方向突围,国产模型的行业渗透率将在今年下半年继续保持强势增长。

二、开源生态破局,重新制定行业规则,打破技术霸权秩序。

DeepSeek-R1采用MIT协议,千问3采用Apache2.0协议,均是极宽松的开源协议,在OpenAI的闭源霸权之下,国产模型更热衷于用开源策略来吸引全球开发者的目光,打造一个更广泛的模型生态,从而制衡OpenAI的先发优势与性能主义。这一策略正在被更多的国产模型所复刻,小米也开源了MiMo。

如今,中国的模型厂商在开源路径上不断走出自己的特色,不仅开放了不同参数规格的模型产品,还包括各种量化版本、完整的训练数据集以及微调所需的数据模板等,满足了不同场景下的实际需求,甚至是给到详细的API设计和文档,方便开发者快速集成和使用。

在开源上,国产模型表现出积极的态度。比起性能上的追赶,国产模型也正在试图在开源与性能之间中找到一个平衡点,基于完善的服务和生态来实现模型的超越。值得一提的,DeepSeek-R1、千问3在HuggingFace等开源社区上均取得了开发者们不错的反馈,整个千问系列的全球衍生模型更是超过10万个,超越美国Llama位列第一,说明国产模型的开源策略正在被更多的全球开发者所认可。

三、特定能力强化,专为行业应用而打造,实用主义的国产属性爆表。

现阶段,国产模型对OpenAI的超越更多体现在特定的能力或任务处理上。日日新V6的多模态处理能力对标OpenAI-o1,同时迭代成为国内首个支持10分钟中长视频深度解析的大模型。

为什么要这么强化特定能力?商汤科技认为,比起文本性的内容消费,视频、图文结合是更大的内容消费市场。由此,日日新V6把语音、视频、文字形成一个统一跟时间轴对齐的上下文表达,从而实现人机交互更自然、高效。这种做法更多是从实际的行业应用出发,日日新V6的能力强化正是为了具身智能的突破做准备。

这样的做法类似于中国的古代智慧“田忌赛马”,OpenAI-o1在结构化推理方面优势显著,而国产模型则在中文语境、多模态能力、成本效率上进行非对称竞争,不去和OpenAI强势的一面做对抗。同时,这也符合当前本土产业在AI应用过程中对模型能力的需求,顺势让国产模型更快地进入企业级市场,加速商业化。

模型“狂飙”:OpenAI向左,国产向右

在今年上半年,OpenAI已经推出更强、更智能的o3和o4-mini模型。尽管在成本效率上无法达到国产模型的夸张水平,但OpenAI在上代相同的延迟和成本上实现了更强的性能体验。

OpenAI对模型性能的追求依旧是业内标杆,作为最新的旗舰模型,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,远远甩开o1的74.3%的成绩。而在Codeforces编程竞赛评分中,支持终端工具的o3和o4-mini也分别取得2706和2719的ELO分数,领先程度有目共睹,展现了其在数学和代码能力上的巨大突破。

超越OpenAI?国产推理模型的2025半年“狂飙时刻”

除此之外,OpenAI的新模型在知识问答、多模态推理等方面也都表现出更强大的能力,再次奠定了其在AI行业的领军地位。相对而言,国产模型的路径更多倾向于行业应用,综合特定能力、成本效率、应用流程等条件下追求更适配的AI解决方案。

日前,阶跃星辰发布并开源3D模型Step1X-3D,同一时间还公布了完整的数据清洗策略,数据预处理策略,以及800K高质量的3D资产,3D VAE、3D geometry Diffusion以及 texture Diffusion的全链路训练代码开源。基于这些强而有力的措施,国产模型在造福开发者的同时,也在用近乎掀桌子的方式引领一个全新的3D社群生态。

垂直领域的能力强化、开源策略吸引开发者以及各种成本效率优势……综合以上种种优势,国产模型在上半年正在形成类似的打法来寻求市场突围。当然,尽管如此,国产模型也没有放弃主流的前进方向,比如多模态能力依旧是OpenAI和国产模型的主要迭代方向,基础模型的能力研发与突破同样也在国产厂商的考量之内。

写在最后

即将过去的2025上半年,是国产模型的高光时刻,也是一众国产模型在面对OpenAI的强势攻势与全球市场激烈博弈下持续寻求突围的关键阶段。在这场AI比拼中,尽管国产模型依旧热衷于对标OpenAI,但是走的路却是逐步形成了自己的特色。

从某种程度来说,国产模型不再是完全的追随者,也在进化为独立的引领者。在诸多国产模型的发展上,这一趋势或许在下半年会越来越明显。

*本文图片均来源于网络

本文来自网络,不代表天火虎新闻网立场,转载请注明出处:/35393.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部