当前位置:首页 > 足球资讯 > 正文内容

OpenAI强推路由,为何成了GPT-5最大败笔?

杏彩体育10个月前 (09-04)足球资讯195

如果Scaling Law是指导大模型能力提升最重要的标尺,那么“算力成本控制”就是大模型行业发展和商业化的基石。
2025年年初,DeepSeek在国外开源社区首先爆火,一个很重要的原因就是,DeepSeek几乎将同性能模型的推理算力和训练算力成本都降到了10%以内。MoE架构也在GPT-4发布之后,逐渐取代了稠密架构,成为了几乎所有大模型开发商的默认选项,最核心的原因也是能够有效降低模型推理的算力成本。
而OpenAI伴随着GPT-5发布第一次与用户见面的“路由(routing)”功能,设计本意也是代替用户来把简单问题匹配到低消耗模型,复杂问题匹配到能力和算力消耗高的推理模型,从而有效提升用户体验和算力效率,但却变成AI圈最知名的“降本增笑”事件。
即便是GPT-5发布接近了一个月,OpenAI还是没有能让所有用户满意,网友依然还在吐槽,GPT-5没有办法解决一些很简单的问题。虽然随着OpenAI回滚了GPT-4o,还让用户能够手动在推理模型和基本模型间切换,让大多数用户开始同意OpenAI宣称的“GPT-5性能明显强于之前的模型”,但是Sam Altman自己也没有办法否认,GPT-5的发布确实是漏洞百出。
而造成翻车最直接的原因,就是他们强推的路由功能没能将用户的预期和相应的模型能力匹配好。

那么问题来了,为什么OpenAI冒着GPT-5“发布即翻车”的风险,也要强推路由功能?
第一个最直接的原因就是,在GPT-5发布之前,OpenAI并行推出了5个以上的模型,让用户根据自己需求来选择合适的模型。随着模型越来越多,别说普通用户了,就是ChatGPT的重度用户,有时候也很难决定使用哪个模型最合适自己当前的任务。
对于立志于将ChatGPT打造成为AI时代超级APP的OpenAI,不可能允许这样的情况持续存在。特别是对于大量没有接触过大模型的普通用户,替他们针对不同的任务选择合适的模型,是OpenAI在某一个时间点必须要做的事情。
而另一个更深层次的原因在于,从算力成本的角度出发,自从推理模型出现之后,每一次对于大模型的询问,都需要在推理模式和非推理模式之间进行一次选择。而这种调配“深度思考”能力的效率,决定了大模型产品对于算力的使用效率。
根据学术界对于推理模型和非推理模型的研究结果,推理模型和非推理模型的算力差异巨大,可能达到5~6倍。对于复杂问题,通过思维链等技术进行推理后,内部消耗的推理token数可能高达上万个。
而在延迟上,推理过程和非推理过程的差异就更加巨大了,根据OpenAI自己发布的数据,使用推理模型回答复杂问题所需要的时间,可能是使用非推理模型的60倍以上。
而就算对于很多需要复杂推理的任务,在消耗了巨大的算力以及大量的时间之后, 给出的结果和准确性差异往往就在5%左右。为了这5%的性能提升,消耗多大的算力合适呢?
做一个简单的算术题,如果OpenAI将所有任务都默认使用推理模型来完成,路由功能能够帮助OpenAI识别出10%的问题可以通过简单的非推理模型完成,就可能将算力成本降低8%(推理非推理算力比值为5:1)。
如果将这个比例进一步提高,能够降低的算力成本将更加可观。对于OpenAI这样一个需要服务数亿用户,而且算力供应依然非常紧张的公司来说,路由功能是否发挥作用,可以说关系到自身商业模式是否可持续的核心能力。
在行业层面,第三方平台(如 OpenRouter)把“自动路由与回退(fallback)”做成基建能力:当主模型拥塞、限流或内容拒绝时,按策略自动切换到次优模型,以稳定用户体验。微软的Azure这样的AI算力云供应商,也将不同模型之间的路由能力作为AI云计算的一大卖点。
也许,GPT-5发布之后,对于OpenAI来说,最重要的事情就是在“质量-延迟-成本”的三角中寻找每条请求的最优平衡点。而目前官方对 GPT-5 的定位与“内置思考(built-in thinking)”叙事,实际上就是把“路由+推理强度”做成默认能力,并在 ChatGPT 端通过“Auto/Fast/Thinking”给了用户一定程度的可见与可控性。

为大模型打造一个高效的路由功能到底有多难?
这个问题,外媒在一篇报道中向UIUC的一名计算机专业的助理教授求证,得到的回答是“可能是一个亚马逊推荐系统级别的问题,需要大量专家努力工作数年时间才能获得一个满意的结果。”模型系统层面的路由功能本质是“多目标+强约束”的工程问题。 路由不是只拼准确率,还要在质量、延迟、成本、配额/峰值容量、成功率之间做实时优化。
而且从理论上来说,语义级别的路由功能在效率上来看,远远不是这个问题的最优解。DeepSeek在上周放出的DeepSeek V3.1就在尝试将推理模型和非推理模型混合起来,在更深层次上打造出一个效率更高的路由系统,从而从根本上提高大模型“推理-非推理”的选择效率。
根据网友体验之后的感受,新的混合推理模型相比之前R1有着更快的思考速度:相较于 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短的时间内得出答案。
并且,在回答性能相似的前提下,输出长度有明显的下降:新的推理模型在简单问题上,推理过程有约10%以上的缩短。正式输出的部分,新模型大幅精简,平均仅有1000字,比R1 0528的平均2100字水平提高了接近一倍。
但是另一方面,新的混合推理模型也爆出了一些不太稳定的问题:比如会不时在很多输出中出现莫名其妙的“极”bug:在答案中出现很多完全不相关的“极”
而且在R1上就存在的中英夹杂的情况似乎变得更加严重了,就像一个刚回国不久的留学生,在很多中文任务中会显得很出戏。
即使像DeepSeek这样的国内最顶尖的大模型团队,将“推理-非推理”选择功能内置到模型内部,模型的稳定性上也会出现一定程度的问题。而OpenAI和DeepSeek在自己各自首个推出的试图高效调度“深度思考”能力的模型上都出现了不同程度的翻车,侧面反映出要处理好这个问题的难度。
1 (25).jpg提高效率的另一面,是OpenAI依然处于对于算力“极度渴求”的状态中。
年初,DeepSeekV3和R1的推出引发的全世界对于英伟达等算力供应商未来前景的担忧,在短短几个月之后就演变成了“AI成本悖论”——token单价下降,但模型的性能不断成长,这使得原本交由模型处理本来会显得不经济的任务也能交给大模型处理,模型能够处理的任务将更多样与复杂,这从而会进一步推高对token总量的需求。
OpenAI 正在推进代号为Stargate的基础设施扩张计划:2025 年 7 月,OpenAI 与 Oracle 宣布在美国新增 4.5 GW 的数据中心能力。
9月2日,外媒也报道,OpenAI 正在物色印度当地合作伙伴,并计划在新德里设立办公室,把印度(其第二大用户市场)的用户增长与本地算力配置对接起来,在印度建设至少1Gw规模的数据中心。
“AI成本悖论”一方面不断推高英伟达和AI云服务商的业绩,同时也对有效降低模型算力需求的“路由”功能提出了更高的要求。
Sam Altman 反复强调“2025 年底上线的GPU 超过 100 万片”的目标,且把长远愿景瞄准“一亿 GPU 量级”。这类表态从侧面说明:即便推理单价在下降,更复杂的任务与更高的调用量让大模型的“总账单”并不会自动下降——必须靠路由把昂贵的推理时段“留给更需要的人”。
如果从大模型的第一性原理出发,所有大模型公司追求的最终极标准,就是不断提升“算力兑换智力”的效率。而高效调度“深度思考”的能力,在推理大模型时代,这在某种程度上决定了大模型公司能否在系统和商业效率以及用户体验上领先全行业。
   


扫描二维码推送至手机访问。

版权声明:本文由杏彩体育-专注全球体育资讯发布,如需转载请注明出处。

本文链接:http://www.redirected.net/?id=15285

分享给朋友:

“OpenAI强推路由,为何成了GPT-5最大败笔?” 的相关文章

欧预赛足球比分:法国1-1平土耳其,格子助攻吉鲁头槌

欧预赛足球比分:法国1-1平土耳其,格子助攻吉鲁头槌

北京时间10月15日凌晨2:45,欧预赛小组赛H组一场重头戏拉开帷幕,法国坐镇法兰西体育场迎战土耳其,这场比赛可谓是这个小组的头名之争。上半场比赛,格里兹曼在第17分钟错失单刀,西索科随后的补射也被居诺克扑出。下...

目前足球世界排名最低的五大欧洲球队

目前足球世界排名最低的五大欧洲球队

欧洲是现代足球的发源地,亦是现代职业足球的竞技中心,无论是国家队代表队的整体平均水准,还是欧洲职业联赛的商业化程度和竞技平均水准在世界范围里都称得上最具代表性的大洲。 只不过,足球再发达的大洲内都会存在发展不平衡的情况,而欧洲内部本身也是有比较多地域面积小、人口小的迷你国家的,他们...

2022卡塔尔世界杯解析(附带赛程图)

2022卡塔尔世界杯解析(附带赛程图)

图片2022年卡塔尔世界杯的抽签仪式在4月2日凌晨落下帷幕,32支参赛球队被分至8个小组。 由于抽签的不确定性,世界杯分组历来都会给球迷带来诸多的话题和讨论,不过相比于往届,这届世界杯反倒少了一些真正意义上的死亡之组。 各大强队均有较为理想的出线形势,反倒是亚洲球队将遭致诸...

足球的尽头是芯片?悄然改变世界杯的竟是物联网

足球的尽头是芯片?悄然改变世界杯的竟是物联网

记者 石恩泽 深圳报道 2200亿美元的史上“最贵”世界杯已经正式打响。东道主卡塔尔对阵厄瓜多尔的揭幕战刚刚开始3分钟,第一个争议判罚就出现了。一只脚形成的越位,科技最终证明了判罚...

老彩民关于竞彩⚽的一些经验分享

购彩13年,起起落落,总结了一些方法,分享出来,和各位球友交流交流。 那么,购彩之前需要做点什么工作呢? 一:看比赛双方的排名、阵容、状态等 1.上周各队战绩。了解每支球队的动态,首先需要从球队最近一轮的比赛入手。从每支球队前一轮比赛的比分、比赛过程中了解球队...

原创
            周三竞彩足球,欧冠:巴塞罗那VS国际米兰

原创 周三竞彩足球,欧冠:巴塞罗那VS国际米兰

原标题:周三竞彩足球,欧冠:巴塞罗那VS国际米兰 欧冠:巴塞罗那VS国际米兰 比赛时间:2022-10-13星期四03:00 赛事分析: 欧冠小组赛第四轮赛事,巴塞罗那除了击败弱旅皮尔森外,其余2场对阵拜仁与国米全部落败,1胜2负暂时第三位。国际...