游侠网云服务,免实名免备案服务器 游侠云域名,免实名免备案域名

统一声明:

1.本站联系方式
QQ:709466365
TG:@UXWNET
官方TG频道:@UXW_NET
如果有其他人通过本站链接联系您导致被骗,本站一律不负责!

2.需要付费搭建请联系站长QQ:709466365 TG:@UXWNET
3.免实名域名注册购买- 游侠云域名
4.免实名国外服务器购买- 游侠网云服务

据外媒 Business Insider 报道,Anthropic 在私募二级市场的估值已突破 1 万亿美元。作为参照,OpenAI 今年 3 月末最新一轮融资的估值,仍停留在 8520 亿美元。

除了业内老生常谈的「AI 泡沫论」,这组对比数据也表明了曾经稳坐头把交椅的 OpenAI,如今正在直面被追赶、被超越的压力,但没有让我们等待多久,OpenAI 的反击旋即而至。

就在刚刚,GPT-5.5 正式发布,同步亮相的还有面向更高阶任务的 GPT-5.5 Pro 版本。

如果用一句话总结 GPT-5.5 的核心设计思路,那就是让用户把一团杂乱、多步骤的复杂任务直接抛给模型,由它自主规划路径、调用工具、校验结果、消解歧义,并一路推进。

看似只是 0.1 的版本号迭代,在推理效率上却判若大版本更新—— 同样的 Codex 任务,GPT-5.5 消耗的 token 显著更少,既更聪明,也更省。

▲吐槽了一个多月,偏偏等到 GPT-5.5 发布,Anthropic 才想起要解决降智问题

在知名第三方评测机构 Artificial Analysis 的综合智能指数榜单上,OpenAI 凭借 GPT-5.5 系列拿下了第一名和第二名,前六席中包揽了四席,竞争对手几乎毫无招架之力。

基准测试结果显示,在 Terminal-Bench 2.0(测试复杂命令行工作流)上,GPT-5.5 达到 82.7%,GPT-5.4 为 75.1%,Claude Opus 4.7 为 69.4%。

在 SWE-Bench Pro(评估真实 GitHub 问题解决能力)上,GPT-5.5 达到 58.6%,能在单次运行中端到端完成更多任务,超过 GPT-5.4 的 57.7%。

在 OpenAI 内部的 Expert-SWE 评测上,任务的人类预计完成时间中位数为 20 小时,GPT-5.5 达到 73.1%,GPT-5.4 为 68.5%。且在三项评测上,GPT-5.5 均以更少 token 完成任务。


📌 本文来源:finance.sina.com.cn
🔗 原文链接:点击查看原文全文