游侠网云服务,免实名免备案服务器 游侠云域名,免实名免备案域名

统一声明:

1.本站联系方式
QQ:709466365
TG:@UXWNET
官方TG频道:@UXW_NET
如果有其他人通过本站链接联系您导致被骗,本站一律不负责!

2.需要付费搭建请联系站长QQ:709466365 TG:@UXWNET
3.免实名域名注册购买- 游侠云域名
4.免实名国外服务器购买- 游侠网云服务

大多数 AI agent 框架都有一个硬性上限:人类设计改进循环,agent 在其中运行。Meta Research 刚刚发布了一个没有这个限制的框架。

HyperAgents AI

HyperAgents 在 GitHub 上以 Creative Commons 非商业许可发布,是一个构建 AI agent 的框架,这些 agent 不仅可以重写任务解决代码,还可以重写管理如何改进的代码。研究团队来自 Meta 的 FAIR 实验室、Meta Superintelligence Labs、英属哥伦比亚大学和纽约大学,称之为”元认知自我修改”。简单来说:决定如何变得更好的系统本身可以变得更好。

循环如何工作

传统的自改进 AI 有两部分:解决任务的任务 agent 和调整任务 agent 的元 agent。但没有人能清楚回答的问题是”谁来改进元 agent?”Meta 之前的 Darwin Godel Machine 等系统保持元级过程固定,由研究人员手写。

HyperAgents 将两者合并为一个可编辑的 Python 程序。agent 修改自己的源代码,针对基准测试新版本,并将成功变体保存在档案中。元 agent 是它修改的代码库的一部分,所以随着时间的推移,改进策略本身会进化。

支持 agent 的底层 LLM 是 Claude 和 GPT-4o,权重冻结。agent 不是微调(调整模型的内部参数),而是重写协调如何使用这些模型的 Python 代码。

基准数据

在多种编程语言编码基准测试中,HyperAgents 从 14% 的通过率提高到训练任务的 34%,从 8.4% 提高到保留测试问题的 26.7%——仅通过自我修改就提高了约 3 倍。在 AI 论文审查任务中,它达到了 71% 的准确率,超过了 AI-Scientist-v2 系统的 63%。在模拟机器人技术中,agent 自主发现了原始编程中没有的复杂行为,如跳跃。

更有趣的结果是跨领域迁移。在一个任务类型上训练的 agent 在完全新的领域实现了可衡量的改进,而具有固定元过程的 agent 在相同迁移测试中得分约为零。自我改进的元策略可以泛化。

未经编程而出现的功能

agent 独立开发了持久内存系统、性能跟踪、提示模板和计算感知探索策略。没有人告诉它们构建这些东西。它们出现是因为 agent 有自由修改自己的基础设施代码。

实际现实

这是一个研究框架,不是产品。它需要 Docker、OpenAI、Anthropic 和 Google 的 API 密钥,最好在沙盒环境中运行——这是有原因的,系统执行模型生成的代码。团队自己的安全警告指出,生成的代码”可能仍然会破坏性行为,因为模型能力或对齐的限制”。

CC BY-NC-SA 许可意味着商业使用需要单独的协议。在第一周约有 1,000 个 GitHub stars,它吸引了研究者的关注,但这不是你能够直接投入生产工作流的东西。

不过,核心发现很重要:一个可以改进如何改进的 AI 系统显示出固定策略系统无法匹配的复合收益。这就是让下一代 AI 编码助手和研究工具比仅靠提示工程更有意义的结果。


📰 来源:AI Productivity

🔗 原文链接:https://aiproductivity.ai/news/meta-open-sources-hyperagents-self-improving-ai-agents/