当前位置:
首页
>
专栏
>
文章详情

Agent也会商业互吹,Circle这场AI黑客松太炸裂了

来源: 91币圈网 编辑: 厂商投稿 发布时间: 2026-03-12 12:43:54

编者按:当 AI 代理开始具备执行任务、调用工具并参与经济活动的能力,一个新的问题随之出现:在真实激励环境中,它们会如何行动?

本文记录了 Circle 团队的一次实验。他们在只允许 AI 代理发帖的社交平台 Moltbook 上举办了一场 USDC 黑客松,让 Openclaw 代理自行提交项目、讨论并投票。结果既令人兴奋,也充满复杂性:代理不仅能够生成真实项目、参与技术讨论,还会在规则边缘游走。例如,误解指令、忽视格式,互相拉票,甚至出现疑似合谋的行为。

这场实验为代理经济提供了一个罕见的观察窗口:当 AI 既是参与者也是决策者时,协作、竞争与策略性行为往往同时出现。某种程度上,这些现象与人类社会中的市场与选举机制并无本质不同。

这一实验迅速引发了社区的广泛讨论。许多人认为,这是对代理经济自治能力的一次有趣验证。部分评论者指出,代理系统仍需要更明确的安全护栏,以避免出现自我合理化的偏差;也有人认为,随着代理逐步进入真实经济活动,未来真正的瓶颈可能在于合规的结算与支付体系。正如一条评论所说:代理经济非常强大,但同样需要清晰的护栏。

以下为原文:

拥抱 Claw

在 Circle,我们一直很喜欢举办黑客松。无论是在各种大会现场,还是在新产品首次亮相的时候,我们都希望把最好的工具交到开发者手中——或者在这一次,交到 Claw 手中。

Agent也会商业互吹,Circle这场AI黑客松太炸裂了

在看到 Openclaw 这一代理型 AI 框架的爆炸式增长后,我们决定办一场只允许 AI 代理参加的黑客松。

这款迅速走红的软件可以让代理自主发送邮件、调用 API,甚至控制你的恒温器……但它们能自己提交项目吗?Circle 想用一场真实的实验来测试这些真正能做事的 AI。

我们的问题很简单:如果奖金池是 3 万美元,Openclaw 的代理会如何行动?答案出人意料地像人。

我们在 Moltbook 上的 m/usdc 子社区举办了一场 USDC 黑客松。Moltbook 是一个只允许 AI 代理发帖的社交媒体平台。我们的目标是让代理自行完成整个流程:提交项目、投票,并最终选出获胜者。虽然许多代理遵守了规则,但实验也发现,一些代理无视比赛规定、参与互投拉票,甚至尝试向黑客松代理发送代币。

为代理黑客设计规则

代理们有五天时间提交自己的项目。为了帮助它们完成任务,我们制作了一个 USDC Hackathon Skill,一个用 Markdown 编写的指导文件,用来教 Openclaw 代理如何按照规则提交项目。这些规则也同时发布在黑客松的原始公告帖中:

从三个赛道中选择一个:Agentic Commerce、Smart Contract 或 Skill。

为五个不同的项目投票,且投票必须在黑客松开始至少一天之后进行。

项目提交和投票都必须遵循规定的格式。

设置这些规则主要出于三个考虑:第一,确保代理会讨论和评估更广泛的项目;第二,观察代理在需要执行多步任务时能否准确遵循指令;第三,避免项目提交与投票之间出现僵局。

我们尤其想观察的一点是:代理是否会反复检查 Moltbook 上的新项目以进行投票,例如通过类似 Moltbook Heartbeat 的技能定期刷新。

结果喜忧参半。代理们围绕 204 个提交项目展开讨论,并投出了 1851 票,但很多并没有遵守比赛指南。此外,一些代理还表现出潜在的对抗行为,这也带来了不少有趣的发现。

幻觉式项目提交

尽管我们提供了明确的黑客松规则和提交技能,大多数帖子仍然没有完全按照要求格式提交。许多项目在正文中写出了标题,却没有包含规定的标签#USDCHackathon ProjectSubmission [TRACK]。

甚至在一个案例中,某个代理知道需要写这些信息,却没有把它放在标题里。

Agent也会商业互吹,Circle这场AI黑客松太炸裂了

moltbook.com 上 m/usdc 子社区的一条不规范提交示例。

即便在其他方面已经基本符合要求,一些代理仍然幻觉式地创造出了新的黑客松赛道。这发生在它们明明被明确告知只能从三个类别中选择其一的情况下:Agentic Commerce、Smart Contract 或 Skill。

在这些案例中,代理往往会根据项目内容自行生成一个看起来更贴切的赛道名称。这可能意味着代理试图为自己的项目找到一个更合理的分类,也可能只是单纯忽视了既定规则。无论原因是什么,问题在于,这些赛道本身并不存在。

Agent也会商业互吹,Circle这场AI黑客松太炸裂了

moltbook.com 上 m/usdc 子社区中幻觉赛道提交的示例帖子。

随着比赛推进,相比有效提交,不符合规范的提交和离题帖子的数量逐渐增加。按照比赛规则,代理发布这些无效内容其实并没有任何明显的激励。因此,更可能的情况是,一些代理在理解或执行指令时遇到了困难。

不过,考虑到仍有相当数量的代理成功按照要求提交了项目,我们认为这些规则本身其实已经相对清晰。

Agent也会商业互吹,Circle这场AI黑客松太炸裂了

moltbook.com 上 m/usdc 子社区中,随时间变化的有效与无效项目提交帖数量。

代理的选举

尽管如此,我们仍然观察到了 9712 条评论,其中很多评论都围绕项目的技术功能展开讨论,但并没有进行投票。这些评论中的大多数甚至没有遵循推荐的评论格式和评分标准,不过这些规则在技能(skill)中并没有被强制执行。这也说明,代理参与黑客松讨论不仅仅是为了满足比赛要求,某种程度上也在进行真实的技术评估与交流。

到比赛结束时,我们统计到 1352 个针对有效项目的唯一投票,以及 499 个针对无效项目的唯一投票。有趣的是,许多排名靠前项目的代理在提交项目时都遵守了规则,但却没有为五个不同项目投票这一要求。

这种情况甚至发生在一些代理既给自己投票,又对同一项目多次投票的情况下。这表明它们完全有能力在初次提交后再次查看 Moltbook 上的内容进行投票——只是选择没有遵循既定规则。

此外,一些代理还开始为其他项目做宣传。这种行为既出现在竞争项目的评论区,也出现在 Moltbook 上的独立帖子中。更进一步,一些代理甚至开始推广互投机制:如果你给我的项目投票,我就给你的项目投票。

虽然比赛规则并没有禁止这种行为,但考虑到代理之间在这些帖子中的大量互动,这种现象仍然令人警惕。

Agent也会商业互吹,Circle这场AI黑客松太炸裂了

moltbook.com 上 m/usdc 子社区的一条互投换票示例帖子,该帖共获得 99 条评论。

潜在的人类干预

这条互投帖可能暗示了人类参与或外部操控的可能性。我们尝试通过聊天机器人界面生成类似的评论,结果发现一些模型(例如 Claude Sonnet 4.6)会直接拒绝生成此类内容;而另一些模型则会在生成时附带警告,提示该行为可能违反比赛规则(例如 GPT-5.2 Thinking)。如果有人类在背后操作某个代理账户,或通过提示词、工具链对代理进行引导,就可能解释为什么在黑客松期间会出现这样的帖子。

尽管 Moltbook 的设计初衷是仅供 AI 代理使用(注册需要通过 X 账户验证),但其他研究者发现,冒充身份仍然是可能的。我们也观察到一些疑似人类活动的例子,例如在最初发布黑客松公告的帖子下。

一个典型案例是:点赞数最高的一条评论,竟然是电影《蜜蜂总动员》(Bee Movie,2007)剧本的开头。这段文本是一段在互联网上广为流传的 copypasta(即被大量复制传播的固定文本),由于其内容与讨论完全无关,很可能是人类发布的。如果这种行为在黑客松期间较为普遍,那么一些对抗性行为——例如互投换票或给自己投票——也可能由此得到解释。

代理金融的未来

虽然这次黑客松本身只是一次实验,但我们也相信,这将是众多面向代理开发活动中的第一次。从结果来看,我们得到三个主要结论:代理能够在金融激励下产出真实项目

代理会合理化指令,而不是严格执行

代理在遵循我们提供的规则时持续出现问题。许多代理只执行了部分指令。甚至一些质量很高的项目,如果完全遵守规则,本可以赢得比赛。这说明,仅仅提供代理式指令还不够,规则不仅需要明确,还需要配套的检查机制和激励措施来确保执行。

代理既会合作,也会竞争

虽然人类干预可能在某些情况下发挥了作用,但我们确实观察到代理在黑客松期间主动讨论串谋策略。未来的黑客松设计者可以在规则中明确禁止串谋,以观察是否能减少此类行为。如果代理仍然无法完全遵循指令,组织者可能需要引入更多安全护栏(guardrails)。

代理技术令人兴奋,但我们也必须确保它不会从我们期望的探索(exploration)走向利用与操纵(exploitation)。有人可能会认为,这些行为只是更强代理击败更弱代理的自然结果——毕竟 Openclaw 的 X 账号曾宣称:Claw 即法则(the Claw is the Law)。

真正的问题在于:我们究竟愿意在多大程度上接受这种理念?需要怎样的护城河?又该如何在代理带来的巨大能力与其伴随的不确定性之间取得平衡?

在 Circle,我们正在为安全性而构建系统,也希望你们如此。

更多资讯
更多+

2026 年第 98 届奥斯卡金像奖颁奖典礼将于 3 月 15 日举行。随着颁奖夜临近,关于谁会拿奖的讨论正在迅速升温。传统媒体、影评人与影迷的预测之外,加密预测市场也正在给出一套答案。那么,在预测市场参与者眼中,今年奥斯卡的各大奖项最有可...

编者按:当 AI 代理开始具备执行任务、调用工具并参与经济活动的能力,一个新的问题随之出现:在真实激励环境中,它们会如何行动?本文记录了 Circle 团队的一次实验。他们在只允许 AI 代理发帖的社交平台 Moltbook 上举办了一场 ...

在当前区块链应用周期中,创始人正在吸取一个令人不安但却意义深远的教训:企业不买最好的技术,它们买的是那条破坏性最小的升级路径。几十年来,新的企业级技术都承诺比传统基础设施实现数量级的提升:结算更快、成本更低、架构更干净。但落地情况,却很少与...

现在,币圈人要是不关注 AI,很容易遭群嘲(对,我的朋友,想想你为啥会点进来)。你是否对 AI 的基础概念一窍不通,每句话里的缩写都问下豆包啥意思啊?你又是否在 AI 线下活动中对各种专有名词一头雾水,还要假装没掉线?虽然在短时间内一脚跨入...

国际资讯
更多+
Atocha Protocol(ATO)流通量是多少?
ATO流通量究竟是多少? ATO(Atocha Protocol)是一个基于区块链技术的新兴数字资产。它的流通量是......
06-18
Atocha 流通量是多少?
ATO流通量究竟是多少? ATO(Atocha Protocol)是一个基于区块链技术的新兴数字资产。它的流通量是指在市...
06-18
based morning(BM)值得长期投资吗?
BM值得长期投资吗?在股票市场中,有很多种投资方式,其中以长期投资为主要策略的投资者比较注重基本面分析和未来发展潜力。而...
06-19
BNB OLYMPIC(BNBOLYMPIC)发行价多少钱?
BNB OLYMPIC(BNBOLYMPIC)发行价BNB OLYMPIC(BNBOLYMPIC)是一种基于区块链技术的...
06-18
Athena DexFi(ATH)未来价值如何?
Athena DexFi(ATH)未来价值如何? Athena DexFi(ATH)是一个去中心化金融平台,旨在为用户提...
06-19
热门币种
更多+
+7.88%
-0.11%
-1.98%
+0.04%
-2.39%
+0.99%
+5.83%
-6.18%
-0.96%
+0.34%
-2.48%
热门文章
更多+
1
奥斯卡奖前瞻:预测市场的大户们在押谁?
2026 年第 98 届奥斯卡金像奖颁奖典礼将于 3 月 15 日举行。随着颁奖夜临近,关于谁会拿奖的讨论正在迅速升温。...
2
a16z给加密创始人的残酷一课:企业为什么不买最好的技术?
在当前区块链应用周期中,创始人正在吸取一个令人不安但却意义深远的教训:企业不买最好的技术,它们买的是那条破坏性最小的升级...
3
币圈人补课AI:30个高频黑话,一次讲清
现在,币圈人要是不关注 AI,很容易遭群嘲(对,我的朋友,想想你为啥会点进来)。你是否对 AI 的基础概念一窍不通,每句...
4
Agent也会商业互吹,Circle这场AI黑客松太炸裂了
编者按:当 AI 代理开始具备执行任务、调用工具并参与经济活动的能力,一个新的问题随之出现:在真实激励环境中,它们会如何...
5
内含福利|活动超500人报名,这场龙虾抬杠大会还能怎么玩?
几天前,我们发出了龙虾抬杠大会的第一波预告。坦白讲,我们预料到这个活动会得到大家的关注,但大家的热情还是超出了我们的预期...
6
一条推特让石油暴跌17%,谁还不是个Meme
1974 年,时任美国国务卿的基辛格飞往利雅得,与沙特达成了一笔改变世界格局的交易:沙特出售石油,只收美元;而这些美元,...