跳至主要內容
EMil Wu
EN
返回新聞列表

每小時 8 美分,Anthropic 要幫你養 Agent 了

5 分鐘閱讀
每小時 8 美分,Anthropic 要幫你養 Agent 了

前幾天在看 Anthropic 的 API 文件時,突然發現左側選單多了一整個新區塊:「Managed Agents」。

點進去一看,不是又一個 prompt 管理工具,也不是什麼新的 SDK wrapper,而是一整套託管式的 Agent 執行基礎設施。你定義 Agent 的腦袋,他們負責 Agent 的手腳——沙箱、狀態、安全、擴展,全包。

“Pre-built, configurable agent harness that runs in managed infrastructure.”

我第一個反應是:這不就是 Agent 版的 Heroku 嗎?

你以前要自己搭什麼?

如果你曾經試過把一個 AI Agent 從 prototype 推到 production,你大概知道那個痛。模型呼叫本身只是冰山一角,真正吃掉你時間的是:

  • 沙箱環境:Agent 要跑程式碼,你得給他一個安全的容器
  • 狀態管理:Agent 跑到一半斷了,怎麼從斷點恢復?
  • 憑證安全:Agent 需要存取外部服務,API key 放哪裡才不會被 Agent 自己寫的程式碼偷走?
  • 觀測與追蹤:Agent 做了什麼?為什麼做?花了多久?
  • 擴展:一個 Agent 能跑,一百個同時跑呢?

這些東西加起來,一個原本兩週能做完的 Agent prototype,經常要花好幾個月才真正上線。對吧?

Claude Managed Agents 要解決的就是這整層。

四個核心概念

Anthropic 把 Managed Agents 拆成四個概念:

概念你負責的Anthropic 負責的
Agent模型、system prompt、tools、MCP servers
Environment指定要裝什麼套件、網路規則容器建立、隔離、安全
Session送出任務、接收結果執行迴圈、狀態持久化、錯誤恢復
Events發送 user turns、處理回應SSE 串流、事件歷史保存

建好 Agent 定義後,你用 API 開一個 Session,送出訊息,Claude 就會在雲端容器裡自主執行——跑 Bash、讀寫檔案、搜尋網頁、呼叫 MCP servers——然後透過 Server-Sent Events 把結果串流回來。你甚至可以在 Agent 執行到一半的時候送新指令去引導他,或者直接中斷。

「腦手分離」——OS 級的架構思維

這是我覺得最值得看的部分。Anthropic 工程團隊同步發了一篇技術文章〈Scaling Managed Agents: Decoupling the brain from the hands〉,解釋他們的架構哲學。

傳統做法是把 Agent 的推理引擎(brain)和執行環境(hands)放在同一個容器裡,但這會造成:容器掛了,整個 Agent 狀態就沒了;容器啟動慢,Agent 就得等;容器資源互相搶,擴展就是惡夢。

Managed Agents 的做法是把三個元件徹底解耦:

  1. Session:一個 append-only 的事件日誌,記錄 Agent 做過的所有事。獨立於容器存在。
  2. Harness:呼叫 Claude、路由 tool calls 的控制迴圈。無狀態,可水平擴展。
  3. Sandbox:Agent 跑程式碼的容器。變成「cattle」——壞了就換一個,透過 provision({resources}) 按需配置。

結果?p50 的 time-to-first-token 減少約 60%,p95 減少超過 90%。 Harness 掛了,用 wake(sessionId) 就能恢復;容器掛了,Session 日誌還在,換一個新容器繼續跑。

他們的原話是:「The harness doesn’t know whether the sandbox is a container, a phone, or a Pokémon emulator.」

如果你讀過我們的架構不是重點,Context 才是,會發現這裡有個有趣的呼應:Managed Agents 把 Session 當成 context window 之外的可查詢記憶庫。長時間任務超出 window 時,harness 可以透過 getEvents() 選擇性地倒回、重讀——context 管理變成基礎設施層級的事,不再是你的 prompt 工程問題。

安全設計

這點我覺得設計得很漂亮:憑證絕對不進入 sandbox。

  • Git tokens 在容器初始化時綁定,Git 操作可以用,但 Agent 寫的程式碼摸不到 token
  • OAuth 和 MCP 工具的認證放在外部 vault,透過專用 proxy 取得

也就是說,就算 Agent 寫出了惡意程式碼,他也偷不走你的 API keys。這對 production 環境來說是基本要求,但自己搭的話真的很容易忽略。

定價

項目費用
模型 token按標準 API 定價
Agent 執行時間$0.08 / session-hour(毫秒計費,閒置不計)
Web search$10 / 1,000 次搜尋

每小時 8 美分的 Agent 執行費,坦白講很便宜。如果你自己跑 EC2 或 Cloud Run 來 host agent sandbox,光是容器的費用就不止這個數字,更別提你得自己處理 orchestration、checkpointing、error recovery 那些東西。

誰已經在用了?

公司使用方式
Notion工作區內直接委派任務給 Agent
Rakuten銷售、行銷、財務的企業 Agent,整合 Slack/Teams,一週內部署完成
Asana生產力與任務自動化
Sentry除錯 Agent + 自動寫 patch + 建立 PR

Rakuten 一週內部署這個數字最有說服力——如果你知道企業內部過去導入一個 AI 功能要多久的話。

還在 Research Preview 的功能

有三個功能需要另外申請:

  • Multi-agent:Agent 可以產生其他 Agent 來處理複雜子任務
  • Outcomes:自動評估與改善回應品質(「內部測試比標準 prompting loop 提升最多 10 個百分點」)
  • Memory:跨 Session 的記憶管理

Multi-agent 那個特別有意思,它直接對應了Agent Team:當 Subagent 不夠用時討論的場景——但這次 orchestration 是 Anthropic 幫你管的。

我的觀察

或許 Managed Agents 最大的意義不在技術本身,而是它宣告了一個新品類的誕生:Agent-as-a-Service。

回想一下,Heroku 在 2007 年做的事情:你不需要自己管 server,只要 git push 就能部署。十幾年後,Managed Agents 在 Agent 層做了類似的事——你不需要自己搭 sandbox、寫 orchestration loop、處理 checkpointing,只要定義 Agent 的能力,其他交給平台。

但同樣值得注意的是限制:目前只在 Anthropic 自有基礎設施上跑,還沒有透過 AWS Bedrock 或 Google Vertex AI 提供。 這是一個戰略選擇——Anthropic 顯然想把開發者留在自己的生態系裡——但對需要多雲部署的企業來說,這是一個必須評估的鎖定風險。

而且它只支援 Claude 模型。如果你的 Agent 需要在不同場景切換 GPT 和 Claude,Managed Agents 目前無法滿足這個需求。

或許最實際的建議是:如果你正在搭建全新的 Agent 系統、團隊不大、且主要使用 Claude,Managed Agents 可以省掉大量基礎設施工程。但如果你已經有自建的 Agent 框架、或者需要模型靈活切換,暫時觀望可能是更穩的選擇。

不管你現在的決定是什麼,有一件事是確定的:Agent 從「我自己搭」走向「平台幫你管」,這條路已經正式開了。


參考資料

支持這個系列

如果這系列文章對你有幫助,考慮請我喝杯咖啡