養龍蝦不用傾家蕩產：OpenClaw 模型選擇與成本控制實戰指南

openclaw-lobster-cover

上個月我的 API 帳單跳出來的瞬間，我整個人是愣住的。

不是那種「哦好像有點多」的驚訝，是那種「我是不是不小心把 key 洩漏了被人刷爆」的恐慌。然後我仔細看了一下用量明細——沒有，全部都是我自己用的。就是日常寫 code、debug、重構，正常的開發節奏。但一天下來，光 API 費用就逼近 10 美金。

一個月三百美金，只為了讓 AI 幫我寫程式。

這就是我開始認真研究 OpenClaw 模型選擇的起點。

為什麼你需要在意 OpenClaw 用哪個模型

先講個背景。OpenClaw 截至今天已經累積超過 20 萬顆 GitHub stars，是目前最熱門的開源 AI 助手專案。它最核心的價值很簡單：你可以自己選模型。

Claude Code 只能用 Anthropic 的 API，一天重度使用下來大概 3 到 7 美金，如果你是那種把 AI 當 pair programming partner 整天掛著的人，月底帳單輕鬆破百美金。而 OpenClaw 讓你接任何 LLM provider——從 Google 到 xAI 到 MiniMax，選擇權在你手上。

但選擇多了反而更焦慮。到底哪個模型的 CP 值最高？哪個看起來便宜實際上是個坑？

而且在你開始挑模型之前，有一件事必須先講清楚——

先別急：OAuth 與 Google 服務的封號地雷

這段我放在最前面講，因為比省錢更重要的是不要把帳號搞丟。

OpenClaw 社群裡三不五時就有人哀嚎帳號被封。原因通常集中在兩個地方：

Claude Code OAuth 轉接的風險。 有些人想省事，透過 Claude Code 的 OAuth token 來讓 OpenClaw 存取 Anthropic API。這個操作在技術上可行，但 Anthropic 的 ToS 明確不允許第三方工具使用 OAuth token 做非官方用途。一旦被偵測到異常的 API 呼叫模式——比如 token 來自 Claude Code OAuth 但行為明顯是 agent 在跑——帳號可能直接被停權，連帶你的 Claude Pro/Max 訂閱都會受影響。

Google 系模型的灰色地帶。 Gemini API 的免費額度和低價方案，Google 對於「自動化大量呼叫」的容忍度比你想像的低。特別是如果你透過 Google AI Studio 的 API key 來接 OpenClaw，跑起來一整天不停歇，Google 有可能判定你違反公平使用政策。輕則限速，重則直接停用你的 Google Cloud 帳號——這可不只是 Gemini API 的事，你的 Gmail、Google Drive、整個 Google 生態系都綁在上面。

我的建議很簡單：用官方 API key，走正規付費管道，別貪小便宜。 MiniMax、xAI、Moonshot 這些獨立 provider 的 API 就是專門給開發者用的，不存在這種灰色地帶問題。你花的每一分錢都是明碼標價，不用提心吊膽哪天醒來發現帳號沒了。

我花了兩週時間，把市面上五個主流模型都接上 OpenClaw 跑了一輪真實開發場景。以下是我的血淚報告。

openclaw-model-cost-compare

五大模型實測成本：誰在燒你的錢

先上結論表格，後面再逐一拆解。

模型	Input 費用 ($/1M tokens)	Output 費用 ($/1M tokens)	實測每日成本	體感評價
MiniMax M2.5	$0.30	$1.20	_$0.50-1.50	省到哭，能力不打折
Gemini 2.5 Flash	$0.30	$2.50	$1.00-2.50	均衡之選，穩定可靠
Grok 4.1 Fast	$0.20	$0.50	_$3.00-5.00	看似便宜，tool call 是坑
Kimi K2.5	$0.60	$2.50	$2.00-4.00	thinking 模式吃 token
GPT-5.2	$1.75	$14.00	~$5.00-10.00+	品質頂尖，低頻使用

接下來一個一個講我踩過的坑。

GPT-5.2：品質無話說，但請低頻使用

這裡要特別強調一點——建議選 GPT-5.2 而不是 Codex 系列的 coder 模型。為什麼？因為 Codex coder 模型雖然是專門為程式碼優化的，但它在 OpenClaw 這種 agentic 場景下的 tool calling 和多輪對話表現反而不如通用的 GPT-5.2。GPT-5.2 作為 OpenAI 的旗艦模型，指令遵循能力更強，處理複雜 agent workflow 更穩定。

定價是 $1.75/M input、$14.00/M output。沒錯，output 每百萬 token 要 14 美金——這是 MiniMax M2.5 的 將近 12 倍。

OpenClaw 的 agentic workflow 是高度迭代的。它不是問一個問題就結束，而是會不斷 tool call、讀檔案、修改、再驗證，一個任務跑下來可能經歷十幾輪 LLM 呼叫。每一輪都把之前的 context 全部送進去，token 用量像滾雪球一樣膨脹。更要命的是，GPT-5.2 有 Thinking 模式，內部推理 token 也是按 output 價格計費——你看不到這些 token，但帳單上看得到。

我實測一個下午重構一個中等複雜度的 TypeScript 模組，GPT-5.2 吃掉了將近 8 美金。一天正常開發下來，10 美金起跳。

話說回來，GPT-5.2 不是不能用——關鍵在於使用頻率。如果你不是每天都掛著 OpenClaw 寫 code，而是一週只用個兩三次、每次處理一個特定的高難度任務，GPT-5.2 的品質確實是頂級的。它的推理深度、程式碼品質、對複雜需求的理解力都是目前最好的一檔。偶爾用一下，帳單不會太誇張。但如果你是那種整天開著 AI pair programming 的重度用戶？天天餵 GPT-5.2 就是在幫 OpenAI 燒錢。

簡單記一個原則：低頻用 GPT-5.2 享受頂級品質，高頻日常開發用 M2.5 控制成本。

Grok 4.1 Fast：token 便宜但 tool call 要你命

Grok 4.1 Fast 的 token 定價看起來超級甜——$0.20/M input、$0.50/M output，這不是白菜價嗎？

才怪。

xAI 的 tool invocation 是另外收費的。每 1,000 次 tool call 收 $2.50 到 $5.00，取決於 tool 類型。而 OpenClaw 是什麼？是一個 重度依賴 tool call 的 agent。讀檔案是 tool call，寫檔案是 tool call，跑指令是 tool call，搜尋是 tool call。一個稍微複雜的任務跑下來，光 tool call 就可能幾百次。

所以實際用下來，一天大概 5 美金，跟 token 價格給你的預期完全不同。這是我踩過最深的坑——看定價表以為撿到寶，結果帳單出來才知道自己是大怨種。

2M 的 context window 確實是業界最大，處理大型 codebase 很方便。但如果你的使用場景不需要一次塞這麼多 context，這個優勢就沒那麼關鍵了。

Kimi K2.5：兩輪深度對話 12 塊人民幣的真相

openclaw-bill-shock

Moonshot AI 的 Kimi K2.5 定價是 $0.60/M input、$2.50/M output，比 MiniMax 貴一點但也不算離譜。問題出在它的 thinking mode。

K2.5 是一個 1 兆參數的 MoE 模型，原生支援 thinking 模式。當你用 OpenClaw 讓它處理複雜任務時，它會在回覆前先跑一大段內部推理，這些 thinking tokens 全部算在 output 裡面。一個需要深度分析的任務，thinking tokens 可能比實際回覆還多好幾倍。

我做過一次測試：讓 K2.5 分析一個 React 元件的效能問題並提供重構方案。兩輪對話下來，output tokens 爆到 15 萬。算一下大概 12 塊人民幣。

兩輪對話，12 塊。

K2.5 的能力毫無疑問是頂級的，SWE-Bench 表現直追 Opus 級別。但如果你打算拿它當日常的 coding companion，荷包會哭。

比較適合的用法是：平時用便宜模型處理日常任務，遇到真正棘手的架構問題時才切到 K2.5 放大招。

Gemini 2.5 Flash：什麼都不極端的平衡之選

Google 的 Gemini 2.5 Flash 定價 $0.30/M input、$2.50/M output，1M token 的 context window。

說實話，寫到 Gemini 我反而沒什麼戲劇性的故事可以講。它就是⋯⋯穩。token 價格合理，速度夠快，能力也到位。沒有 Grok 那種 tool call 的隱藏費用，也沒有 Kimi 那種 thinking token 的爆量問題。

每日成本大概 1 到 2.5 美金，取決於你的使用強度。一個月下來 30 到 75 美金，對於專業開發者來說是可以接受的範圍。

如果你懶得折騰、不想踩坑、就想要一個用起來不會太心痛的選項，Gemini 2.5 Flash 是安全牌。

但安全牌不是最佳牌。

MiniMax M2.5：養龍蝦的終極答案

終於講到主角了。

MiniMax M2.5 的定價是 $0.30/M input、$1.20/M output。沒有隱藏費用，沒有 tool call 額外收費，就是這麼直白。

讓我把這個數字放進脈絡裡：它的 output 費用是 Claude Opus 4.6 的 1/21，是 GPT-5.2 的 1/12，甚至比 Gemini 2.5 Flash 還便宜一半。

但便宜不代表弱。MiniMax M2.5 在 SWE-Bench Verified 拿到 80.2%，Multi-SWE-Bench 51.3% 排名第一。這是什麼概念？這是跟 Claude Opus 系列同一個級別的 coding 能力，但成本只有人家的零頭。

我實測了一整天的正常開發——寫新功能、修 bug、重構、寫測試——總共花了不到 1.5 美金。

一天 1.5 美金養一隻能力 Opus 級別的龍蝦。

這就是為什麼我說 MiniMax M2.5 是養龍蝦的終極答案。

怎麼設定 OpenClaw 使用 MiniMax M2.5

講了這麼多，來點實際的。根據 OpenClaw 官方文件，設定 MiniMax 只需要幾步：

# 方法一：互動式設定（推薦）
openclaw configure

# 選擇 MiniMax 作為 provider
# 輸入你的 MiniMax API key

或者直接改設定檔：

{
  "provider": "minimax",
  "model": "minimax-m2.5",
  "apiKey": "${MINIMAX_API_KEY}"
}

如果你想要更快的回應速度，可以選 M2.5-Lightning 版本（100 tokens/s），但 output 費用會翻倍到 $2.40/M。我個人覺得標準版的 50 tokens/s 已經夠用了，省下來的錢更實在。

也可以搭配 Ollama 本地部署做離線使用，但那是另一個話題了。

場景化模型搭配：省錢的最高境界

openclaw-smart-lobster

真正會養龍蝦的人，不會只用一個模型。OpenClaw 支援動態切換 provider，善用這個功能可以把成本壓到最低：

使用場景	推薦模型	原因
日常高頻 coding / debug	MiniMax M2.5	CP 值之王，整天開著也不心疼
快速原型 / 簡單任務	Gemini 2.5 Flash	穩定快速，但注意 Google 帳號風險
低頻精準任務	GPT-5.2	偶爾用品質頂尖，天天用會破產
大型 codebase 分析	Grok 4.1 Fast	2M context window 的優勢
架構設計 / 困難問題	Kimi K2.5	thinking 模式的深度推理值得付費

封號風險提醒： 透過 Claude Code OAuth 間接存取或使用 Google 免費/低價額度大量跑 OpenClaw，都有帳號被停權的風險。建議一律使用獨立 API provider（MiniMax、xAI、Moonshot）的正規付費 key。

我自己的日常配置是 80% MiniMax M2.5 + 15% Gemini 2.5 Flash + 5% Kimi K2.5。一個月下來大概 40-60 美金，比起純用 Claude Code API 的 100-200 美金，省了至少一半。

幾個省錢的實戰技巧

最後分享幾個我摸索出來的省錢心得：

善用 prompt caching。 大部分 provider 都支援 prompt caching，重複的 system prompt 和 context 不需要每次都算錢。MiniMax 和 Grok 都有自動 caching 機制，但你的 system prompt 越穩定，cache 命中率越高。

控制 context 長度。 OpenClaw 預設會把很多歷史訊息塞進 context，但你可以在設定裡調低 maxContextTokens。大部分日常任務根本不需要 100K 的 context，把它壓到 30-50K 可以顯著降低每次 API call 的成本。

區分任務等級。 不是每個任務都值得用最強的模型。寫一個簡單的 utility function，用 MiniMax M2.5 綽綽有餘。只有遇到跨模組的複雜重構或架構決策，才需要切到 K2.5 這種重砲。

設定每日預算上限。 OpenClaw 支援設定 spending limit，建議設在 3-5 美金。超過就停下來，強迫自己用更高效的方式跟 AI 溝通，而不是無腦丟 context。

遠離灰色操作。 不要用 Claude Code OAuth token 轉接、不要拿 Google AI Studio 的免費額度當主力。省下來的那點錢，跟帳號被封的風險比起來根本不值得。用獨立 provider 的 API key 最安心——MiniMax 本身就夠便宜了，沒必要為了再省幾毛錢去冒險。

養龍蝦的正確姿勢

回到最開頭的問題——AI 輔助開發到底值不值得花錢？

答案是：值得，但你得選對飼料。

OpenClaw 給了你選擇的自由，而 MiniMax M2.5 是目前這個時間點上，CP 值最高的選擇。Opus 級別的 coding 能力，1/20 的價格。一天不到 2 美金，就能有一個隨時待命的 AI pair programmer。

養龍蝦不用傾家蕩產。選對模型，你的龍蝦一樣能長得又大又壯。

延伸閱讀：

本文最初發布於 HackMD @BASHCAT。

搜尋此網誌

BASHCAT