養龍蝦不用傾家蕩產:OpenClaw 模型選擇與成本控制實戰指南
養龍蝦不用傾家蕩產:OpenClaw 模型選擇與成本控制實戰指南

上個月我的 API 帳單跳出來的瞬間,我整個人是愣住的。
不是那種「哦好像有點多」的驚訝,是那種「我是不是不小心把 key 洩漏了被人刷爆」的恐慌。然後我仔細看了一下用量明細——沒有,全部都是我自己用的。就是日常寫 code、debug、重構,正常的開發節奏。但一天下來,光 API 費用就逼近 10 美金。
一個月三百美金,只為了讓 AI 幫我寫程式。
這就是我開始認真研究 OpenClaw 模型選擇的起點。
為什麼你需要在意 OpenClaw 用哪個模型
先講個背景。OpenClaw 截至今天已經累積超過 20 萬顆 GitHub stars,是目前最熱門的開源 AI 助手專案。它最核心的價值很簡單:你可以自己選模型。
Claude Code 只能用 Anthropic 的 API,一天重度使用下來 大概 3 到 7 美金,如果你是那種把 AI 當 pair programming partner 整天掛著的人,月底帳單輕鬆破百美金。而 OpenClaw 讓你接任何 LLM provider——從 Google 到 xAI 到 MiniMax,選擇權在你手上。
但選擇多了反而更焦慮。到底哪個模型的 CP 值最高?哪個看起來便宜實際上是個坑?
而且在你開始挑模型之前,有一件事必須先講清楚——
先別急:OAuth 與 Google 服務的封號地雷
這段我放在最前面講,因為比省錢更重要的是不要把帳號搞丟。
OpenClaw 社群裡三不五時就有人哀嚎帳號被封。原因通常集中在兩個地方:
Claude Code OAuth 轉接的風險。 有些人想省事,透過 Claude Code 的 OAuth token 來讓 OpenClaw 存取 Anthropic API。這個操作在技術上可行,但 Anthropic 的 ToS 明確不允許第三方工具使用 OAuth token 做非官方用途。一旦被偵測到異常的 API 呼叫模式——比如 token 來自 Claude Code OAuth 但行為明顯是 agent 在跑——帳號可能直接被停權,連帶你的 Claude Pro/Max 訂閱都會受影響。
Google 系模型的灰色地帶。 Gemini API 的免費額度和低價方案,Google 對於「自動化大量呼叫」的容忍度比你想像的低。特別是如果你透過 Google AI Studio 的 API key 來接 OpenClaw,跑起來一整天不停歇,Google 有可能判定你違反公平使用政策。輕則限速,重則直接停用你的 Google Cloud 帳號——這可不只是 Gemini API 的事,你的 Gmail、Google Drive、整個 Google 生態系都綁在上面。
我的建議很簡單:用官方 API key,走正規付費管道,別貪小便宜。 MiniMax、xAI、Moonshot 這些獨立 provider 的 API 就是專門給開發者用的,不存在這種灰色地帶問題。你花的每一分錢都是明碼標價,不用提心吊膽哪天醒來發現帳號沒了。
我花了兩週時間,把市面上五個主流模型都接上 OpenClaw 跑了一輪真實開發場景。以下是我的血淚報告。

五大模型實測成本:誰在燒你的錢
先上結論表格,後面再逐一拆解。
| 模型 | Input 費用 ($/1M tokens) | Output 費用 ($/1M tokens) | 實測每日成本 | 體感評價 |
|---|---|---|---|---|
| MiniMax M2.5 | $0.30 | $1.20 | $0.50-1.50 | 省到哭,能力不打折 |
| Gemini 2.5 Flash | $0.30 | $2.50 | $1.00-2.50 | 均衡之選,穩定可靠 |
| Grok 4.1 Fast | $0.20 | $0.50 | $3.00-5.00 | 看似便宜,tool call 是坑 |
| Kimi K2.5 | $0.60 | $2.50 | $2.00-4.00 | thinking 模式吃 token |
| GPT-5.2 | $1.75 | $14.00 | ~$5.00-10.00+ | 品質頂尖,低頻使用 |
接下來一個一個講我踩過的坑。
GPT-5.2:品質無話說,但請低頻使用
這裡要特別強調一點——建議選 GPT-5.2 而不是 Codex 系列的 coder 模型。為什麼?因為 Codex coder 模型雖然是專門為程式碼優化的,但它在 OpenClaw 這種 agentic 場景下的 tool calling 和多輪對話表現反而不如通用的 GPT-5.2。GPT-5.2 作為 OpenAI 的旗艦模型,指令遵循能力更強,處理複雜 agent workflow 更穩定。
定價是 $1.75/M input、$14.00/M output。沒錯,output 每百萬 token 要 14 美金——這是 MiniMax M2.5 的 將近 12 倍。
OpenClaw 的 agentic workflow 是高度迭代的。它不是問一個問題就結束,而是會不斷 tool call、讀檔案、修改、再驗證,一個任務跑下來可能經歷十幾輪 LLM 呼叫。每一輪都把之前的 context 全部送進去,token 用量像滾雪球一樣膨脹。更要命的是,GPT-5.2 有 Thinking 模式,內部推理 token 也是按 output 價格計費——你看不到這些 token,但帳單上看得到。
我實測一個下午重構一個中等複雜度的 TypeScript 模組,GPT-5.2 吃掉了將近 8 美金。一天正常開發下來,10 美金起跳。
話說回來,GPT-5.2 不是不能用——關鍵在於使用頻率。如果你不是每天都掛著 OpenClaw 寫 code,而是一週只用個兩三次、每次處理一個特定的高難度任務,GPT-5.2 的品質確實是頂級的。它的推理深度、程式碼品質、對複雜需求的理解力都是目前最好的一檔。偶爾用一下,帳單不會太誇張。但如果你是那種整天開著 AI pair programming 的重度用戶?天天餵 GPT-5.2 就是在幫 OpenAI 燒錢。
簡單記一個原則:低頻用 GPT-5.2 享受頂級品質,高頻日常開發用 M2.5 控制成本。
Grok 4.1 Fast:token 便宜但 tool call 要你命
Grok 4.1 Fast 的 token 定價看起來超級甜——$0.20/M input、$0.50/M output,這不是白菜價嗎?
才怪。
xAI 的 tool invocation 是另外收費的。每 1,000 次 tool call 收 $2.50 到 $5.00,取決於 tool 類型。而 OpenClaw 是什麼?是一個 重度依賴 tool call 的 agent。讀檔案是 tool call,寫檔案是 tool call,跑指令是 tool call,搜尋是 tool call。一個稍微複雜的任務跑下來,光 tool call 就可能幾百次。
所以實際用下來,一天大概 5 美金,跟 token 價格給你的預期完全不同。這是我踩過最深的坑——看定價表以為撿到寶,結果帳單出來才知道自己是大怨種。
2M 的 context window 確實是業界最大,處理大型 codebase 很方便。但如果你的使用場景不需要一次塞這麼多 context,這個優勢就沒那麼關鍵了。
Kimi K2.5:兩輪深度對話 12 塊人民幣的真相

Moonshot AI 的 Kimi K2.5 定價是 $0.60/M input、$2.50/M output,比 MiniMax 貴一點但也不算離譜。問題出在它的 thinking mode。
K2.5 是一個 1 兆參數的 MoE 模型,原生支援 thinking 模式。當你用 OpenClaw 讓它處理複雜任務時,它會在回覆前先跑一大段內部推理,這些 thinking tokens 全部算在 output 裡面。一個需要深度分析的任務,thinking tokens 可能比實際回覆還多好幾倍。
我做過一次測試:讓 K2.5 分析一個 React 元件的效能問題並提供重構方案。兩輪對話下來,output tokens 爆到 15 萬。算一下大概 12 塊人民幣。
兩輪對話,12 塊。
K2.5 的能力毫無疑問是頂級的,SWE-Bench 表現直追 Opus 級別。但如果你打算拿它當日常的 coding companion,荷包會哭。
比較適合的用法是:平時用便宜模型處理日常任務,遇到真正棘手的架構問題時才切到 K2.5 放大招。
Gemini 2.5 Flash:什麼都不極端的平衡之選
Google 的 Gemini 2.5 Flash 定價 $0.30/M input、$2.50/M output,1M token 的 context window。
說實話,寫到 Gemini 我反而沒什麼戲劇性的故事可以講。它就是⋯⋯穩。token 價格合理,速度夠快,能力也到位。沒有 Grok 那種 tool call 的隱藏費用,也沒有 Kimi 那種 thinking token 的爆量問題。
每日成本大概 1 到 2.5 美金,取決於你的使用強度。一個月下來 30 到 75 美金,對於專業開發者來說是可以接受的範圍。
如果你懶得折騰、不想踩坑、就想要一個用起來不會太心痛的選項,Gemini 2.5 Flash 是安全牌。
但安全牌不是最佳牌。
MiniMax M2.5:養龍蝦的終極答案
終於講到主角了。
MiniMax M2.5 的定價是 $0.30/M input、$1.20/M output。沒有隱藏費用,沒有 tool call 額外收費,就是這麼直白。
讓我把這個數字放進脈絡裡:它的 output 費用是 Claude Opus 4.6 的 1/21,是 GPT-5.2 的 1/12,甚至比 Gemini 2.5 Flash 還便宜一半。
但便宜不代表弱。MiniMax M2.5 在 SWE-Bench Verified 拿到 80.2%,Multi-SWE-Bench 51.3% 排名第一。這是什麼概念?這是跟 Claude Opus 系列同一個級別的 coding 能力,但成本只有人家的零頭。
我實測了一整天的正常開發——寫新功能、修 bug、重構、寫測試——總共花了不到 1.5 美金。
一天 1.5 美金養一隻能力 Opus 級別的龍蝦。
這就是為什麼我說 MiniMax M2.5 是養龍蝦的終極答案。
怎麼設定 OpenClaw 使用 MiniMax M2.5
講了這麼多,來點實際的。根據 OpenClaw 官方文件,設定 MiniMax 只需要幾步:
# 方法一:互動式設定(推薦)
openclaw configure
# 選擇 MiniMax 作為 provider
# 輸入你的 MiniMax API key
或者直接改設定檔:
{
"provider": "minimax",
"model": "minimax-m2.5",
"apiKey": "${MINIMAX_API_KEY}"
}
如果你想要更快的回應速度,可以選 M2.5-Lightning 版本(100 tokens/s),但 output 費用會翻倍到 $2.40/M。我個人覺得標準版的 50 tokens/s 已經夠用了,省下來的錢更實在。
也可以搭配 Ollama 本地部署 做離線使用,但那是另一個話題了。
場景化模型搭配:省錢的最高境界

真正會養龍蝦的人,不會只用一個模型。OpenClaw 支援動態切換 provider,善用這個功能可以把成本壓到最低:
| 使用場景 | 推薦模型 | 原因 |
|---|---|---|
| 日常高頻 coding / debug | MiniMax M2.5 | CP 值之王,整天開著也不心疼 |
| 快速原型 / 簡單任務 | Gemini 2.5 Flash | 穩定快速,但注意 Google 帳號風險 |
| 低頻精準任務 | GPT-5.2 | 偶爾用品質頂尖,天天用會破產 |
| 大型 codebase 分析 | Grok 4.1 Fast | 2M context window 的優勢 |
| 架構設計 / 困難問題 | Kimi K2.5 | thinking 模式的深度推理值得付費 |
封號風險提醒: 透過 Claude Code OAuth 間接存取或使用 Google 免費/低價額度大量跑 OpenClaw,都有帳號被停權的風險。建議一律使用獨立 API provider(MiniMax、xAI、Moonshot)的正規付費 key。
我自己的日常配置是 80% MiniMax M2.5 + 15% Gemini 2.5 Flash + 5% Kimi K2.5。一個月下來大概 40-60 美金,比起純用 Claude Code API 的 100-200 美金,省了至少一半。
幾個省錢的實戰技巧
最後分享幾個我摸索出來的省錢心得:
善用 prompt caching。 大部分 provider 都支援 prompt caching,重複的 system prompt 和 context 不需要每次都算錢。MiniMax 和 Grok 都有自動 caching 機制,但你的 system prompt 越穩定,cache 命中率越高。
控制 context 長度。 OpenClaw 預設會把很多歷史訊息塞進 context,但你可以在設定裡調低 maxContextTokens。大部分日常任務根本不需要 100K 的 context,把它壓到 30-50K 可以顯著降低每次 API call 的成本。
區分任務等級。 不是每個任務都值得用最強的模型。寫一個簡單的 utility function,用 MiniMax M2.5 綽綽有餘。只有遇到跨模組的複雜重構或架構決策,才需要切到 K2.5 這種重砲。
設定每日預算上限。 OpenClaw 支援設定 spending limit,建議設在 3-5 美金。超過就停下來,強迫自己用更高效的方式跟 AI 溝通,而不是無腦丟 context。
遠離灰色操作。 不要用 Claude Code OAuth token 轉接、不要拿 Google AI Studio 的免費額度當主力。省下來的那點錢,跟帳號被封的風險比起來根本不值得。用獨立 provider 的 API key 最安心——MiniMax 本身就夠便宜了,沒必要為了再省幾毛錢去冒險。
養龍蝦的正確姿勢
回到最開頭的問題——AI 輔助開發到底值不值得花錢?
答案是:值得,但你得選對飼料。
OpenClaw 給了你選擇的自由,而 MiniMax M2.5 是目前這個時間點上,CP 值最高的選擇。Opus 級別的 coding 能力,1/20 的價格。一天不到 2 美金,就能有一個隨時待命的 AI pair programmer。
養龍蝦不用傾家蕩產。選對模型,你的龍蝦一樣能長得又大又壯。
延伸閱讀:
- OpenClaw vs Claude Code 完整比較 - DataCamp
- MiniMax M2.5 官方介紹
- OpenClaw 模型設定指南
- AI API 定價比較 2026 - IntuitionLabs
- OpenClaw MiniMax 設定教學 - Boxmining
本文最初發布於 HackMD @BASHCAT。
留言
張貼留言