Claude Cowork 完整指南:從架構到實戰,一個 AI 同事真正能做什麼

Claude Cowork 完整指南:從架構到實戰,一個 AI 同事真正能做什麼

我的 Downloads 資料夾長年保持在 800 個檔案上下。Screenshot 2024-11-...png未命名(3).pdffinal_FINAL_v3.xlsx、各種你想得到的命名地獄。每次打開都像考古現場——不是不想整理,是真的不想整理。

那天我把這個資料夾的存取權給了 Claude Cowork,說「整理它」。

四分鐘後,800 個檔案被分到 12 個子資料夾裡:按類型、按專案、按年份。重複的標出來、檔名換成有意義的描述,還附上一份 markdown 摘要說明「為什麼這樣分」。我沒寫一行 prompt,沒拖一個檔案,沒指定任何規則。

這不是 Chat。這是一個會在你電腦上動手做事的東西。

ClaudeCowork-混亂到秩序

這篇文章不是行銷稿,是一個工程師花了一個月把 Cowork 用在自己工作流之後的整理。會講它真正的架構(不只是 marketing 的那層皮),講大家都用它做什麼、什麼用法是浪費,也講為什麼到今天我還不會把它丟去做 mission-critical 的事

它到底是什麼:Claude Code 的非技術版

Cowork 在 2026 年 1 月推出 research preview——Anthropic Labs 的介紹文章 明確把 Cowork 列入該批次發布的產品,Wired 的同期評測 也標記是當週上線。GA 約在四月初,9to5Mac 的報導 寫到 Cowork「losing the research preview label」並加入 RBAC、OpenTelemetry observability、Zoom MCP 等企業功能(私人 plugin marketplace 仍在開發中)。官方在 產品頁 上的定位很明確:「Give it a goal and Claude works on your computer, local files, and applications to return a finished deliverable.」

但更直白的描述在媒體間流傳——它是「Claude Code for the rest of your work」。Wired 的評測標題 也用類似的角度切入。換句話說,Code 給的代理能力是給工程師寫 codebase 的,Cowork 是把同一套能力包進一個非技術用戶能接受的 UI 裡,去處理 email、Excel、PDF、PPT 這些佔據絕大多數知識工作者一天的東西。

社群裡流傳一個很傳神的比喻:

工具 像什麼 主要工作
Claude Chat 顧問 回答問題、幫你想
Claude Code CTO 寫程式、改 codebase
Claude Cowork COO 操作整個工作生活——檔案、文件、研究

當你打開 macOS 或 Windows 的 Claude Desktop App(截至 2026 年 5 月測試版本),介面會出現一個 mode selector,讓你在 Chat 與 Cowork 等模式間切換,官方 Get started 文件 有提到這個切換流程。同一個模型核心(Opus 4.5/4.6),不同介面,不同互動哲學。

Chat 是你問它答;Code 是給工程師的終端機;Cowork 介於兩者之間——你描述「想要的成果」,它規劃、執行、把檔案放回你電腦。這個切換點很關鍵:你不再是和 AI 對話,而是在交付一份工作。

ClaudeCowork-三模式對比

底下到底發生什麼事:架構拆解

很多 Cowork 教學文跳過架構直接講用法,但對工程師來說,搞清楚底層是怎麼跑的才會有信心讓它碰你的檔案。

技術社群(包括 Reddit 上的拆解 )對 Cowork 架構的觀察得到一致結論:它不是把 Claude 直接放進你的作業系統,而是每接到一個 task 就啟動一個臨時虛擬機。這個觀察也與 Anthropic 官方安全指南 中提到的「isolated sandbox, separate from your main operating system」一致:

  • macOS:透過 Apple VZVirtualMachine 框架 啟動一個約 2GB 的 Linux VM(社群推測,未經官方逐項確認)
  • Windows:依賴 WSL2 + Hyper-V,這也是為什麼 Windows 11 Home 版的 Hyper-V 不足以跑起來

VM 啟動之後,Cowork 把你授權的資料夾掛載進去,加上 Computer Use API 給它「眼睛」(截圖視覺辨識)和「手」(鍵鼠控制),剩下的就是 Claude Opus 4.5/4.6 在裡面執行 sub-agent 平行協調。

[Claude Desktop UI]
        │
        ├── 大腦:Claude Opus 4.5/4.6(200K context)
        ├── 眼睛:Computer Use API(screenshot + 視覺)
        └── 手:mouse/keyboard + filesystem ops
                    │
                    └─→ 沙箱層
                          ├── macOS: VZVirtualMachine + Linux VM (<sub>2GB)
                          └── Windows: WSL2 + Hyper-V

這個架構解決兩件事:第一,Claude 不能存取你沒授權的資料夾——對 prompt injection 攻擊來說,這是一道實體隔離;第二,sub-agent 可以在 VM 裡平行跑,一個分析、一個轉檔、一個格式化,這也是為什麼 Cowork 處理大量檔案會比單線程的 Chat workflow 快很多。

但這個架構也有代價。它解釋了為什麼 Cowork 額度消耗比 Chat 快(每個 task 都在啟動 VM、跑 sub-agents),也解釋了為什麼必須開著 Claude Desktop(VM 跟著 app 生死)。

ClaudeCowork-沙箱架構

大家都用它做什麼:30+ 個真實案例的歸納

研究 Cowork 的時候我讀了不少社群整理:Claudia + AI 寫的 30 個案例清單Kuse.ai 的 8 個 use case 拆解 、Karo Zieminski 自稱花九天測試出的 50+ tips ,以及一堆 YouTube 教學。歸納起來,真正有 wow 感的用法只有六大類

1. 檔案管理(入門款,最容易被驚豔)

開頭那個 Downloads 整理就屬於這類。連帶的還有:把幾百張收據截圖丟進資料夾,要它做成有公式的 Excel 費用報表;把 final_FINAL_v3_USE_THIS.pptx 的命名地獄統一成有規範的檔名;把 Google Drive 連 connector 進來,把超過兩年沒動的東西丟封存。

這類工作是公認的甜蜜點:高重複、低判斷、結果可驗證。Anthropic 技術成員 Felix Rieseberg(前微軟 Electron 維護者,現專注於 Cowork 開發)在 Wired 訪談 裡也說,他最常用 Cowork 的就是「Turn these 20 JPEGs into one PDF」這種事。

2. 研究綜合

研究生跟分析師會愛這個。把一個資料夾塞滿 PDF(學術論文、市場報告、政策文件),叫它做主題綜合:找出共通論點、矛盾的地方、自動標註出處。輸出的不是 chat 訊息,是一份 markdown 或 docx 報告,直接放回你的工作目錄。

進階一點的,數位時代的這篇報導 整理了一份宣稱有 85 個使用情境的清單,其中提到「從科學到財務全方位評估一家公司」——同時分析 SEC 申報、臨床試驗數據、專利資料,跨領域之間互相矛盾時自動標記。這類複雜任務在 Chat 裡幾乎不可能流暢完成,因為超出 context window,但 Cowork 用 sub-agent 拆解就能處理。

3. 會議記錄轉行動

把錄音逐字稿丟進資料夾,要它輸出:執行摘要、行動項清單、決策日誌、針對每個 action item 負責人的 follow-up email 草稿。整個會議的「會後該做什麼」一次到位。

4. 跨工具自動化

這是 Connectors 真正的價值。當你接上 Gmail、Google Drive、Notion、Slack、Asana 之後,Cowork 可以做這種事:每天早上自動產一份「今日簡報」——拉行事曆、抓 Slack 重要訊息、整合 Notion 的待辦、串氣象 API。一個 reddit 用戶 實際在做這件事 :「Claude cowork runs a scheduled task every morning where it reviews my upcoming meetings」。

5. 內容創作

社群媒體日曆、影片精彩片段剪輯、品牌素材生成、行銷 email。光是能寫沒有意義,它得套上你的 voice 才有意義——這就要講到 Skills。

6. 投資/財務分析

連 Daloopa、S&P Capital IQ 的金融數據平台之後,Cowork 可以自動產投資備忘錄(含 DCF + 敏感度矩陣 + 競品比較),跨銀行對帳、自動標出差異並產生調整分錄。這也是為什麼 Anthropic 接連推出財務 plugin 模板。

Power user 的 unlock:Skills、Plugins、Folder Instructions

把 Cowork 當作「能存取資料夾的 ChatGPT」是最浪費的用法。它真正的槓桿在三個機制:

Skills——Claude 的可重用「劇本」。你把品牌準則、寫作風格、SOP 包成一個 SKILL.md,Cowork 在每個相關任務開頭自動讀取。Karo Zieminski 在 她九天測試之後的整理 寫了一段我覺得很關鍵的話:

Chunk your skills instead of building one giant skill that tries to handle everything. I've tested both approaches and the results from one giant skill were much worse.

她舉的例子是「寫作」這件事她拆三個 skill:一個整體 voice、一個企業寫作、一個電子報。Claude 永遠搞清楚這次是寫給誰。單一大 skill 的結果遠比多個小 skill 差——這個經驗對所有想自訂 Cowork 行為的人都適用。

Plugins——Skills + commands + connectors + sub-agents 的打包。Anthropic 在 GitHub 上開源了 11 個官方 plugin ,包含 Sales、Legal、Marketing、Finance、Enterprise Search、Cowork Plugin Management 等。Plugin 的本質是 Markdown + JSON 而已,沒有 build pipeline、沒有部署,能描述工作流程的人就能寫一個。

Folder Instructions——每個專案資料夾放一個 CONTEXT.mdPROJECT.md,把這個專案的背景、術語、規則寫清楚。Claude 進這個資料夾做事就會自動讀取。Chris Bailey 在 10 tips for using Claude Cowork 講了一個很到位的概念:把資料夾當成「給一個 mind 的工作空間」來設計。他的健康追蹤 workflow 就是把 Health Auto Export 的 CSV 直接導到 Dropbox 資料夾,Cowork 永遠有最新數據。

這三個機制疊加起來,你會從「每次都要長 prompt 解釋一次自己是誰」變成「只說想要什麼結果」。這就是 power user 跟一般用戶的差距。

入門起手式:第一週要做的五件事

如果你今天剛裝完 Claude Desktop,最有效率的學習路徑是這樣:

1. 不要直接給 </sub>/Documents 權限
   建一個 <sub>/Cowork/ 專屬資料夾,把要練習的檔案複製進去
   第一週只在這個資料夾裡跑 task

2. 設 Global Instructions(Settings > Cowork)
   ─ 你的角色:例如「我是硬體工程師,主要工作是電路設計與韌體」
   ─ 偏好語氣:例如「繁體中文、簡潔、技術正式」
   ─ 預設輸出格式:Markdown 或 Excel
   每次 task 自動帶入,不用一直重述

3. 第一個任務:選低風險、有 wow 感的
   "整理 </sub>/Cowork/test_downloads,按類型分子資料夾,
    去除重複,把無意義檔名改成有意義的,給我變動摘要"
   全程用 Ask before acting 模式,邊看邊批准

4. 第二週開始建 Skills
   先寫一個你最常用的——例如「我的 voice」
   寫成 SKILL.md 放在 ~/.claude/skills/
   觀察輸出有沒有自動套用

5. 第三週接 Connectors
   從 Gmail 或 Google Drive 開始
   試著做「每日簡報」這類跨工具任務

第一週重點不是「學會所有功能」,是建立直覺:知道 Cowork 哪些事做得好、哪些事還是該回去用 Chat。

誠實談限制:為什麼我還沒把它丟去 mission-critical

Cowork 是真的有用,但研究預覽到 GA 才半年,距離「無人值守的 AI 同事」還有不小距離。這幾個限制你最好預先知道:

必須開著 Claude Desktop。 App 關掉、電腦睡著,task 就中斷。包含所謂的 Scheduled Tasks——它們依賴 app 跟電腦活著,Anthropic 官方安全指南 也明確寫到「Scheduled tasks only run while your computer is awake and the Claude Desktop app is open」。如果你想要那種「每天早上 7 點 Claude 自動做 X」、不管你電腦狀態都會跑,Cowork 不是答案。

額度消耗比 Chat 快很多。 因為每個 task 都在跑 VM + sub-agents。Pro $20 重度用會撞牆。如果你打算每天都讓 Cowork 跑長時間任務,Max 5x 的 $100 是務實起點。

Windows 體驗遠不如 macOS。 需要 Pro 版以上、需要 BIOS 開 SVM Mode(AMD)或 VT-x(Intel)、Home 版的 Hyper-V 不夠用。一個 Reddit 用戶 花了一整天才搞定 所有環境問題,包括「HcnCreateEndpoint failed with HRESULT 0x800706bf」、需要刪除 vm_bundles 資料夾才能恢復。如果你只用 Windows,先不要急著遷移。

Prompt injection 是真實風險。 一個惡意網頁、一封藏指令的信件、一份你以為很正常的 PDF,都可能讓 Cowork 做出你沒授權的事——特別是當你打開「Act without asking」模式的時候。Anthropic 自己在 安全使用指南 寫得很清楚:避免讓 Cowork 碰金融、醫療、銀行網站;重要檔案先備份;從低風險任務開始建立信任。

它沒有真正跨任務的「memory」。 每次 task 結束、VM 銷毀。要讓它跨 session 記得你的事,目前的 workaround 是手動把上下文寫進 MD 檔放在 folder 裡。這跟 ChatGPT 的 memory feature 不是同一個層次的東西。

還有一個比較哲學性的質疑來自 Benn Stancil 的文章 〈Why Cowork can't work〉 。他的論點之一是:個人聲音(emails、寫作風格)跟 code 不同,不管你多努力 prompt,「the machine will always hear the echoes of its whispering ghosts」——LLM 的 pre-training 痕跡很難磨掉。對於需要「真實聲音」的內容工作(部落格、客戶溝通、創意),這是 Cowork 沒辦法用 Skills 完全解決的根本問題。

你今天要不要試?決策框架

我給的建議不是「全面採用」也不是「不要碰」,是看你的工作型態:

你的工作多數是… 用 Cowork 的甜蜜度
寫程式、改 codebase 不要用 Cowork,用 Code
短問答、想點子 不要用 Cowork,用 Chat
整理檔案、跑批次、產報表 Cowork 的核心戰場
多 PDF/文件綜合研究 非常適合
跨工具的例行任務(每日簡報、週報) 適合,但接受排程不穩
創意寫作、需要強烈個人聲音 慎用,pre-training 痕跡難磨掉
處理機敏資料(金融、醫療) 不要用,sandbox 不等於零風險

對工程師我會多加一條:Cowork 不會取代你的編輯器或 IDE,但會取代你「處理副產物」的時間——datasheet 比對、測試 log 整理、BOM 對齊、會議記錄轉 markdown 那些事。如果你跟我一樣每週要跟一堆 PDF datasheet 跟測試報告打交道,Cowork 真的會省下幾小時。

一個 AI 同事真正的形狀

研究 Cowork 一個月之後,我覺得它最有意思的地方不在功能本身,而在它揭示了「AI agent 該長什麼樣子」這個問題的一個答案。

它沒有試著做你的「全能助手」(那種東西會在 demo 表演得很好然後在實戰中失敗)。它把自己縮在一個受控沙箱裡,要你授權每個資料夾、要你檢查每個動作、把不確定性留給你判斷。它做的是「如果這件事一個小時內可以完成、規則清楚、結果可驗證,就交給我」這個切片。

這個切片在我們一天工作中佔的比例,比想像中的多很多。

ClaudeCowork-AI同事

我一個月前把 Downloads 資料夾交給 Cowork。今天打開它,又累積到接近 900 個檔案,重新陷入混亂。但這次我知道,下次想整理的時候,只要四分鐘。

延伸閱讀


本文最初發布於 HackMD @BASHCAT

留言

這個網誌中的熱門文章

Arduino 課本可能沒教的事(1)

SI4432 搭配Arduino

燒錄 Arduino mini Pro 燒錄