Claude Cowork 完整指南：從架構到實戰，一個 AI 同事真正能做什麼

我的 Downloads 資料夾長年保持在 800 個檔案上下。Screenshot 2024-11-...png、未命名(3).pdf、final_FINAL_v3.xlsx、各種你想得到的命名地獄。每次打開都像考古現場——不是不想整理，是真的不想整理。

那天我把這個資料夾的存取權給了 Claude Cowork，說「整理它」。

四分鐘後，800 個檔案被分到 12 個子資料夾裡：按類型、按專案、按年份。重複的標出來、檔名換成有意義的描述，還附上一份 markdown 摘要說明「為什麼這樣分」。我沒寫一行 prompt，沒拖一個檔案，沒指定任何規則。

這不是 Chat。這是一個會在你電腦上動手做事的東西。

ClaudeCowork-混亂到秩序

這篇文章不是行銷稿，是一個工程師花了一個月把 Cowork 用在自己工作流之後的整理。會講它真正的架構（不只是 marketing 的那層皮），講大家都用它做什麼、什麼用法是浪費，也講為什麼到今天我還不會把它丟去做 mission-critical 的事。

它到底是什麼：Claude Code 的非技術版

Cowork 在 2026 年 1 月推出 research preview——Anthropic Labs 的介紹文章明確把 Cowork 列入該批次發布的產品，Wired 的同期評測也標記是當週上線。GA 約在四月初，9to5Mac 的報導寫到 Cowork「losing the research preview label」並加入 RBAC、OpenTelemetry observability、Zoom MCP 等企業功能（私人 plugin marketplace 仍在開發中）。官方在產品頁上的定位很明確：「Give it a goal and Claude works on your computer, local files, and applications to return a finished deliverable.」

但更直白的描述在媒體間流傳——它是「Claude Code for the rest of your work」。Wired 的評測標題也用類似的角度切入。換句話說，Code 給的代理能力是給工程師寫 codebase 的，Cowork 是把同一套能力包進一個非技術用戶能接受的 UI 裡，去處理 email、Excel、PDF、PPT 這些佔據絕大多數知識工作者一天的東西。

社群裡流傳一個很傳神的比喻：

工具	像什麼	主要工作
Claude Chat	顧問	回答問題、幫你想
Claude Code	CTO	寫程式、改 codebase
Claude Cowork	COO	操作整個工作生活——檔案、文件、研究

當你打開 macOS 或 Windows 的 Claude Desktop App（截至 2026 年 5 月測試版本），介面會出現一個 mode selector，讓你在 Chat 與 Cowork 等模式間切換，官方 Get started 文件有提到這個切換流程。同一個模型核心（Opus 4.5/4.6），不同介面，不同互動哲學。

Chat 是你問它答；Code 是給工程師的終端機；Cowork 介於兩者之間——你描述「想要的成果」，它規劃、執行、把檔案放回你電腦。這個切換點很關鍵：你不再是和 AI 對話，而是在交付一份工作。

ClaudeCowork-三模式對比

底下到底發生什麼事：架構拆解

很多 Cowork 教學文跳過架構直接講用法，但對工程師來說，搞清楚底層是怎麼跑的才會有信心讓它碰你的檔案。

技術社群（包括 Reddit 上的拆解）對 Cowork 架構的觀察得到一致結論：它不是把 Claude 直接放進你的作業系統，而是每接到一個 task 就啟動一個臨時虛擬機。這個觀察也與 Anthropic 官方安全指南中提到的「isolated sandbox, separate from your main operating system」一致：

macOS：透過 Apple VZVirtualMachine 框架啟動一個約 2GB 的 Linux VM（社群推測，未經官方逐項確認）
Windows：依賴 WSL2 + Hyper-V，這也是為什麼 Windows 11 Home 版的 Hyper-V 不足以跑起來

VM 啟動之後，Cowork 把你授權的資料夾掛載進去，加上 Computer Use API 給它「眼睛」（截圖視覺辨識）和「手」（鍵鼠控制），剩下的就是 Claude Opus 4.5/4.6 在裡面執行 sub-agent 平行協調。

[Claude Desktop UI]
        │
        ├── 大腦：Claude Opus 4.5/4.6（200K context）
        ├── 眼睛：Computer Use API（screenshot + 視覺）
        └── 手：mouse/keyboard + filesystem ops
                    │
                    └─→ 沙箱層
                          ├── macOS: VZVirtualMachine + Linux VM (<sub>2GB)
                          └── Windows: WSL2 + Hyper-V

這個架構解決兩件事：第一，Claude 不能存取你沒授權的資料夾——對 prompt injection 攻擊來說，這是一道實體隔離；第二，sub-agent 可以在 VM 裡平行跑，一個分析、一個轉檔、一個格式化，這也是為什麼 Cowork 處理大量檔案會比單線程的 Chat workflow 快很多。

但這個架構也有代價。它解釋了為什麼 Cowork 額度消耗比 Chat 快（每個 task 都在啟動 VM、跑 sub-agents），也解釋了為什麼必須開著 Claude Desktop（VM 跟著 app 生死）。

ClaudeCowork-沙箱架構

大家都用它做什麼：30+ 個真實案例的歸納

研究 Cowork 的時候我讀了不少社群整理：Claudia + AI 寫的 30 個案例清單、Kuse.ai 的 8 個 use case 拆解、Karo Zieminski 自稱花九天測試出的 50+ tips ，以及一堆 YouTube 教學。歸納起來，真正有 wow 感的用法只有六大類：

1. 檔案管理（入門款，最容易被驚豔）

開頭那個 Downloads 整理就屬於這類。連帶的還有：把幾百張收據截圖丟進資料夾，要它做成有公式的 Excel 費用報表；把 final_FINAL_v3_USE_THIS.pptx 的命名地獄統一成有規範的檔名；把 Google Drive 連 connector 進來，把超過兩年沒動的東西丟封存。

這類工作是公認的甜蜜點：高重複、低判斷、結果可驗證。Anthropic 技術成員 Felix Rieseberg（前微軟 Electron 維護者，現專注於 Cowork 開發）在 Wired 訪談裡也說，他最常用 Cowork 的就是「Turn these 20 JPEGs into one PDF」這種事。

2. 研究綜合

研究生跟分析師會愛這個。把一個資料夾塞滿 PDF（學術論文、市場報告、政策文件），叫它做主題綜合：找出共通論點、矛盾的地方、自動標註出處。輸出的不是 chat 訊息，是一份 markdown 或 docx 報告，直接放回你的工作目錄。

進階一點的，數位時代的這篇報導整理了一份宣稱有 85 個使用情境的清單，其中提到「從科學到財務全方位評估一家公司」——同時分析 SEC 申報、臨床試驗數據、專利資料，跨領域之間互相矛盾時自動標記。這類複雜任務在 Chat 裡幾乎不可能流暢完成，因為超出 context window，但 Cowork 用 sub-agent 拆解就能處理。

3. 會議記錄轉行動

把錄音逐字稿丟進資料夾，要它輸出：執行摘要、行動項清單、決策日誌、針對每個 action item 負責人的 follow-up email 草稿。整個會議的「會後該做什麼」一次到位。

4. 跨工具自動化

這是 Connectors 真正的價值。當你接上 Gmail、Google Drive、Notion、Slack、Asana 之後，Cowork 可以做這種事：每天早上自動產一份「今日簡報」——拉行事曆、抓 Slack 重要訊息、整合 Notion 的待辦、串氣象 API。一個 reddit 用戶實際在做這件事：「Claude cowork runs a scheduled task every morning where it reviews my upcoming meetings」。

5. 內容創作

社群媒體日曆、影片精彩片段剪輯、品牌素材生成、行銷 email。光是能寫沒有意義，它得套上你的 voice 才有意義——這就要講到 Skills。

6. 投資/財務分析

連 Daloopa、S&P Capital IQ 的金融數據平台之後，Cowork 可以自動產投資備忘錄（含 DCF + 敏感度矩陣 + 競品比較），跨銀行對帳、自動標出差異並產生調整分錄。這也是為什麼 Anthropic 接連推出財務 plugin 模板。

Power user 的 unlock：Skills、Plugins、Folder Instructions

把 Cowork 當作「能存取資料夾的 ChatGPT」是最浪費的用法。它真正的槓桿在三個機制：

Skills——Claude 的可重用「劇本」。你把品牌準則、寫作風格、SOP 包成一個 SKILL.md，Cowork 在每個相關任務開頭自動讀取。Karo Zieminski 在她九天測試之後的整理寫了一段我覺得很關鍵的話：

Chunk your skills instead of building one giant skill that tries to handle everything. I've tested both approaches and the results from one giant skill were much worse.

她舉的例子是「寫作」這件事她拆三個 skill：一個整體 voice、一個企業寫作、一個電子報。Claude 永遠搞清楚這次是寫給誰。單一大 skill 的結果遠比多個小 skill 差——這個經驗對所有想自訂 Cowork 行為的人都適用。

Plugins——Skills + commands + connectors + sub-agents 的打包。Anthropic 在 GitHub 上開源了 11 個官方 plugin ，包含 Sales、Legal、Marketing、Finance、Enterprise Search、Cowork Plugin Management 等。Plugin 的本質是 Markdown + JSON 而已，沒有 build pipeline、沒有部署，能描述工作流程的人就能寫一個。

Folder Instructions——每個專案資料夾放一個 CONTEXT.md 或 PROJECT.md，把這個專案的背景、術語、規則寫清楚。Claude 進這個資料夾做事就會自動讀取。Chris Bailey 在 10 tips for using Claude Cowork 講了一個很到位的概念：把資料夾當成「給一個 mind 的工作空間」來設計。他的健康追蹤 workflow 就是把 Health Auto Export 的 CSV 直接導到 Dropbox 資料夾，Cowork 永遠有最新數據。

這三個機制疊加起來，你會從「每次都要長 prompt 解釋一次自己是誰」變成「只說想要什麼結果」。這就是 power user 跟一般用戶的差距。

入門起手式：第一週要做的五件事

如果你今天剛裝完 Claude Desktop，最有效率的學習路徑是這樣：

1. 不要直接給 </sub>/Documents 權限
   建一個 <sub>/Cowork/ 專屬資料夾，把要練習的檔案複製進去
   第一週只在這個資料夾裡跑 task

2. 設 Global Instructions（Settings > Cowork）
   ─ 你的角色：例如「我是硬體工程師，主要工作是電路設計與韌體」
   ─ 偏好語氣：例如「繁體中文、簡潔、技術正式」
   ─ 預設輸出格式：Markdown 或 Excel
   每次 task 自動帶入，不用一直重述

3. 第一個任務：選低風險、有 wow 感的
   "整理 </sub>/Cowork/test_downloads，按類型分子資料夾，
    去除重複，把無意義檔名改成有意義的，給我變動摘要"
   全程用 Ask before acting 模式，邊看邊批准

4. 第二週開始建 Skills
   先寫一個你最常用的——例如「我的 voice」
   寫成 SKILL.md 放在 ~/.claude/skills/
   觀察輸出有沒有自動套用

5. 第三週接 Connectors
   從 Gmail 或 Google Drive 開始
   試著做「每日簡報」這類跨工具任務

第一週重點不是「學會所有功能」，是建立直覺：知道 Cowork 哪些事做得好、哪些事還是該回去用 Chat。

誠實談限制：為什麼我還沒把它丟去 mission-critical

Cowork 是真的有用，但研究預覽到 GA 才半年，距離「無人值守的 AI 同事」還有不小距離。這幾個限制你最好預先知道：

必須開著 Claude Desktop。 App 關掉、電腦睡著，task 就中斷。包含所謂的 Scheduled Tasks——它們依賴 app 跟電腦活著，Anthropic 官方安全指南也明確寫到「Scheduled tasks only run while your computer is awake and the Claude Desktop app is open」。如果你想要那種「每天早上 7 點 Claude 自動做 X」、不管你電腦狀態都會跑，Cowork 不是答案。

額度消耗比 Chat 快很多。 因為每個 task 都在跑 VM + sub-agents。Pro $20 重度用會撞牆。如果你打算每天都讓 Cowork 跑長時間任務，Max 5x 的 $100 是務實起點。

Windows 體驗遠不如 macOS。 需要 Pro 版以上、需要 BIOS 開 SVM Mode（AMD）或 VT-x（Intel）、Home 版的 Hyper-V 不夠用。一個 Reddit 用戶花了一整天才搞定所有環境問題，包括「HcnCreateEndpoint failed with HRESULT 0x800706bf」、需要刪除 vm_bundles 資料夾才能恢復。如果你只用 Windows，先不要急著遷移。

Prompt injection 是真實風險。 一個惡意網頁、一封藏指令的信件、一份你以為很正常的 PDF，都可能讓 Cowork 做出你沒授權的事——特別是當你打開「Act without asking」模式的時候。Anthropic 自己在安全使用指南寫得很清楚：避免讓 Cowork 碰金融、醫療、銀行網站；重要檔案先備份；從低風險任務開始建立信任。

它沒有真正跨任務的「memory」。 每次 task 結束、VM 銷毀。要讓它跨 session 記得你的事，目前的 workaround 是手動把上下文寫進 MD 檔放在 folder 裡。這跟 ChatGPT 的 memory feature 不是同一個層次的東西。

還有一個比較哲學性的質疑來自 Benn Stancil 的文章〈Why Cowork can't work〉。他的論點之一是：個人聲音（emails、寫作風格）跟 code 不同，不管你多努力 prompt，「the machine will always hear the echoes of its whispering ghosts」——LLM 的 pre-training 痕跡很難磨掉。對於需要「真實聲音」的內容工作（部落格、客戶溝通、創意），這是 Cowork 沒辦法用 Skills 完全解決的根本問題。

你今天要不要試？決策框架

我給的建議不是「全面採用」也不是「不要碰」，是看你的工作型態：

你的工作多數是…	用 Cowork 的甜蜜度
寫程式、改 codebase	不要用 Cowork，用 Code
短問答、想點子	不要用 Cowork，用 Chat
整理檔案、跑批次、產報表	Cowork 的核心戰場
多 PDF/文件綜合研究	非常適合
跨工具的例行任務（每日簡報、週報）	適合，但接受排程不穩
創意寫作、需要強烈個人聲音	慎用，pre-training 痕跡難磨掉
處理機敏資料（金融、醫療）	不要用，sandbox 不等於零風險

對工程師我會多加一條：Cowork 不會取代你的編輯器或 IDE，但會取代你「處理副產物」的時間——datasheet 比對、測試 log 整理、BOM 對齊、會議記錄轉 markdown 那些事。如果你跟我一樣每週要跟一堆 PDF datasheet 跟測試報告打交道，Cowork 真的會省下幾小時。

一個 AI 同事真正的形狀

研究 Cowork 一個月之後，我覺得它最有意思的地方不在功能本身，而在它揭示了「AI agent 該長什麼樣子」這個問題的一個答案。

它沒有試著做你的「全能助手」（那種東西會在 demo 表演得很好然後在實戰中失敗）。它把自己縮在一個受控沙箱裡，要你授權每個資料夾、要你檢查每個動作、把不確定性留給你判斷。它做的是「如果這件事一個小時內可以完成、規則清楚、結果可驗證，就交給我」這個切片。

這個切片在我們一天工作中佔的比例，比想像中的多很多。

ClaudeCowork-AI同事

我一個月前把 Downloads 資料夾交給 Cowork。今天打開它，又累積到接近 900 個檔案，重新陷入混亂。但這次我知道，下次想整理的時候，只要四分鐘。

搜尋此網誌

BASHCAT