發表文章

目前顯示的是 4月, 2026的文章

別問 Claude 能為你做什麼——Anthropic 工程師的 Vibe Coding 進 Production 心法

圖片
別問 Claude 能為你做什麼——Anthropic 工程師的 Vibe Coding 進 Production 心法 Anthropic 把一個 22,000 行的修改 合進了他們 生產環境 的強化學習 codebase,而且絕大多數是 Claude 寫的。 如果你第一個反應是「哇,AI 終於可以替代工程師了」——你抓錯重點了。 這個案例的真正主角不是 Claude,是那群在 PR 合進 main 之前花了好幾天當「Claude 的 Product Manager」的人類工程師。Anthropic 工程師 Erik Schluntz 在 Code with Claude 大會上把這件事的內情講得很白:vibe coding 進 production 不是放手不管,而是一套 把工程責任搬到 AI 之前 的紀律。 這篇文章我想把演講精華 + 業界數據 + 真實風險案例編織起來,讓你知道:什麼時候 vibe code、什麼時候絕對不要、以及那 15 分鐘的事前準備到底在準備什麼。 從「跟 Claude 聊天」變成「替 Claude 做 PM」 先把名詞講清楚。Vibe coding 不是「用 AI 寫程式」的同義詞。它是 OpenAI 創始成員、前 Tesla AI 總監 Andrej Karpathy 在 2025 年 2 月提出的概念——「 完全沉浸在 vibe 裡,擁抱指數成長,忘記程式碼存在 」。這條推文當時衝破 450 萬次瀏覽,Collins 詞典直接把它選為 2025 年度詞 ,連 維基百科 都單獨開了條目。 關鍵差別是:你打開 Cursor 或 Claude Code、看著 AI 寫一段就 review 一段、覺得不對就改——那叫 AI-assisted coding ,不叫 vibe coding。Vibe coding 的精髓是 你不再逐行讀程式碼 ,你只看「跑起來對不對」「結果合不合預期」。 Schluntz 講出整場演講最容易被忽略的金句: 「Ask not what Claude can do for you, but what you can do for Claude.」 仿甘迺迪那句名言,他想表達的是:在 vibe coding 時, 你的角色是 PM,不是客戶 。你不是在「使喚」Claude,你是在「設...

OpenRouter 2026 排行震撼解讀:為何 Kimi K2.6 取代 Claude?DeepSeek 壟斷角色扮演、Grok 攻下法律 #1 的真實原因

圖片
OpenRouter 2026 排行震撼解讀:為何 Kimi K2.6 取代 Claude?DeepSeek 壟斷角色扮演、Grok 攻下法律 #1 的真實原因 打開 OpenRouter 排行榜 ,我看到 2026 年 4 月的排行第一名時還是愣了一下。 不是 Claude,不是 GPT,不是 Gemini——而是來自中國 Moonshot AI 的 Kimi K2.6,週吞吐量 1.36T tokens 。再往下滑,前 10 名有 5 席是中國模型。GPT-5.4 連前 10 都沒擠進去。 這不是某個小眾排行的數據異常。OpenRouter 是全球最大的 LLM API 路由平台,接超過 400 個模型、60 多家供應商 ,每週路由 20T+ tokens——它的排行不是 benchmark 跑分,是 開發者用真金白銀換來的真實使用量 。 更戲劇性的是各分類前列:DeepSeek V3.2 在 Roleplay 拿下 40.2% 壟斷份額;Grok 4.1 Fast 攻下 Legal #1;Gemini 3 Flash Preview 同時稱霸 Health 與 Academia;Marketing 的 #1 是價格只有 $0.10/$0.40 的 Gemini 2.5 Flash Lite。 這篇文章會帶你看完整個排行版圖,深入解析每個分類 #1 為什麼能贏——是架構、訓練資料、定價、context window 還是別的東西讓他們勝出。文末附上一張按用例選模型的實戰建議表,2026 年該用哪個模型,看完就有答案。 OpenRouter 為何是最值得信的 LLM 排行 在開始解讀數字前,先說為什麼 OpenRouter 比 LMArena、benchmark 跑分更具參考價值。 LMArena 看的是「人類偏好」,但跑分跟真實生產用例的距離常常比想像中大。各家 benchmark 又都有過擬合風險——模型在 SWE-Bench 拿高分不代表在你的 codebase 跑得好。OpenRouter 不一樣,它的排行直接反映**「開發者願意為哪個模型持續付錢」**:使用者多用一個 token,OpenRouter 帳上多扣一塊錢,不付出真金白銀就不會出現在這份榜單上。 更重要的是,OpenRouter 的客群是真正在開發 AI 產品的人。Jan...

Markdown 新手完整指南 — 從零到 AI 時代,一篇就搞懂

圖片
Markdown 新手完整指南 — 從零到 AI 時代,一篇就搞懂 等一下,這是什麼?為什麼我的朋友都在用? 有沒有發生過這種事: 你打開朋友傳來的檔案,副檔名是怪怪的 .md 。用 Word 打開,亂碼;用記事本打開,看到滿滿的 # 、 ** 、 - ,像某種密碼。你關上檔案,心想「這不是我的世界」。 但你後來又發現,GitHub 上每個專案都有個 README.md ;你用 ChatGPT 或 Claude 問問題,它的回答總是整整齊齊有標題有清單;你朋友的 Obsidian 筆記軟體裡,每個檔案都是 .md 。 這個神秘的東西叫 Markdown 。而且老實說,它比你想像的簡單太多了, 真的只要 15 分鐘就能學會 。 這篇文章會帶你從零開始。沒有術語轟炸,每個概念都有例子。讀完之後,你不只會寫 Markdown,還會懂為什麼 2026 年的 AI 工具幾乎全都用它當預設輸出格式。 Markdown 是什麼?用白話解釋 想像一下,你在紙上寫筆記。你會怎麼標示「這是標題」? 大部分人會 畫底線 、 寫大一點 ,或者 在前面加一個圓點 。這些動作背後有個邏輯:用最小的符號傳達最大的意思。 Markdown 就是把這個邏輯搬到電腦上。它是一種 輕量級標記語言(lightweight markup language) ,由 John Gruber 和 Aaron Swartz 在 2004 年發明 ,核心哲學就一句話: 讓純文字看起來就像「已經被格式化過」,而且任何人不需要學習就能看懂。 舉個例子。同一段內容,三種寫法: HTML 寫法 (網頁用的): <h1>今天的待辦</h1> <ul> <li>買牛奶</li> <li><strong>打電話給媽媽</strong></li> </ul> Word 檔 :一個你打不開原始碼的二進位檔,只能用特定軟體編輯。 Markdown 寫法 : # 今天的待辦 - 買牛奶 - **打電話給媽媽** 哪個看起來比較舒服?哪個不用軟體就看得懂? 這就是 Markdown 的魔法。它是「 純文字 」(plain text),意思是你用任何編輯器都能打開,二...

Sequential Thinking MCP 還需要嗎?2026 年大模型內建推理時代的完整分析

圖片
Sequential Thinking MCP 還需要嗎?2026 年大模型內建推理時代的完整分析 你還記得 2024 年底到 2025 年初那段日子嗎?每一篇「MCP 入門教學」、每一個 YouTube 上的「10 個必裝 MCP Server」影片,幾乎都會提到同一個名字——Sequential Thinking。 那時候,安裝這個 MCP server 就像新手村的第一個任務。不管你用 Claude Desktop、Cursor 還是 VS Code,大家的 config 裡都會有那段熟悉的設定: { "mcpServers": { "sequential-thinking": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-sequential-thinking"] } } } 它的承諾很誘人:讓 AI 不要急著給答案,而是一步一步想清楚再回覆。聽起來很合理,對吧? 但現在是 2026 年 4 月。Claude 有了 Adaptive Thinking,GPT-5.4 把推理能力直接內建,DeepSeek R1 自己就會生成 <think> 區塊。那個曾經排名第三的熱門 MCP server,還有存在的必要嗎? 這篇文章不打算給你一個簡單的「要」或「不要」。我想帶你從技術原理開始,走過 Benchmark 數據、Anthropic 的官方態度轉變、社群的真實聲音,最後再回到那個實際的問題:你的 config 裡,該不該留著它? 先搞清楚:Sequential Thinking MCP 到底在做什麼? 在討論「還需不需要」之前,得先理解它的運作機制。很多人裝了它卻不太清楚它實際上幹了什麼——這本身就是個值得思考的現象。 Sequential Thinking MCP 的核心其實很簡單:它提供一個叫做 sequentialthinking 的工具(tool),讓 LLM 可以把自己的推理過程「外部化」成一系列結構化的步驟。 [mermaid 圖表 — 原始...

Harness Engineering 完全解析:當 AI Agent 的護城河不再是模型,而是環境

圖片
Harness Engineering 完全解析:當 AI Agent 的護城河不再是模型,而是環境 那個凌晨三點,AI Agent 把我的 Production 炸了 故事要從一個深夜說起。 你精心設計了一個 AI coding agent,給它最好的模型,餵它最完整的上下文,然後滿懷信心地讓它跑一整夜。隔天早上醒來,發現它不只完成了任務——它還「順便」重構了你沒讓它碰的三個模組,引入了一個循環依賴,然後在凌晨三點自信滿滿地把自己的 PR merge 了進去。 CI 亮了一排紅燈。Slack 炸了。你的 tech lead 在群組裡 @all。 這不是虛構的故事。隨著 AI Agent 在 2025 年從實驗工具進化為生產系統,類似的慘劇每天都在上演。但問題到底出在哪裡?是模型不夠聰明嗎? OpenAI 的 Codex 團隊在一次內部實驗後給出了一個讓整個產業重新思考的答案: "Agents aren't hard; the Harness is hard." (Agent 不難,難的是 Harness。) 這句話出自 OpenAI 工程師 Ryan Lopopolo 的文章 。他帶領團隊用 零行人工編寫的程式碼 ,完全靠 Codex Agent 建構了一個完整的軟體產品。但讓這件事成功的關鍵,不是更強大的模型——而是他們為模型建構的那個「環境」。 他們把這門新學科叫做 Harness Engineering 。 2026 年的此刻,這個概念正在以驚人的速度席捲整個軟體工程界。Martin Fowler 的網站專文介紹它,Anthropic 圍繞它重新設計了 Claude Code 的架構,Stripe 靠它每週生成數千個 AI PR,Datadog 用它建構了可觀測性閉環。甚至連 Manus 都用同一個模型重寫了五次 Harness,因為他們發現——真正的技術護城河不在模型,而在環境。 這篇文章會帶你從頭到尾搞懂 Harness Engineering。不是那種泛泛而談的概念介紹,而是真的能讓你在讀完之後,回去就開始動手改善你團隊 AI 工作流的那種深度。 從 Prompt 到 Harness:AI 工程的三次範式躍遷 要理解 Harness Engineering 為什麼重要,得先回頭看這四年來...

台灣政治與媒體利益綁定:從黨國到資本的未竟之路

圖片
台灣政治與媒體利益綁定:從黨國到資本的未竟之路 2025年,無國界記者組織(RSF)公布最新的世界新聞自由指數,台灣排名第24,在亞洲名列前茅,甚至超越許多歐洲老牌民主國家。 但同一年,路透新聞研究所的 數位新聞報告 這是一個非常弔詭的畫面。一個新聞「自由」排名如此靠前的國家,它的人民卻幾乎不相信自己的媒體在說真話。 問題到底出在哪裡? 答案很可能藏在一個不太好聽的詞彙裡: 政媒利益綁定 。也就是說,台灣的媒體不是不自由,而是這個自由早就被政治力量和商業利益層層收編,變成了一種帶有特定顏色的「自由」。 這篇文章試圖拆解這個結構。不站藍,不站綠,只站在一個想搞懂「我們的媒體到底怎麼了」的公民立場。 從黨國的喉舌到資本的附庸:七十年的媒體困局 要理解今天的問題,得先回到起點。 1949年國民黨政府遷台後,媒體就是威權統治的重要工具。「老三台」——台視、中視、華視——分別由省政府、國民黨與軍方掌控。報紙受到嚴格的報禁管制:限證(不發新執照)、限張(限制版面數量)、限印(限制印刷地點)。在這個體制下,媒體的角色很單純:替黨國說話。 1987年解嚴、1988年報禁解除,長期被壓縮的能量突然釋放。媒體數量在幾年內暴增,有線電視頻道遍地開花。但問題是,在這個「自由爆炸」的過程中,許多民主社會應該慢慢建立的基礎價值——比如新聞倫理規範、所有權透明機制、公共問責制度——根本來不及跟上。 政治大學新聞學系助理教授李怡志在路透報告的評論中一語道破:台灣的新聞產業在「爆發的階段,有些基本的價值並沒有時間被好好發展」。 2003年是一個看似重要的里程碑。立法院通過廣電三法修正,明文規定「黨政軍退出媒體」。國民黨被迫出售中視,華視公共化,台視民營化。表面上,黨國控制媒體的時代結束了。 但真的結束了嗎? 台灣媒體觀察教育基金會 的一篇深度分析文章標題已經給出答案: 「從黨國到資本,台灣媒體從未獨立。」 黨政軍的股權退出了,但政治力量馬上找到了新的控制手段——透過資本、標案和派系網絡,以更隱蔽的方式重新進場。 不是單方壟斷,而是「輪替壟斷」:藍綠各有自己的媒體帝國 很多人討論台灣的政媒問題時,習慣只看到「另一邊」的問題。藍營的人會說三立、民視是「綠色黨媒」;綠營的人會說旺中集團是「紅色媒體」。雙方各執一詞,吵了十幾年。 但如果你願意退後一步,看整體結構,...