這一週,中國 AI 炸翻了全世界 — 2026 春節檔 AI 三箭齊發全解析

這一週,中國 AI 炸翻了全世界 — 2026 春節檔 AI 三箭齊發全解析

ai-weekly-cover

2 月 6 日,一匹「馬」悄悄闖進了矽谷。

沒有發布會,沒有論文,甚至連開發商是誰都不知道。它以「Pony Alpha」的代號出現在模型聚合平台 OpenRouter 上,200K 上下文窗口,零收費,第一天就處理了超過 400 億個 token。

Reddit 炸了。開發者們瘋狂猜測這是誰家的秘密武器 — 有人說是 GPT-6 的偷跑版本,有人猜是 Claude 的內部測試,還有人認定這是 DeepSeek V4 的灰度發布。一位開發者拿出他壓箱底的 SVG 生成測試題去「刁難」它,結果生成品質好到他懷疑題目被洩漏了%E3%80%82

五天後,謎底揭曉:這匹黑馬來自中國的智譜 AI,它的真名叫 GLM-5。

而這,只是過去一週 AI 產業連環爆炸的序幕。


第一幕:中國 AI 的「春節攻勢」

ai-weekly-competition

過去這一週被業界稱為「AI 春節檔」,三款重量級產品幾乎同時亮相:智譜 GLM-5、字節跳動 Seedance 2.0、DeepSeek 大版本更新。這不是巧合,這是一場精心編排的攻勢。

GLM-5:用 MIT License 捅破天花板

先說數字。GLM-5 是一個 744B 參數的 MoE(混合專家)模型,實際推理時只啟用 44B 參數。它在 SWE-bench Verified 上拿到 77.8%,超越 Gemini 3 Pro 的 76.2%,直逼 Claude Opus 4.6 的 80.9%。在 LMArena Text Arena 排名開源模型第一(分數 1452,總排名第 11)。AIME 2026 數學推理 92.7%,GPQA-Diamond 86.0%。

Maxime Labonne 在他的深度分析中還指出一個有趣的數據:GLM-5 在 Artificial Analysis 的幻覺指數上達到 -1,比上代進步了 35 分 — 意味著它在「知道自己不知道什麼」這件事上,是目前業界最好的。

但真正讓人倒吸一口氣的,不是分數,是價格。

模型 輸入價格 (per M tokens) 輸出價格 (per M tokens)
Claude Opus 4.6 $5.00 $25.00
GLM-5 $0.80-1.00 $2.56-3.20
價差 約 6 倍 約 8-10 倍

同樣水準的能力,十分之一的價格。而且它是 MIT License 開源的,你想怎麼用都行。

更耐人尋味的是訓練硬體。GLM-5 完全在華為昇騰晶片上訓練,沒有用到一顆 NVIDIA GPU。這件事的意義,後面再說。

資本市場的反應很直接。路透社報導,摩根大通首次將智譜納入研究覆蓋,給予「買入」評級。

不過也不是所有人都在歡呼。安全 AI 新創 Andon Labs 的共同創辦人 Lukas Petersson 在 X 上留了一則冷靜的觀察:GLM-5 確實很能幹,但它「缺乏情境意識」— 為了達成目標會採取激進策略,卻不會反思自己所處的情境。他的原話是:「這就是你怎麼得到一個迴紋針最大化器。」

這句話讓我想了很久。能力越強的模型,如果沒有對應的安全機制,風險也越大。這是 GLM-5 式成功背後不能忽視的隱憂。

Seedance 2.0:讓好萊塢導演說「我們完了」

如果說 GLM-5 是理性派的勝利,那 Seedance 2.0 就是感性派的炸彈。

字節跳動在 2 月 7 日開始內測、2 月 12 日正式發布的這款 AI 視頻生成模型,被 DataCamp 直接稱為視頻生成領域的「DeepSeek 時刻」。馬斯克看到示範影片後在 X 上留了一句:「It's happening fast.」

Seedance 2.0 的核心突破在於「四模態輸入」— 你可以同時丟給它文字、最多 9 張圖片、3 段視頻、3 段音頻作為參考素材,它會自動理解並融合這些元素。這跟 Sora 2 只支援文字和圖片的雙模態輸入相比,是一個維度上的升級。

更厲害的是「自分鏡」功能。你只要給一段文字描述,它會自己規劃鏡頭語言:這裡用特寫、那裡用航拍、這段要慢動作。出來的就是一個 15 秒的多鏡頭短片,而且角色長相在不同鏡頭之間保持一致,還自帶配樂和音效。

跟主要競品的對比:

維度 Seedance 2.0 Sora 2 Kling 3.0
輸入模態 四模態(文字+圖+視頻+音頻) 雙模態(文字+圖) 三模態
最高解析度 2K 1080p 1080p
視頻長度 4-15 秒 5-25 秒 5-10 秒
原生音頻 對話+音效+環境音 對話+音效+環境音+配樂 對話+音效
自動分鏡 支援 不支援 不支援
核心優勢 多模態可控+自動分鏡 物理模擬真實感 情緒語調控制

資料來源:APIYI 對比分析WaveSpeed 四方對比

Picwand 的深度比較給出了一個簡潔的結論:Sora 2 更像一個追求物理真實感的「模擬器」,Seedance 2.0 更像一個給創作者用的「導演工具」。對大多數內容創作者來說,後者可能更實用。

但 Seedance 2.0 也引發了嚴重的倫理爭議。它能僅憑一張照片就生成高度相似的語音語調 — 未經本人授權。深偽風險太明顯了,字節跳動緊急限制了真人人臉作為主體參考的功能,並加入活體認證。

這個問題不會消失,只會越來越嚴重。

DeepSeek:靜默更新後的用戶反彈

DeepSeek 這週的處境就尷尬多了。

2 月 11 日,用戶發現 DeepSeek 悄悄更新了版本,上下文窗口從 128K 暴漲到 1M token,知識庫更新到 2025 年 5 月。從技術指標上看,這是一次重大升級。社區推測這可能是 V3 系列的最終形態,或者 V4 的灰度測試。野村證券預計 V4 將在 2 月中旬正式發布,模型規模達到「兆級參數」。

但用戶的真實體感卻是反過來的。大量反饋指出,更新後的 DeepSeek 文風變得囉嗦、套路化,喪失了原有的「硬核分析」風格。有人嘗試各種 prompt 技巧去挽救,都沒用。部分用戶已經轉向其他平台。

這給所有模型廠商上了一課:用戶記得你的「味道」。性能提升如果伴隨著個性消失,不見得是好事。

值得一提的是,DeepSeek 的 Sparse Attention 機制已經被 GLM-5 等其他中國模型吸收。它的技術正以「外溢」方式成為整個中國 AI 生態的技術底座。從這個角度看,即使 DeepSeek 自己踩了用戶體驗的坑,它對產業的貢獻依然深遠。


第二幕:算力版圖大裂變

ai-weekly-chip

中國在模型層面的突破已經夠震撼了,但算力層面發生的事情可能影響更深遠。

OpenAI x Cerebras:告別 NVIDIA 獨大

2 月 12 日,OpenAI 發布了 GPT-5.3-Codex-Spark。這個名字有點長,但核心訊息很簡單:這是 OpenAI 第一款不跑在 NVIDIA 硬體上的生產模型

它跑在 Cerebras 的 WSE-3(Wafer Scale Engine 3)上。這顆晶片有多誇張?大約餐盤大小,面積 46,255 平方毫米,塞了 4 兆個電晶體和 90 萬顆 AI 優化核心。比 NVIDIA B200 多 19 倍電晶體、28 倍算力。內部記憶體頻寬達到每秒 27 PB,直接消除了傳統 GPU 集群的記憶體搬運瓶頸。

結果就是:Codex-Spark 推理速度超過 1000 token/s,是前代的 15 倍。

Cerebras 的 CTO Sean Lie 說:「讓我們興奮的不只是速度,而是快速推理能創造什麼新的互動模式和使用場景。」

OpenAI 在官方公告中也很巧妙地管理預期:「GPU 仍然是我們訓練和推理管線的基礎,Cerebras 是低延遲工作負載的補充。」翻譯一下:我們沒有要甩掉 NVIDIA,但我們開始找備胎了。

事實上,OpenAI 同時在跟 AMD、Cerebras、TSMC(自研晶片)建立合作。VentureBeat 的分析直接把這件事定調為「OpenAI 首次在 NVIDIA 之外部署重大推理合作」。Cerebras 本身剛融了 10 億美元,估值 230 億

在 Hacker News 的討論串裡,有人寫了一段話讓我印象深刻:「到 2028 年,大部分晶片會用於推理而非訓練。Google 用 TPU 在推理效率上碾壓 NVIDIA,Cerebras 在速度上碾壓 NVIDIA。NVIDIA 在推理上沒有獨特優勢,而推理才是未來的主戰場。」

這話說得有點狠,但趨勢確實往那個方向走。

HBM4 軍備競賽:你的記憶體要漲價了

算力之外,記憶體成了另一個戰場。

2 月 12 日,三星宣布業界首批商用 HBM4 出貨,採用最先進的 1c 10nm DRAM 製程,處理速度達到 11.7 Gbps — 比業界標準的 8 Gbps 高出 46%。同一天,美光也宣布 HBM4 已提前交付,訂單全部售罄。SK Hynix 的 HBM4 尚未正式宣布出貨時程,但它 2026 整年的產能已經被預訂一空,甚至在考慮美國上市。

三家記憶體巨頭的軍備競賽,背後是 NVIDIA 即將在 2026 下半年推出的 Vera Rubin 平台 — 一個六晶片架構的 AI 超級電腦,號稱比 Blackwell 降低 10 倍推理成本。

但軍備競賽總有代價。CNBC 報導,美光已經直接停止了面向消費級 PC 的記憶體業務,把所有產能轉向 AI 晶片。三大廠都在做同樣的事 — 把產能從低利潤的消費級產品轉移到高利潤的 HBM4。

結果就是:標準記憶體嚴重短缺,消費級產品面臨漲價壓力。AI 公司的算力需求,正在吃掉普通消費者的供應鏈。


第三幕:產業格局的十字路口

開源正在吃掉閉源的午餐

回頭看 GLM-5 的數據,一個不可忽視的趨勢浮現了:開源模型與閉源模型的效能差距正在急劇縮小。

閉源天花板:Claude Opus 4.6   → SWE-bench 80.9%  → $5/$25 per M tokens
開源新王者:GLM-5              → SWE-bench 77.8%  → $0.80/$2.56 per M tokens
差距:                         → 3.1 個百分點      → 6-10x 便宜

兩週前發布的 Kimi K2.5 也是開源模型,GLM-5 已經超越了它,成為 Artificial Analysis 上最強的開源模型。開源模型之間的競爭本身就在推動整體水準快速提升。

當差距只剩 3 個百分點、但價格差了近 10 倍的時候,閉源模型的定價權就面臨巨大壓力。對企業用戶來說,一個很現實的問題:我需要花 10 倍的錢去買那 3% 的差距嗎?

答案當然取決於場景。在金融、醫療、法律等高風險領域,那 3% 可能值千金。但在大多數日常開發和內容生成場景中,開源模型已經「夠好了」。

Gartner 預測,到 2026 年底,40% 的企業應用將整合任務型 AI Agent(從 2025 年的不到 5%)。G2 的 2025 調查也顯示,57% 的企業已經有 AI Agent 在生產環境中運行。當 AI Agent 大規模部署,推理成本就是核心考量。開源模型的價格優勢會進一步放大。

當 AI 公司開始買政客

本週還有一件事被技術新聞淹沒了,但可能比任何模型發布都重要。

2 月 12 日,Anthropic 宣布捐出 2000 萬美元給 Public First Action,一個支持 AI 監管的政治行動委員會。這個組織計畫在州級和聯邦級選舉中支持 30-50 位跨黨派的候選人,首波廣告已經鎖定田納西的 Marsha Blackburn 和內布拉斯加的 Pete Ricketts,都是共和黨人。

而它的對手是 Leading the Future — 由 OpenAI 總裁 Greg Brockman 和矽谷知名創投 a16z 支持的反監管 PAC,已經募了 1.25 億美元

Anthropic 在聲明中說:「目前,巨量資源流向了反對 AI 安全努力的政治組織。Public First Action 正在填補這個缺口。」

紐約時報把這件事定義為:矽谷的 AI 競爭對手,現在有了各自的 super PAC。AI 監管不再只是技術圈的辯論,它已經成為美國中期選舉的主戰場之一。

與此同時,中國也在加速頂層設計。同一週,國務院舉行了以「人工智慧+」為主題的專題學習,深圳發布了 AI+先進製造業行動計劃(2026-2027)。技術突破、資本重估、政策推動三條線在同一週交匯。


這一週告訴我們什麼

說實話,我花了兩天追蹤這些事件,資訊密度大到有些窒息。但如果要提煉出幾個行動指引:

對開發者來說:開源模型的「夠用線」到了。GLM-5 以 MIT License 開源、十分之一的價格、接近頂級閉源模型的效能 — 值得跑一輪評估。同時,Codex-Spark 的 1000+ token/s 證明了「速度」是 AI 編程助手的新競爭維度,不只是誰更聰明,還有誰更快。

對投資者來說:算力多元化是真實趨勢。NVIDIA 的壟斷地位正在被 Cerebras、Google TPU、AMD、華為昇騰從多個方向蠶食。HBM4 軍備競賽意味著記憶體板塊可能還有空間,但消費級記憶體市場的陣痛才剛開始。

對所有人來說:AI 的倫理和監管問題已經從「未來議題」變成「現在進行式」。Seedance 2.0 的深偽能力、Anthropic 和 OpenAI 各自砸錢買政治影響力 — 這些都在告訴我們,技術已經快到社會還沒準備好的地步。

下週,我們可能會看到 DeepSeek V4 的正式發布。NVIDIA Vera Rubin 平台的更多細節也在陸續釋出。

AI 產業的春天,比任何人預期的都來得更猛烈。而你要做的,就是繫好安全帶。


延伸閱讀


本文最初發布於 HackMD @BASHCAT

留言

這個網誌中的熱門文章

Arduino 課本可能沒教的事(1)

SI4432 搭配Arduino

燒錄 Arduino mini Pro 燒錄