Claude不讓我們用！國產(chǎn)平替能頂上嗎？

2025-09-08 04:02:52分類：通遼閱讀(59508)

機器之心報道

作者：冷貓、杜偉

這幾天，全球 AI 代碼生成的競爭格局，迎來了新的拐點。

在編程領(lǐng)域，曾被視為王者的 Anthropic，似乎正在一步步失去昔日的鋒芒，地位開始動搖。

這一方面源于 OpenAI GPT-5 系列模型的強勢崛起，在與 Claude Code 的對戰(zhàn)中大有「后來者居上」之勢，AI 大神 Karpathy 現(xiàn)身說法并開始安利 GPT-5 Pro 的強大代碼能力。

另一方面則是 Anthropic 自身的一系列迷之操作，先是放任并承認(rèn)自家模型（包括 Claude Opus 4.1 和 Opus 4）降智，本周又宣布向包括中國在內(nèi)的部分地區(qū)限制其 AI 產(chǎn)品和服務(wù)的使用。

在這個微妙的時間節(jié)點，多家國產(chǎn)大模型廠商向 Anthropic 發(fā)起了一波正面狙擊。月之暗面發(fā)布了 Kimi-K2-0905 版本、阿里發(fā)布了超萬億參數(shù)的 Qwen3-Max-Preview。

前者作為 Kimi-K2 系列模型的最新版本，將上下文長度擴展到了 256k，針對前端開發(fā)等實際編程任務(wù)做了優(yōu)化，長代碼生成中的正確性、穩(wěn)定性和邏輯一致性較以往版本有了提升。后者是阿里迄今最大的模型，同樣提升了通用知識、數(shù)學(xué)推理、編程等多種任務(wù)的表現(xiàn)。

可以看到，國產(chǎn)大模型廠商近來集中在代碼生成任務(wù)上發(fā)力。Kimi-K2-0905 強調(diào)了工具調(diào)用能力，并提升了模型與 Agent 框架（如 Roo Code）的集成性。

在使用該模型調(diào)用外部工具時，格式正確率現(xiàn)在可以達到 100%，不再需求人工修正。它還完全兼容 Anthropic API，方便接入與遷移。對 WebSearch Tool 的支持，可以通過實時信息檢索提升任務(wù)效果。

隨著 0905 版本的發(fā)布，近 30 天 Kimi-K2 系列模型在 Hugging Face 中的下載量超過了 39 萬。

對于最新的 Kimi-K2-0905，有人直言「終于不用再為處理復(fù)雜的長任務(wù)而感到挫敗了?！?/p>

此消彼長，隨著國產(chǎn)大模型在代碼生成領(lǐng)域持續(xù)發(fā)力，全球競爭的格局也許真的要變一變了。

能力、價格雙優(yōu)勢，讓國產(chǎn)大模型更能打

作為 Kimi K2 系列中最新的版本，Kimi-K2-0905 與其他國產(chǎn)大模型廠商的新模型（如 Qwen3-Max-Preview）一樣，向曾經(jīng)的王者 Claude 的傳統(tǒng)優(yōu)勢區(qū)間發(fā)起挑戰(zhàn)，強調(diào)智能編程領(lǐng)域的性能提升。

從技術(shù)細節(jié)上來看，Kimi-K2-0905 沿用了目前主流的 MoE 架構(gòu)，參數(shù)規(guī)模為萬億級別，在推理時實際被激活的參數(shù)為 320 億。

參數(shù)概覽

從該模型與 Claude Sonnet 4 在 SWE-bench Verified 等真實編程基準(zhǔn)的對比中發(fā)現(xiàn)，Kimi-K2-0905 在部分測試中（如多語言環(huán)境、命令行 / 終端交互）甚至超過了這個競爭對手。

實戰(zhàn)表現(xiàn)究竟如何？我們用它做了個經(jīng)典小游戲。

指令很簡單：「制作一個和微信打飛機類似的網(wǎng)頁小游戲，需要美觀，好玩，功能齊全?！?/p>

Kimi-K2-0905 生成游戲代碼（部分截圖）

在網(wǎng)頁端實現(xiàn)的效果堪稱驚艷，不僅實現(xiàn)了浩瀚星空的背景，高速移動的拖影，概率出現(xiàn)的回血道具，還有不同顏色的敵人爆炸效果，甚至玩得好的話還有連擊加分。

我們試著玩了好一會兒，困難模式真的挺難的。

根據(jù)知名博主「karminski - 牙醫(yī)」的測試，Kimi-K2-0905 前端水平有了顯著的提升，空間理解能力和召回能力都有所增強。

在需要生成超過一千行代碼的「鞭炮連鎖爆炸測試」中，Kimi-K2-0905 表現(xiàn)優(yōu)秀。

原貼地址：https://x.com/karminski3/status/1963834619276709933?s=46

Kimi-K2-0905 此次還在 API 定價上打出了競爭性優(yōu)勢。

據(jù)我們了解，Kimi 開放平臺上架的 kimi-k2-0905-preview 模型 API，定價與上一代一致，計費方案為緩存未命中時每百萬輸入 tokens/4 元，緩存命中時每百萬輸入 tokens/1 元，每百萬輸出 tokens/16 元。詳細的定價策略參考下圖：

以美元計價的價格與國內(nèi)價格比較接近。

相較于 Anthropic 堪稱夸張的定價，Kimi 等國產(chǎn)編程模型稱得上是「開源 Claude 平替」，并且能夠?qū)崿F(xiàn)全方位兼容 Anthropic API 和 Claude Code，延續(xù)開發(fā)者曾經(jīng)的使用習(xí)慣。

尤其是在 Anthropic 對國內(nèi)和其他地區(qū)「斷供」的大背景下，讓現(xiàn)有項目和工作流平穩(wěn)落地的重要性不言而喻。

結(jié)語

在 AI 編程領(lǐng)域，國內(nèi)的 AI 廠商都有自己的理解。大概分為兩個方向，一部分廠商在產(chǎn)品和用戶體驗側(cè)發(fā)力；另一部分則是打磨基礎(chǔ)模型。

例如騰訊和字節(jié)對自家編碼產(chǎn)品的更新主要集中在產(chǎn)品側(cè)，字節(jié)更新 Trae Solo 版本、騰訊發(fā)布 CodeBuddy IDE 等等，都是試圖超越 Cursor 核心競爭力的嘗試。

與之對應(yīng)，以月之暗面為代表的 AI 新勢力，選擇了一條更為直接的發(fā)展道路：通過技術(shù)創(chuàng)新與極限性能打磨，力求在大模型核心能力上與國際一線廠商（如 Anthropic）一較高低。

無論是上下文窗口的持續(xù)擴展，還是針對真實編程任務(wù)、Agent 工具調(diào)用等的專門優(yōu)化，國內(nèi)玩家正在取得逼近甚至超越海外同類產(chǎn)品的表現(xiàn)。

同時，主流 AI 編程工具，如 Cursor、Windsurf、Trae、Cline 等，以及第三方 Agent 產(chǎn)品，如 flowith 和 Genspark 等，也都在主動接入國內(nèi)優(yōu)秀的大模型，中國 AI 新勢力已深度融入主流開發(fā)與應(yīng)用生態(tài)。

如今，國產(chǎn)大模型不僅能在性能參數(shù)上趕超國際領(lǐng)先者，也能在實際開發(fā)體驗上獲得更多認(rèn)可。這樣的「正反饋循環(huán)」一旦形成，則有望快速積累開發(fā)者口碑，創(chuàng)建更繁榮的應(yīng)用生態(tài)，進一步撬動更廣闊的市場。

贊(3524)

未經(jīng)允許不得轉(zhuǎn)載：>晨兢夕厲網(wǎng)»Claude不讓我們用！國產(chǎn)平替能頂上嗎？

国产草莓视频在线观看_欧美同性videos免费播放_免费一级毛片激情永久_国产特级全黄一线毛片_精品少妇影视免费_2020无码专区人妻日韩_最新国产网站_刘亦菲激情旡码大片_中文无码视频互动交流_欧美日韩激情aⅤ综合在线