国产草莓视频在线观看_欧美同性videos免费播放_免费一级毛片激情永久_国产特级全黄一线毛片_精品少妇影视免费_2020无码专区人妻日韩_最新国产网站_刘亦菲激情旡码大片_中文无码视频互动交流_欧美日韩激情aⅤ综合在线

  • 晨兢夕厲網(wǎng)晨兢夕厲網(wǎng)

    Claude不讓我們用!國產(chǎn)平替能頂上嗎?

    機器之心報道

    作者:冷貓、杜偉

    這幾天,全球 AI 代碼生成的競爭格局,迎來了新的拐點。

    在編程領(lǐng)域,曾被視為王者的 Anthropic,似乎正在一步步失去昔日的鋒芒,地位開始動搖。

    這一方面源于 OpenAI GPT-5 系列模型的強勢崛起,在與 Claude Code 的對戰(zhàn)中大有「后來者居上」之勢,AI 大神 Karpathy 現(xiàn)身說法并開始安利 GPT-5 Pro 的強大代碼能力。

    另一方面則是 Anthropic 自身的一系列迷之操作,先是放任并承認(rèn)自家模型(包括 Claude Opus 4.1 和 Opus 4)降智,本周又宣布向包括中國在內(nèi)的部分地區(qū)限制其 AI 產(chǎn)品和服務(wù)的使用。

    在這個微妙的時間節(jié)點,多家國產(chǎn)大模型廠商向 Anthropic 發(fā)起了一波正面狙擊。月之暗面發(fā)布了 Kimi-K2-0905 版本、阿里發(fā)布了超萬億參數(shù)的 Qwen3-Max-Preview。

    前者作為 Kimi-K2 系列模型的最新版本,將上下文長度擴展到了 256k,針對前端開發(fā)等實際編程任務(wù)做了優(yōu)化,長代碼生成中的正確性、穩(wěn)定性和邏輯一致性較以往版本有了提升。后者是阿里迄今最大的模型,同樣提升了通用知識、數(shù)學(xué)推理、編程等多種任務(wù)的表現(xiàn)。

    可以看到,國產(chǎn)大模型廠商近來集中在代碼生成任務(wù)上發(fā)力。Kimi-K2-0905 強調(diào)了工具調(diào)用能力,并提升了模型與 Agent 框架(如 Roo Code)的集成性。

    在使用該模型調(diào)用外部工具時,格式正確率現(xiàn)在可以達到 100%,不再需求人工修正。它還完全兼容 Anthropic API,方便接入與遷移。對 WebSearch Tool 的支持,可以通過實時信息檢索提升任務(wù)效果。

    隨著 0905 版本的發(fā)布,近 30 天 Kimi-K2 系列模型在 Hugging Face 中的下載量超過了 39 萬。

    對于最新的 Kimi-K2-0905,有人直言「終于不用再為處理復(fù)雜的長任務(wù)而感到挫敗了?!?/p>

    此消彼長,隨著國產(chǎn)大模型在代碼生成領(lǐng)域持續(xù)發(fā)力,全球競爭的格局也許真的要變一變了。

    能力、價格雙優(yōu)勢,讓國產(chǎn)大模型更能打

    作為 Kimi K2 系列中最新的版本,Kimi-K2-0905 與其他國產(chǎn)大模型廠商的新模型(如 Qwen3-Max-Preview)一樣,向曾經(jīng)的王者 Claude 的傳統(tǒng)優(yōu)勢區(qū)間發(fā)起挑戰(zhàn),強調(diào)智能編程領(lǐng)域的性能提升。

    從技術(shù)細節(jié)上來看,Kimi-K2-0905 沿用了目前主流的 MoE 架構(gòu),參數(shù)規(guī)模為萬億級別,在推理時實際被激活的參數(shù)為 320 億。

    參數(shù)概覽

    從該模型與 Claude Sonnet 4 在 SWE-bench Verified 等真實編程基準(zhǔn)的對比中發(fā)現(xiàn),Kimi-K2-0905 在部分測試中(如多語言環(huán)境、命令行 / 終端交互)甚至超過了這個競爭對手。

    實戰(zhàn)表現(xiàn)究竟如何?我們用它做了個經(jīng)典小游戲。

    指令很簡單:「制作一個和微信打飛機類似的網(wǎng)頁小游戲,需要美觀,好玩,功能齊全?!?/p>

    Kimi-K2-0905 生成游戲代碼(部分截圖)

    在網(wǎng)頁端實現(xiàn)的效果堪稱驚艷,不僅實現(xiàn)了浩瀚星空的背景,高速移動的拖影,概率出現(xiàn)的回血道具,還有不同顏色的敵人爆炸效果,甚至玩得好的話還有連擊加分。

    我們試著玩了好一會兒,困難模式真的挺難的。

    根據(jù)知名博主「karminski - 牙醫(yī)」的測試,Kimi-K2-0905 前端水平有了顯著的提升,空間理解能力和召回能力都有所增強。

    在需要生成超過一千行代碼的「鞭炮連鎖爆炸測試」中,Kimi-K2-0905 表現(xiàn)優(yōu)秀。

    原貼地址:https://x.com/karminski3/status/1963834619276709933?s=46

    Kimi-K2-0905 此次還在 API 定價上打出了競爭性優(yōu)勢。

    據(jù)我們了解,Kimi 開放平臺上架的 kimi-k2-0905-preview 模型 API,定價與上一代一致,計費方案為緩存未命中時每百萬輸入 tokens/4 元,緩存命中時每百萬輸入 tokens/1 元,每百萬輸出 tokens/16 元。詳細的定價策略參考下圖:

    以美元計價的價格與國內(nèi)價格比較接近。

    相較于 Anthropic 堪稱夸張的定價,Kimi 等國產(chǎn)編程模型稱得上是「開源 Claude 平替」,并且能夠?qū)崿F(xiàn)全方位兼容 Anthropic API 和 Claude Code,延續(xù)開發(fā)者曾經(jīng)的使用習(xí)慣。

    尤其是在 Anthropic 對國內(nèi)和其他地區(qū)「斷供」的大背景下,讓現(xiàn)有項目和工作流平穩(wěn)落地的重要性不言而喻。

    結(jié)語

    在 AI 編程領(lǐng)域,國內(nèi)的 AI 廠商都有自己的理解。大概分為兩個方向,一部分廠商在產(chǎn)品和用戶體驗側(cè)發(fā)力;另一部分則是打磨基礎(chǔ)模型。

    例如騰訊和字節(jié)對自家編碼產(chǎn)品的更新主要集中在產(chǎn)品側(cè),字節(jié)更新 Trae Solo 版本、騰訊發(fā)布 CodeBuddy IDE 等等,都是試圖超越 Cursor 核心競爭力的嘗試。

    與之對應(yīng),以月之暗面為代表的 AI 新勢力,選擇了一條更為直接的發(fā)展道路:通過技術(shù)創(chuàng)新與極限性能打磨,力求在大模型核心能力上與國際一線廠商(如 Anthropic)一較高低。

    無論是上下文窗口的持續(xù)擴展,還是針對真實編程任務(wù)、Agent 工具調(diào)用等的專門優(yōu)化,國內(nèi)玩家正在取得逼近甚至超越海外同類產(chǎn)品的表現(xiàn)。

    同時,主流 AI 編程工具,如 Cursor、Windsurf、Trae、Cline 等,以及第三方 Agent 產(chǎn)品,如 flowith 和 Genspark 等,也都在主動接入國內(nèi)優(yōu)秀的大模型,中國 AI 新勢力已深度融入主流開發(fā)與應(yīng)用生態(tài)。

    如今,國產(chǎn)大模型不僅能在性能參數(shù)上趕超國際領(lǐng)先者,也能在實際開發(fā)體驗上獲得更多認(rèn)可。這樣的「正反饋循環(huán)」一旦形成,則有望快速積累開發(fā)者口碑,創(chuàng)建更繁榮的應(yīng)用生態(tài),進一步撬動更廣闊的市場。

    贊(3524)
    未經(jīng)允許不得轉(zhuǎn)載:>晨兢夕厲網(wǎng)»Claude不讓我們用!國產(chǎn)平替能頂上嗎?