拜拜Claude！阿里最強(qiáng)萬(wàn)億模型編程秒了Opus4，實(shí)測(cè)在此

2025-09-06 12:24:41分類：通遼閱讀(81708)

總參數(shù)達(dá)到1萬(wàn)億，阿里迄今為止最大的模型來(lái)了！

沒(méi)錯(cuò)，就是前幾日大家期待已久的Qwen3-Max-Preview （Instruct）。

1萬(wàn)億啥概念？幾乎一下子就比前一代Qwen3（235B）多了四倍之多，相當(dāng)于給大學(xué)生換了個(gè)愛(ài)因斯坦的腦子（bushi~

根據(jù)官方介紹，其最大亮點(diǎn)如下：

相較于2.5系列，新版本在中英文理解、復(fù)雜指令遵循、工具調(diào)用等維度實(shí)現(xiàn)了顯著增強(qiáng)，同時(shí)大幅減少了知識(shí)幻覺(jué)，讓模型更智能、更可靠。

而且發(fā)布即全面上線，目前可通過(guò)通義APP、 Qwen Chat網(wǎng)頁(yè)和阿里云API體驗(yàn)。

更多官方測(cè)評(píng)顯示，Qwen3-Max-Preview一登場(chǎng)不僅比自家前一代最強(qiáng)模型Qwen3（235B）更強(qiáng)，而且還打敗了包括Claude Opus 4在內(nèi)的國(guó)內(nèi)外勁敵。

國(guó)內(nèi)外反響更是一片熱烈，隨之而來(lái)的還有一大波測(cè)評(píng)：

1萬(wàn)億！模型規(guī)模真是越來(lái)越擴(kuò)張了，迫不及待想要嘗試。

Qwen再次令人驚嘆！

so，模型真實(shí)效果如何？不妨簡(jiǎn)單實(shí)測(cè)一下見(jiàn)真章。

支持多模態(tài)，編程已無(wú)需抽卡

綜合官方測(cè)評(píng)和網(wǎng)友反饋，接下來(lái)我們主要考查Qwen3-Max-Preview解答難題和動(dòng)手編程的能力。

需要提醒一下，阿里從Qwen3（235B）開(kāi)始就不再使用混合思維模式，所以這次的Instruct版本僅支持非思考模式。

使用Qwen Chat網(wǎng)頁(yè)，一上來(lái)就給它扔一道AIME數(shù)學(xué)競(jìng)賽題試試：

（AIME：美國(guó)數(shù)學(xué)邀請(qǐng)賽，是介于AMC10、AMC12及美國(guó)數(shù)學(xué)奧林匹克競(jìng)賽之間的一個(gè)數(shù)學(xué)競(jìng)賽。）

由于Qwen3-Max-Preview支持多模態(tài)，這里我們可以直接上傳圖片。

幾乎轉(zhuǎn)眼間，模型就唰唰唰地給出了詳細(xì)作答過(guò)程及結(jié)果，最終答案“204”也與AIME這道題的標(biāo)準(zhǔn)答案一致。

小試牛刀過(guò)后，接下來(lái)進(jìn)入編程環(huán)節(jié)。

用p5js創(chuàng)建多彩的可交互動(dòng)畫(huà)。

速度同樣很快，Qwen3-Max-Preview幾乎立即給出了一段完整代碼，而且代碼能夠成功運(yùn)行。

鼠標(biāo)點(diǎn)到哪里，哪里就會(huì)產(chǎn)生交互效果：

生成一個(gè)掃雷游戲。

一句話制作掃雷這種經(jīng)典小游戲也是輕輕松松，而且是一次成功，無(wú)需反復(fù)溝通和抽卡。

代碼成功運(yùn)行后，我們也簡(jiǎn)單試玩了一下，只是很快就“踩雷”了(doge）：

最后來(lái)試試制作前端網(wǎng)頁(yè)，不妨就讓它來(lái)個(gè)自我介紹：

幫我制作一個(gè)介紹Qwen3-Max-Preview的可交互網(wǎng)站。

網(wǎng)站代碼生成后，既可以保存成文件直接打開(kāi)，還能在問(wèn)答末尾點(diǎn)擊“預(yù)覽”一鍵查看效果。

預(yù)覽效果如下，網(wǎng)站設(shè)計(jì)簡(jiǎn)潔直觀，也具有初級(jí)交互效果：

當(dāng)然，如果你更懂提示詞，效果也會(huì)更好，某網(wǎng)友為Qwen3-Max-Preview制作的慶祝網(wǎng)頁(yè)效果就還不錯(cuò)。

順帶一提，還有人對(duì)Qwen3-Max-Preview的生成速度進(jìn)行了實(shí)際評(píng)估，大家可以感受一下：

以>107個(gè)token/秒的速度生成4467個(gè)token。

以上實(shí)測(cè)不難看出新模型確實(shí)能力更強(qiáng)了，尤其在編程方面，所有嘗試都是一次成功。

此外，阿里云百煉平臺(tái)還透露了模型的API價(jià)格——當(dāng)前版本根據(jù)輸入Token數(shù)，采取階梯計(jì)費(fèi)。

原生支持的上下文長(zhǎng)度及最大輸入/輸出如下：

雖然目前官方并未正式宣布開(kāi)源這款模型，但Qwen身為開(kāi)源陣營(yíng)的重要一員，其后續(xù)仍然值得期待。

One More Thing

就在Qwen3-Max-Preview基礎(chǔ)版發(fā)布后，通義千問(wèn)開(kāi)源負(fù)責(zé)人林俊旸還在朋友圈透露其正式版很快到來(lái)。

而且還表達(dá)了自己對(duì)這款模型的感受：

確實(shí)是我們搞過(guò)的最有趣的模型，（雖然）配方上沒(méi)有大改，但比之前的235B版本明顯好了不少。

這也讓他對(duì)繼續(xù)擴(kuò)展模型規(guī)模充滿信心。

另外，關(guān)于正式版人們現(xiàn)在也有了更多推測(cè)。

按照官方之前的節(jié)奏，預(yù)計(jì)大概率后面還有一個(gè)推理版本，而且或許就在幾天之后。（Qwen3-235B推理非推理中間僅隔了4天）

最后，你體驗(yàn)這款新模型了嗎？歡迎回評(píng)論區(qū)分享一波~

立即體驗(yàn)：Qwen Chat：https://chat.qwen.ai阿里云百煉API服務(wù)：https://bailian.console.aliyun.com/?tab=model#/model-market

贊(7256)

未經(jīng)允許不得轉(zhuǎn)載：>猴年馬月網(wǎng)»拜拜Claude！阿里最強(qiáng)萬(wàn)億模型編程秒了Opus4，實(shí)測(cè)在此

国产草莓视频在线观看_欧美同性videos免费播放_免费一级毛片激情永久_国产特级全黄一线毛片_精品少妇影视免费_2020无码专区人妻日韩_最新国产网站_刘亦菲激情旡码大片_中文无码视频互动交流_欧美日韩激情aⅤ综合在线