国产草莓视频在线观看_欧美同性videos免费播放_免费一级毛片激情永久_国产特级全黄一线毛片_精品少妇影视免费_2020无码专区人妻日韩_最新国产网站_刘亦菲激情旡码大片_中文无码视频互动交流_欧美日韩激情aⅤ综合在线

  • 拜拜Claude!阿里最強(qiáng)萬億模型編程秒了Opus4,實(shí)測在此

      發(fā)布時(shí)間:2025-09-06 14:43:49   作者:玩站小弟   我要評(píng)論
    9月3日晚,紀(jì)念抗日戰(zhàn)爭勝利80周年“正義必勝”文藝匯演在人。

    總參數(shù)達(dá)到1萬億,阿里迄今為止最大的模型來了!

    沒錯(cuò),就是前幾日大家期待已久的Qwen3-Max-Preview (Instruct)。

    1萬億啥概念?幾乎一下子就比前一代Qwen3(235B)多了四倍之多,相當(dāng)于給大學(xué)生換了個(gè)愛因斯坦的腦子(bushi~

    根據(jù)官方介紹,其最大亮點(diǎn)如下:

    相較于2.5系列,新版本在中英文理解、復(fù)雜指令遵循、工具調(diào)用等維度實(shí)現(xiàn)了顯著增強(qiáng),同時(shí)大幅減少了知識(shí)幻覺,讓模型更智能、更可靠。

    而且發(fā)布即全面上線,目前可通過通義APP、 Qwen Chat網(wǎng)頁和阿里云API體驗(yàn)。

    更多官方測評(píng)顯示,Qwen3-Max-Preview一登場不僅比自家前一代最強(qiáng)模型Qwen3(235B)更強(qiáng),而且還打敗了包括Claude Opus 4在內(nèi)的國內(nèi)外勁敵。

    國內(nèi)外反響更是一片熱烈,隨之而來的還有一大波測評(píng):

    1萬億!模型規(guī)模真是越來越擴(kuò)張了,迫不及待想要嘗試。

    Qwen再次令人驚嘆!

    so,模型真實(shí)效果如何?不妨簡單實(shí)測一下見真章。

    支持多模態(tài),編程已無需抽卡

    綜合官方測評(píng)和網(wǎng)友反饋,接下來我們主要考查Qwen3-Max-Preview解答難題和動(dòng)手編程的能力。

    需要提醒一下,阿里從Qwen3(235B)開始就不再使用混合思維模式,所以這次的Instruct版本僅支持非思考模式。

    使用Qwen Chat網(wǎng)頁,一上來就給它扔一道AIME數(shù)學(xué)競賽題試試:

    (AIME:美國數(shù)學(xué)邀請(qǐng)賽,是介于AMC10、AMC12及美國數(shù)學(xué)奧林匹克競賽之間的一個(gè)數(shù)學(xué)競賽。)

    由于Qwen3-Max-Preview支持多模態(tài),這里我們可以直接上傳圖片。

    幾乎轉(zhuǎn)眼間,模型就唰唰唰地給出了詳細(xì)作答過程及結(jié)果,最終答案“204”也與AIME這道題的標(biāo)準(zhǔn)答案一致。

    小試牛刀過后,接下來進(jìn)入編程環(huán)節(jié)。

    用p5js創(chuàng)建多彩的可交互動(dòng)畫。

    速度同樣很快,Qwen3-Max-Preview幾乎立即給出了一段完整代碼,而且代碼能夠成功運(yùn)行。

    鼠標(biāo)點(diǎn)到哪里,哪里就會(huì)產(chǎn)生交互效果:

    生成一個(gè)掃雷游戲。

    一句話制作掃雷這種經(jīng)典小游戲也是輕輕松松,而且是一次成功,無需反復(fù)溝通和抽卡。

    代碼成功運(yùn)行后,我們也簡單試玩了一下,只是很快就“踩雷”了(doge):

    最后來試試制作前端網(wǎng)頁,不妨就讓它來個(gè)自我介紹:

    幫我制作一個(gè)介紹Qwen3-Max-Preview的可交互網(wǎng)站。

    網(wǎng)站代碼生成后,既可以保存成文件直接打開,還能在問答末尾點(diǎn)擊“預(yù)覽”一鍵查看效果。

    預(yù)覽效果如下,網(wǎng)站設(shè)計(jì)簡潔直觀,也具有初級(jí)交互效果:

    當(dāng)然,如果你更懂提示詞,效果也會(huì)更好,某網(wǎng)友為Qwen3-Max-Preview制作的慶祝網(wǎng)頁效果就還不錯(cuò)。

    順帶一提,還有人對(duì)Qwen3-Max-Preview的生成速度進(jìn)行了實(shí)際評(píng)估,大家可以感受一下:

    以>107個(gè)token/秒的速度生成4467個(gè)token。

    以上實(shí)測不難看出新模型確實(shí)能力更強(qiáng)了,尤其在編程方面,所有嘗試都是一次成功。

    此外,阿里云百煉平臺(tái)還透露了模型的API價(jià)格——當(dāng)前版本根據(jù)輸入Token數(shù),采取階梯計(jì)費(fèi)。

    原生支持的上下文長度及最大輸入/輸出如下:

    雖然目前官方并未正式宣布開源這款模型,但Qwen身為開源陣營的重要一員,其后續(xù)仍然值得期待。

    One More Thing

    就在Qwen3-Max-Preview基礎(chǔ)版發(fā)布后,通義千問開源負(fù)責(zé)人林俊旸還在朋友圈透露其正式版很快到來。

    而且還表達(dá)了自己對(duì)這款模型的感受:

    確實(shí)是我們搞過的最有趣的模型,(雖然)配方上沒有大改,但比之前的235B版本明顯好了不少。

    這也讓他對(duì)繼續(xù)擴(kuò)展模型規(guī)模充滿信心。

    另外,關(guān)于正式版人們現(xiàn)在也有了更多推測。

    按照官方之前的節(jié)奏,預(yù)計(jì)大概率后面還有一個(gè)推理版本,而且或許就在幾天之后。(Qwen3-235B推理非推理中間僅隔了4天)

    最后,你體驗(yàn)這款新模型了嗎?歡迎回評(píng)論區(qū)分享一波~

    立即體驗(yàn):Qwen Chat:https://chat.qwen.ai阿里云百煉API服務(wù):https://bailian.console.aliyun.com/?tab=model#/model-market