国产草莓视频在线观看_欧美同性videos免费播放_免费一级毛片激情永久_国产特级全黄一线毛片_精品少妇影视免费_2020无码专区人妻日韩_最新国产网站_刘亦菲激情旡码大片_中文无码视频互动交流_欧美日韩激情aⅤ综合在线

  • 猴年馬月網(wǎng)猴年馬月網(wǎng)

    拜拜Claude!阿里最強(qiáng)萬(wàn)億模型編程秒了Opus4,實(shí)測(cè)在此

    總參數(shù)達(dá)到1萬(wàn)億,阿里迄今為止最大的模型來(lái)了!

    沒(méi)錯(cuò),就是前幾日大家期待已久的Qwen3-Max-Preview (Instruct)。

    1萬(wàn)億啥概念?幾乎一下子就比前一代Qwen3(235B)多了四倍之多,相當(dāng)于給大學(xué)生換了個(gè)愛(ài)因斯坦的腦子(bushi~

    根據(jù)官方介紹,其最大亮點(diǎn)如下:

    相較于2.5系列,新版本在中英文理解、復(fù)雜指令遵循、工具調(diào)用等維度實(shí)現(xiàn)了顯著增強(qiáng),同時(shí)大幅減少了知識(shí)幻覺(jué),讓模型更智能、更可靠。

    而且發(fā)布即全面上線,目前可通過(guò)通義APP、 Qwen Chat網(wǎng)頁(yè)和阿里云API體驗(yàn)。

    更多官方測(cè)評(píng)顯示,Qwen3-Max-Preview一登場(chǎng)不僅比自家前一代最強(qiáng)模型Qwen3(235B)更強(qiáng),而且還打敗了包括Claude Opus 4在內(nèi)的國(guó)內(nèi)外勁敵。

    國(guó)內(nèi)外反響更是一片熱烈,隨之而來(lái)的還有一大波測(cè)評(píng):

    1萬(wàn)億!模型規(guī)模真是越來(lái)越擴(kuò)張了,迫不及待想要嘗試。

    Qwen再次令人驚嘆!

    so,模型真實(shí)效果如何?不妨簡(jiǎn)單實(shí)測(cè)一下見(jiàn)真章。

    支持多模態(tài),編程已無(wú)需抽卡

    綜合官方測(cè)評(píng)和網(wǎng)友反饋,接下來(lái)我們主要考查Qwen3-Max-Preview解答難題和動(dòng)手編程的能力。

    需要提醒一下,阿里從Qwen3(235B)開(kāi)始就不再使用混合思維模式,所以這次的Instruct版本僅支持非思考模式。

    使用Qwen Chat網(wǎng)頁(yè),一上來(lái)就給它扔一道AIME數(shù)學(xué)競(jìng)賽題試試:

    (AIME:美國(guó)數(shù)學(xué)邀請(qǐng)賽,是介于AMC10、AMC12及美國(guó)數(shù)學(xué)奧林匹克競(jìng)賽之間的一個(gè)數(shù)學(xué)競(jìng)賽。)

    由于Qwen3-Max-Preview支持多模態(tài),這里我們可以直接上傳圖片。

    幾乎轉(zhuǎn)眼間,模型就唰唰唰地給出了詳細(xì)作答過(guò)程及結(jié)果,最終答案“204”也與AIME這道題的標(biāo)準(zhǔn)答案一致。

    小試牛刀過(guò)后,接下來(lái)進(jìn)入編程環(huán)節(jié)。

    用p5js創(chuàng)建多彩的可交互動(dòng)畫(huà)。

    速度同樣很快,Qwen3-Max-Preview幾乎立即給出了一段完整代碼,而且代碼能夠成功運(yùn)行。

    鼠標(biāo)點(diǎn)到哪里,哪里就會(huì)產(chǎn)生交互效果:

    生成一個(gè)掃雷游戲。

    一句話制作掃雷這種經(jīng)典小游戲也是輕輕松松,而且是一次成功,無(wú)需反復(fù)溝通和抽卡。

    代碼成功運(yùn)行后,我們也簡(jiǎn)單試玩了一下,只是很快就“踩雷”了(doge):

    最后來(lái)試試制作前端網(wǎng)頁(yè),不妨就讓它來(lái)個(gè)自我介紹:

    幫我制作一個(gè)介紹Qwen3-Max-Preview的可交互網(wǎng)站。

    網(wǎng)站代碼生成后,既可以保存成文件直接打開(kāi),還能在問(wèn)答末尾點(diǎn)擊“預(yù)覽”一鍵查看效果。

    預(yù)覽效果如下,網(wǎng)站設(shè)計(jì)簡(jiǎn)潔直觀,也具有初級(jí)交互效果:

    當(dāng)然,如果你更懂提示詞,效果也會(huì)更好,某網(wǎng)友為Qwen3-Max-Preview制作的慶祝網(wǎng)頁(yè)效果就還不錯(cuò)。

    順帶一提,還有人對(duì)Qwen3-Max-Preview的生成速度進(jìn)行了實(shí)際評(píng)估,大家可以感受一下:

    以>107個(gè)token/秒的速度生成4467個(gè)token。

    以上實(shí)測(cè)不難看出新模型確實(shí)能力更強(qiáng)了,尤其在編程方面,所有嘗試都是一次成功。

    此外,阿里云百煉平臺(tái)還透露了模型的API價(jià)格——當(dāng)前版本根據(jù)輸入Token數(shù),采取階梯計(jì)費(fèi)。

    原生支持的上下文長(zhǎng)度及最大輸入/輸出如下:

    雖然目前官方并未正式宣布開(kāi)源這款模型,但Qwen身為開(kāi)源陣營(yíng)的重要一員,其后續(xù)仍然值得期待。

    One More Thing

    就在Qwen3-Max-Preview基礎(chǔ)版發(fā)布后,通義千問(wèn)開(kāi)源負(fù)責(zé)人林俊旸還在朋友圈透露其正式版很快到來(lái)。

    而且還表達(dá)了自己對(duì)這款模型的感受:

    確實(shí)是我們搞過(guò)的最有趣的模型,(雖然)配方上沒(méi)有大改,但比之前的235B版本明顯好了不少。

    這也讓他對(duì)繼續(xù)擴(kuò)展模型規(guī)模充滿信心。

    另外,關(guān)于正式版人們現(xiàn)在也有了更多推測(cè)。

    按照官方之前的節(jié)奏,預(yù)計(jì)大概率后面還有一個(gè)推理版本,而且或許就在幾天之后。(Qwen3-235B推理非推理中間僅隔了4天)

    最后,你體驗(yàn)這款新模型了嗎?歡迎回評(píng)論區(qū)分享一波~

    立即體驗(yàn):Qwen Chat:https://chat.qwen.ai阿里云百煉API服務(wù):https://bailian.console.aliyun.com/?tab=model#/model-market

    贊(7256)
    未經(jīng)允許不得轉(zhuǎn)載:>猴年馬月網(wǎng)»拜拜Claude!阿里最強(qiáng)萬(wàn)億模型編程秒了Opus4,實(shí)測(cè)在此