国产草莓视频在线观看_欧美同性videos免费播放_免费一级毛片激情永久_国产特级全黄一线毛片_精品少妇影视免费_2020无码专区人妻日韩_最新国产网站_刘亦菲激情旡码大片_中文无码视频互动交流_欧美日韩激情aⅤ综合在线

  • 實(shí)測(cè)阿里萬億參數(shù)大模型:開源路線跑通了嗎?

      發(fā)布時(shí)間:2025-09-07 03:30:57   作者:玩站小弟   我要評(píng)論
    9月5日訊 皇馬新援中衛(wèi)赫伊森在加盟球隊(duì)后表現(xiàn)搶眼,數(shù)據(jù)統(tǒng)計(jì)。

    文 | 劃重點(diǎn)KeyPoints

    劃重點(diǎn):

    1、阿里發(fā)布史上最大模型,參數(shù)量超過1萬億,編程能力直接反超Claude,證明Scaling Law依舊在奏效。 2、阿里“模+云”的策略形成了從技術(shù)研發(fā)到商業(yè)化落地的最短路徑,是Qwen能夠取得后來者居上成績(jī)的關(guān)鍵之一。 3、阿里開源模式的核心挑戰(zhàn)在于如何平衡開放與收益。Qwen未來不僅需要在技術(shù)上持續(xù)突破,更需要在商業(yè)模式和組織能力上證明自己。

    昨天Anthropic剛玩了一手“極端措施”,阿里深夜一波大的直接反手一記重拳——推出其史上最大的模型,Qwen3-Max-Preview,參數(shù)量足足超1萬億!

    用“通義大模型”微信公眾號(hào)官方的標(biāo)題來形容它的能力,就是“強(qiáng)得不止一點(diǎn)”。

    因?yàn)閺幕鶞?zhǔn)測(cè)試結(jié)果來看,Qwen3-Max-Preview已經(jīng)超越了此前自家的Qwen3-235B-A22B-2507。

    并且官方還放出了與Kimi K2、Claude Opus 4(Non-thinking),以及DeepSeek-V3.1的對(duì)比結(jié)果。

    從下面的表格中不難看出,Qwen3-Max-Preview已經(jīng)在SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2和LiveBench等基準(zhǔn)測(cè)試中,均超越了其它選手。

    尤其是在編程能力方面,此前Claude默認(rèn)是業(yè)內(nèi)最強(qiáng),這次Qwen3-Max-Preview直接以大力出奇跡的方式實(shí)現(xiàn)了反超,也是讓一眾網(wǎng)友驚嘆不已。

    Qwen在X上的推文中似乎也是一語(yǔ)道破“玄機(jī)”:Scaling works(規(guī)?;瘮U(kuò)展是有效的)。

    01 實(shí)測(cè)阿里史上最大模型

    目前,Qwen3-Max-Preview已經(jīng)可以體驗(yàn),只需在模型下拉選項(xiàng)中選擇即可:

    體驗(yàn)地址:https://chat.qwen.ai

    并且官方的API服務(wù)也已經(jīng)開放:https://bailian.console.aliyun.com/?tab=model#/model-market(搜索Qwen3-Max-Preview)。

    在實(shí)際效果方面,已經(jīng)有不少國(guó)內(nèi)外的網(wǎng)友們展開了實(shí)測(cè);例如X上的知名博主AK,他就在HuggingFace集成了Qwen3-Max-Preview的項(xiàng)目AnyCoder中,輸入了這樣的Prompt:

    Design and create a very creative, elaborate, and detailed voxel art scene of a pagoda in a beautiful garden with trees, including some cherry blossoms. Make the scene impressive and varied and use colorful voxels. Use whatever libraries to get this done.

    然后,據(jù)AK的描述,Qwen3-Max-Preview一次性就實(shí)現(xiàn)了如下的效果:

    當(dāng)我們?cè)诠倬W(wǎng)中輸入這樣的Prompt:

    Create a beautiful celebratory landing page for the launch of Qwen3 Max.

    只需短短幾秒鐘的時(shí)間,Qwen3-Max-Preview就生成了一個(gè)完整的慶祝頁(yè)面,響應(yīng)速度實(shí)測(cè)是非常快的:

    接下來,我們加大難度,直接上經(jīng)典的編程問題——彈跳球模擬碰撞。

    先小試牛刀一個(gè):

    Write a javascript code that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically, implement it in javascript and html.

    可以看到,小球會(huì)基于物理規(guī)律在六邊形的框內(nèi)運(yùn)行;并且在用“向上鍵”去給小球一個(gè)力時(shí),它也能立即做出響應(yīng)。

    當(dāng)我們把球的數(shù)量設(shè)置到10個(gè),一次性生成的效果也是相當(dāng)自然:

    最后,我們?cè)僮孮wen3-Max-Preview生成一個(gè)小游戲:

    做一個(gè)《憤怒的小鳥》的小游戲。

    不過雖然是一次性生成成功,但或許因?yàn)镻rompt過于簡(jiǎn)單,這個(gè)小游戲還是有一些小瑕疵,例如怪物的位置不是很準(zhǔn)確;感興趣的小伙伴可以多次嘗試一下。

    02 Qwen憑什么后來者居上?

    從這次阿里直接從千億參數(shù)模型飆升到萬億規(guī)模(近四倍提升),并且一舉在眾多評(píng)測(cè)中拿下第一來看,Qwen已然在全球范圍內(nèi)站穩(wěn)了第一梯隊(duì)的位置。

    但有一說一,縱觀整場(chǎng)AI大模型的競(jìng)賽,阿里并不是最早在中國(guó)推出對(duì)標(biāo)ChatGPT產(chǎn)品的公司,但絕對(duì)屬于后來者居上的那一個(gè)。

    相較于國(guó)內(nèi)先行者(如百度),阿里大模型初期可以說是相對(duì)低調(diào),不過它的路徑卻是格外的清晰——用模型開源來構(gòu)建生態(tài),用自研閉源探索技術(shù)前沿。

    例如在開源這件事上,從2023年開始,Qwen就以驚人的速度向全球開發(fā)者開源多個(gè)版本模型。從70億參數(shù)的Qwen-7B到140億、720億參數(shù),再到視覺、音頻等多模態(tài)模型,幾乎覆蓋所有主流尺寸和應(yīng)用場(chǎng)景。更關(guān)鍵的是,阿里不僅開源模型權(quán)重,還開放商業(yè)化授權(quán),極大激發(fā)了中小企業(yè)和個(gè)人開發(fā)者的熱情。

    這一系列動(dòng)作讓它迅速在Hugging Face等全球頂級(jí)開源社區(qū)建立廣泛影響力,吸引了大量開發(fā)者圍繞Qwen生態(tài)創(chuàng)新開發(fā),形成強(qiáng)大社區(qū)驅(qū)動(dòng)力。這種廣積糧的策略為通義千問贏得了寶貴的開發(fā)者心智和應(yīng)用場(chǎng)景數(shù)據(jù),這可以說是閉源模型難以企及的優(yōu)勢(shì)。

    但在開源之外,阿里內(nèi)部也從沒有停止對(duì)模型能力上限的探索。正如官方發(fā)布萬億參數(shù)模型時(shí)所言,Scaling works(規(guī)模化擴(kuò)展有效)。這背后是對(duì)Scaling Law的一種篤信——隨著模型參數(shù)、數(shù)據(jù)量和計(jì)算量指數(shù)級(jí)增長(zhǎng),模型能力會(huì)涌現(xiàn)質(zhì)的飛躍。

    訓(xùn)練Qwen3 Max Preview這樣的萬億參數(shù)模型,不僅是資源堆砌,更要求在超大規(guī)模計(jì)算集群穩(wěn)定性、分布式訓(xùn)練算法效率、數(shù)據(jù)處理精細(xì)度以及工程優(yōu)化的每個(gè)細(xì)節(jié)上都做到極致。

    這背后是阿里數(shù)年來在算力基礎(chǔ)設(shè)施上的巨大投入,以及在AI工程化領(lǐng)域的深厚積累。正是這種大力出奇跡式的飽和投入,讓Qwen在編程、推理等核心能力上實(shí)現(xiàn)了對(duì)Claude Opus等頂級(jí)模型的反超。

    在開源模型和能力探索之外,阿里云,也是Qwen能夠后來者居上的關(guān)鍵一環(huán)。

    畢竟大模型訓(xùn)練推理是名副其實(shí)的算力吞金獸,阿里云為Qwen研發(fā)提供了穩(wěn)定高效的算力基礎(chǔ)設(shè)施,整合了從數(shù)據(jù)標(biāo)注、模型開發(fā)、分布式訓(xùn)練到部署推理的全鏈路工具,極大降低了研發(fā)團(tuán)隊(duì)工程負(fù)擔(dān),使其專注算法和模型創(chuàng)新。

    并且在模型的應(yīng)用和普及方面,同樣是因?yàn)榘⒗镌频腗aaS戰(zhàn)略,可以讓Qwen快速在各行各業(yè)中深耕;例如企業(yè)客戶無需從零訓(xùn)練模型,可直接在阿里云調(diào)用Qwen API,或利用平臺(tái)工具對(duì)開源Qwen模型微調(diào),快速構(gòu)建AI應(yīng)用。

    這種“模+云”的策略形成了從技術(shù)研發(fā)到商業(yè)化落地的最短路徑。

    03 但也并非完美

    雖然阿里在大模型發(fā)展的戰(zhàn)略和選擇促成了它后來者居上的優(yōu)勢(shì),但這并不意味著現(xiàn)階段的Qwen沒有隱患。

    因?yàn)榘⒗镞x擇的開源模型引流、云服務(wù)變現(xiàn)可以說是一條機(jī)遇與挑戰(zhàn)并存的道路;它與Meta的Llama系列相似,目標(biāo)通過開放生態(tài)快速搶占市場(chǎng)份額和開發(fā)者心智,最終將商業(yè)價(jià)值導(dǎo)向自家基礎(chǔ)設(shè)施。

    這與OpenAI、Anthropic等閉源+API的精英路線形成鮮明對(duì)比,它們優(yōu)勢(shì)在于更好保護(hù)核心技術(shù),維持技術(shù)代差,通過高價(jià)值A(chǔ)PI服務(wù)直接獲得高額利潤(rùn)。

    而阿里開源策略雖能快速普及技術(shù),但這也意味著其最先進(jìn)模型很難與競(jìng)爭(zhēng)對(duì)手拉開絕對(duì)差距,商業(yè)模式也更加迂回,需要客戶首先認(rèn)可其云平臺(tái)價(jià)值。

    開源模式的核心挑戰(zhàn)在于如何平衡開放與收益,當(dāng)企業(yè)可以免費(fèi)獲取并私有化部署性能足夠好的開源模型時(shí),他們?yōu)楣俜皆品?wù)付費(fèi)的意愿又會(huì)有多強(qiáng)呢?

    換言之,阿里云不僅要提供簡(jiǎn)單模型托管,還必須提供遠(yuǎn)超開源版本的性能優(yōu)化、安全保障、以及強(qiáng)大工具鏈和企業(yè)級(jí)服務(wù),才能構(gòu)建足夠深的護(hù)城河。如何讓龐大開源用戶群體有效轉(zhuǎn)化為高價(jià)值付費(fèi)云客戶,是這條道路上最關(guān)鍵的商業(yè)驚險(xiǎn)一躍。

    除了商業(yè)化的挑戰(zhàn)之外,在頂尖AI人才爭(zhēng)奪進(jìn)入白熱化的今天,任何核心人才流失都可能對(duì)團(tuán)隊(duì)造成深遠(yuǎn)影響。

    近年來,包括AI框架和基礎(chǔ)設(shè)施領(lǐng)域關(guān)鍵人物賈揚(yáng)清在內(nèi)的一些核心技術(shù)人才先后離開阿里,投身創(chuàng)業(yè)浪潮或加入其他巨頭。雖然對(duì)于阿里這樣體量的公司而言,個(gè)別人員離開未必動(dòng)搖根基,但負(fù)面影響依然存在。

    畢竟核心領(lǐng)軍人物離開可能影響團(tuán)隊(duì)士氣,對(duì)外傳遞負(fù)面信號(hào),增加后續(xù)吸引頂尖人才的難度;在關(guān)鍵技術(shù)方向上,領(lǐng)軍人物的變動(dòng)還可能給項(xiàng)目長(zhǎng)期戰(zhàn)略延續(xù)性帶來不確定性。

    也正像Meta在硅谷持續(xù)上演的搶人大戰(zhàn),離開的人才往往成為新競(jìng)爭(zhēng)對(duì)手,他們對(duì)原有體系優(yōu)劣勢(shì)了如指掌,可能在細(xì)分領(lǐng)域構(gòu)成更精準(zhǔn)威脅。

    因此,阿里如何在高強(qiáng)度競(jìng)爭(zhēng)下持續(xù)保持對(duì)全球頂尖AI人才的吸引力,并建立穩(wěn)定可持續(xù)的人才梯隊(duì),是它在未來發(fā)展過程中必須面對(duì)的嚴(yán)肅課題。

    結(jié)語(yǔ)

    總體來看,阿里通義千問無疑是中國(guó)乃至全球大模型領(lǐng)域的頂級(jí)力量。它憑借“開源與自研并行”的清晰戰(zhàn)略、依托阿里云的強(qiáng)大生態(tài)、以及深厚技術(shù)人才積累,成功在激烈競(jìng)爭(zhēng)中占據(jù)領(lǐng)先地位。萬億參數(shù)模型的發(fā)布更是彰顯了其在Scaling Law上的決心和實(shí)力。

    然而,成功之路也伴隨著清晰挑戰(zhàn)。以開源換生態(tài)的商業(yè)模式,其盈利能力的持續(xù)性仍需市場(chǎng)檢驗(yàn);與OpenAI等閉源巨頭的技術(shù)代差追逐將是長(zhǎng)期過程;而頂級(jí)人才的保留與吸引,則是維持創(chuàng)新活力的生命線。

    Qwen在未來不僅需要在技術(shù)上持續(xù)突破,更需要在商業(yè)模式和組織能力上證明自己的獨(dú)特價(jià)值。它能否將今天的技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為明天不可動(dòng)搖的市場(chǎng)勝勢(shì),將是整個(gè)行業(yè)、包括資本市場(chǎng)關(guān)注的焦點(diǎn)。這也是阿里未來市值能否更上一層樓的關(guān)鍵。

    1、https://x.com/Alibaba_Qwen/status/1963991502440562976

    2、https://chat.qwen.ai/

    3、https://x.com/_akhaliq/status/1964001592710975971