国产草莓视频在线观看_欧美同性videos免费播放_免费一级毛片激情永久_国产特级全黄一线毛片_精品少妇影视免费_2020无码专区人妻日韩_最新国产网站_刘亦菲激情旡码大片_中文无码视频互动交流_欧美日韩激情aⅤ综合在线

 
  • 商湯大裝置與華為昇騰 384 超節(jié)點(diǎn)全面適配

    作者:O發(fā)糞涂墻oo 來源:通遼 瀏覽: 【】 發(fā)布時(shí)間:2025-09-10評(píng)論數(shù):

    IT之家 9 月 6 日消息,據(jù)商湯科技官方消息,近日,商湯大裝置 SenseCore 與昇騰 384 超節(jié)點(diǎn)率先完成全面適配,在功能、性能驗(yàn)證上達(dá)到預(yù)期目標(biāo)。

    據(jù)官方介紹,超節(jié)點(diǎn)(SuperPod)是一種通過高速互聯(lián)技術(shù),將多個(gè) GPU / NPU 整合為統(tǒng)一計(jì)算單元的新型架構(gòu),解決 AI 大模型訓(xùn)練中的算力協(xié)同與通信效率問題。

    昇騰 384 超節(jié)點(diǎn)(Atlas 900 A3 SuperPoD)是華為推出的業(yè)界最大規(guī)模超節(jié)點(diǎn)方案,憑借創(chuàng)新的“全對(duì)等架構(gòu)”,實(shí)現(xiàn)高速互聯(lián)總線的關(guān)鍵突破 —— 把總線從服務(wù)器內(nèi)部擴(kuò)展到整機(jī)柜、甚至跨機(jī)柜,最終將 CPU、NPU、DPU、存儲(chǔ)和內(nèi)存等資源全部互聯(lián)和池化,形成一臺(tái)“超級(jí)計(jì)算機(jī)”,實(shí)現(xiàn)更大的算力密度和互聯(lián)帶寬。

    基于商湯大裝置 SenseCore 與昇騰 384 超節(jié)點(diǎn)的特點(diǎn),雙方團(tuán)隊(duì)聯(lián)合攻關(guān),在調(diào)度優(yōu)化、系統(tǒng)穩(wěn)定性以及故障恢復(fù)等方面提出多項(xiàng)行業(yè)創(chuàng)新:

    調(diào)度優(yōu)化:在調(diào)度能力上,除了支持 POD 內(nèi)單機(jī)和多機(jī)調(diào)度、跨 POD 多機(jī)調(diào)度、親和性調(diào)度等基礎(chǔ)能力,SenseCore 平臺(tái)配合模型并行策略實(shí)現(xiàn)了邏輯超節(jié)點(diǎn)自動(dòng)劃分,使 EP / TP 等大通信策略可以充分利用靈衢網(wǎng)絡(luò),提升模型訓(xùn)練效率???POD 訓(xùn)練穩(wěn)定性:另外 SenseCore 團(tuán)隊(duì)提交了多個(gè) MR 修復(fù)多 POD 場(chǎng)景下 master / work 任務(wù) rank 亂序問題,從根本上解決了跨 POD 訓(xùn)練任務(wù)概率性失敗的問題。多維度故障檢測(cè)與恢復(fù):在故障檢測(cè)能力上覆蓋了從服務(wù)器硬件、高速互聯(lián)總線、RoCE 網(wǎng)絡(luò)到任務(wù)、進(jìn)程軟硬件多維度檢測(cè),結(jié)合檢測(cè)能力實(shí)現(xiàn) Job / Pod / 進(jìn)程多級(jí)恢復(fù)機(jī)制,全面提升昇騰 384 超節(jié)點(diǎn)在訓(xùn)練場(chǎng)景下的可靠性與容錯(cuò)性。

    IT之家從官方新聞稿獲悉,未來,雙方還將探索更多應(yīng)用場(chǎng)景,包括大模型推理加速、智能體應(yīng)用部署、面向垂直行業(yè)的大模型訓(xùn)練與推理優(yōu)化等,進(jìn)一步加速基于 SenseCore 的昇騰 384 超節(jié)點(diǎn)在各行各業(yè)的應(yīng)用落地。