7月3日,上海摩爾線程重磅公佈其AI旗艦產品夸娥(KUAE)智算集群辦理方案實現重大升級,從當前的千卡等級大幅擴展至萬卡規模。摩爾線程夸娥(KUAE)萬卡智算集群,以全性能GPU為底座,旨在打造內地領先的、能夠承載萬卡規模、具備萬P級浮點運算才幹的國產通用加快算計平臺,專為萬億參數等級的復雜大模子培訓而設計。這一里程碑式的進展,樹立了國產GPU專業的新標桿,有助于實現國產智算集群算計才幹的全新跨越,將為我國人工智能領域專業與應用創造、科研攻堅和產業升級提供堅實可信的關鍵根基設備。
此外,摩爾線程聯盟中國挪動通訊集團青海有限公司、中國聯通青海公司、北京德道信科集團、中國能源建設股份有限公司總承包公司、桂林華崛大數據科技有限公司差別就三個萬卡集群項目進行了戰略簽約,多方聚力共同構建好用的國產GPU集群。
摩爾線程創始人兼CEO張建中表示:當前,我們正處在生成式人工智能的黃金時代,專業交織催動智能涌現,GPU成為加快新專業浪潮到臨的創造引擎。摩爾線程矢志投身于這一歷史性的創新歷程,致力于向環球提供加快算計的根基設備和一站式辦理方案,為混合人工智能和數字孿生的數智世界打造進步的加快算計平臺。夸娥萬卡智算集群作為摩爾線程全棧AI戰略的一塊主要拼圖,可為各行各業數智化轉型提供澎湃算力,不僅有力彰顯了摩爾線程在專業創造和工程實踐上的實力,更將成為推動AI產業發展的新出發點。
AI運彩 出金 手續費主戰場,萬卡通用算力是標配
大模子自問世以來,關于其未來的走向和發展趨勢亟待時間驗證,但從當前來看,幾種演進趨勢值得關注,使得其對算力的要點需求也愈發現晰。
首要,Scaling La將連續奏效。Scaling La自2024年提出以來,已揭示了大模子發展背后的暴力美學,即通過算力、算法、數據的深度混合與經驗積累,實現模子功能的奔騰,這也成為業界公認的將連續陰礙未來大模子的發展趨勢。Scaling La將連續奏效,需要單點規模夠大并且通用的算力才能快速跟上專業演進。
其次,Transformer架構不能實現大一統,和其他架構會連續演進并共存,形成多元化的專業生態。生成式AI的進化并非僅依賴于規模的簡樸膨脹,專業架構的改革同樣至關主要。Transformer架構固然是當前主流,但新興架構如Mamba、RWKV和RetNet等連續不斷刷新算計效率,加速創造速度。跟著專業迭代與演進,Transformer架構并不能實現大一統,從稠密到稀疏模子,再到多模態模子的混合,專業的先進都顯現了對更高功能算計資本的期盼。
與此同時,AI、3D和HPC跨專業與跨領域混合連續不斷加快,推動著空間智能、物理AI和AI 4Science、世界模子等領域的界線拓展,使得大模子的培訓和應用環境加倍復雜多元,市場對于能夠支援AI+3D、AI+物理仿真、AI+科學算計等多元算計混合發展的通用加快算計平臺的需求日益急迫。
多元趨勢下,AI模子培訓的主戰場,萬卡已是標配。跟著算計量連續不斷攀升,大模子培訓亟需超級工廠,即一個大且通用的加快算計平臺,以縮短培訓時間,實現模子才幹的快速迭代。當前,國際科技巨頭都在通過積極配置千卡乃至超萬卡規模的算計集群,以確保大模子產品的競爭力。跟著模子參數目從千億邁向萬億,模子才幹加倍泛化,大模子對底層算力的訴求進一步升級,萬卡甚至超萬卡集群成為這一輪大模子比拼的入場券。
然而,構建萬卡集群并非一萬張GPU卡的簡樸堆疊,而是一項高度復雜的超級系統工程。它涉及到超大規模的組網互聯、高效率的集群算計、長期不亂性和高可用性等諸多專業困難。這是難而正確的事情,摩爾線程但願能夠建設一個規模超萬卡、場景夠通用、生態兼容好的加快算計平臺,并優先辦理大模子培訓的困難。
夸娥:國產萬卡萬P萬億大模子培訓平臺
夸娥(KUAE)是摩爾線程智算中央全棧辦理方案,是以全性能GPU為底座,軟硬一體化、完整的系統級算力辦理方案,包含有以夸娥算計集群為要點的根基設備、夸娥集群控制平臺(KUAE Platform)以及夸娥大模子服務平臺(KUAE ModelStudio),旨在以一體化交付的方式辦理大規模GPU算力的建設和運營控制疑問。
基于對AI算力需求的深刻洞察和前瞻性布局,摩爾線程夸娥智算集群可實現從千卡至萬卡集群的無縫擴展,旨在知足大模子時代對于算力規模夠大+算計通用+生態兼容的要點需求,通過整合超大規模的GPU萬卡集群、極致的算計效率優化以及高度不亂的運行環境,以萬卡智算集群的新超級工程,重新定義國產集群算計才幹的新尺度。
夸娥萬卡智算辦理方案具備多個要點特性:
超大算力,萬卡萬P:在集群算計功能方面,全新一代夸娥智算集群實現單集群規模超萬卡,浮點運算才幹到達10Exa-Flops,大幅提拔單集群算計功能,能夠為萬億參數等級大模子培訓提供堅實算力根基。同時,在GPU顯存和傳輸帶寬方面,夸娥萬卡集群到達PB級的超大顯存總容量、每秒PB級的超高速卡間互聯總帶寬和每秒PB級超高速節點互聯總帶寬,實現算力、顯存和帶寬的系統性協同優化,全面提拔集群算計功能。
超高不亂,月級長穩培訓:不亂性是衡量超萬卡集群功能的關鍵。在集群不亂性方面,摩爾線程夸娥萬卡集群平均無故障運行時間過份15天,最長可實現大模子不亂培訓30天以上,周均培訓有效率在99%以上,遠超行業平均程度。這得益于摩爾線程自主研發的一系列可預計、可診斷的多級可信機制,包含有:軟硬件故障的自動定位與診斷預計實現分鐘級的故障定位,Checkpoint多級存儲機制實現內存秒級存儲和培訓任務分鐘級覆原以及高容錯高機能的萬卡集群控制平臺實現秒級納管分配與功課調度。
極致優化,超高MFU:MFU是評估大模子培訓效率的通用指標,可以直接反映端到端的集群培訓效率。夸娥萬卡集群在系統軟件、框架、算法等層面一系列優化,實現大模子的高效率培訓,MFU最高可到達60%。此中,在系統軟件層面,基于極致的算計和通信效率優化等專業手段,大幅提拔集群的執行效率和功能表現。在框架和算法層面,夸娥萬卡集群支援多種自安適融合并行謀略與高效顯存優化等,可以依據應用負載選擇并自動部署最優的并行謀略,大幅提拔培訓效率和顯存利用。同時,針對超長序列大模子,夸娥萬卡集群通過CP并行、RingAttention等優化專業,有效縮減算計時間和顯存占用,大幅提拔集群培訓效率。
全能通用,生態友好:夸娥萬卡集群是一個通用加快算計平臺,算計才幹為通用場景設計,可加快LLM、MoE、多模態、Mamba等差異架構、差異模態的大模子。同時,基于高效易用的MUSA編程語言、完整兼容CUDA才幹和自動化轉移工具Musify,加快新模子Day0級轉移,實現生態適配Instant On,助力客戶業務快速上線。
萬眾一芯,共建大模子應用生態
萬卡集群的建設需要產業界的齊心協力,為實現大模子創造應用的快速落地,讓國產算力為用而建。發表會現場,摩爾線程攜手中國挪動通訊集團青海有限公司、中國聯通青海公司、北京德道信科集團、中國能源建設股份有限公司總承包公司、桂林華崛大數據科技有限公司(排名不分先后),差別就青海零碳產業園萬卡集群項目、青海高原夸娥萬卡集群項目、廣西東盟萬卡集群項目進行了戰略簽約。
借助摩爾線程進步的夸娥全棧智算辦理方案,各方將攜手共建強盛的全國產智算平臺,以加快產業數字化轉型和高質量發展。夸娥萬卡智算集群項目標志著國產AI算力根基設備的又一重大進展,將為各地的數字經濟發展注入新活力。
摩爾線程與中國挪動通訊集團青海有限公司戰略簽約
摩爾線程與中國聯通青海公司、北京德道信科集團戰略簽約
摩爾線程與中國能源建設股份有限公司總承包公司、桂林華崛大數據科技有限公司戰略簽約
發表會后,無問芯穹、清程極智、360、京東云、智平方等五家合作同伴典型紛飛登臺,分享了摩爾線程夸娥智算集群如何助力其在大模子培訓、大模子推理、具身智能等差異場景和領域的創造,顯現了夸娥智算集群在實際應用中的巨大潛力與廣泛適用性。
據了解,在WAIC時期,摩爾線程將在上海世博展覽館(H2館D616)開展全棧AI 為美好世界加快的主題成績呈現,包含有加快卡、服務器、超混合一體機和AIGC應用在內的摩爾線程全棧AI產品悉數亮相,并攜手眾多行業合作同伴聯盟呈現基于夸娥智算集群的豐富行業大模子與應用方案。
7月3日,上海摩爾線程重磅公佈其AI旗艦產品夸娥(KUAE)智算集群辦理方案實現重大升級,從當前的千卡等級大幅擴展至萬卡規模。摩爾線程夸娥(KUAE)萬卡智算集群,以全性能GPU為底座,旨在打造內地領先的、能夠承載萬卡規模、具備萬P級浮點運算才幹的國產通用加快算計平臺,專為萬億參數等級的復雜大模子培訓而設計。這一里程碑式的進展,樹立了國產GPU專業的新標桿,有助于實現國產智算集群算計才幹的全新跨越,將為我國人工智能領域專業與應用創造、科研攻堅和產業升級提供堅實可信的關鍵根基設備。
此外,摩爾線程聯盟中國挪動通訊集團青海有限公司、中國聯通青海公司、北京德道信科集團、中國能源建設股份有限公司總承包公司、桂林華崛大數據科技有限公司差別就三個萬卡集群項目進行了戰略簽約,多方聚力共同構建好用的國產GPU集群。
摩爾線程創始人兼CEO張建中表示:當前,我們正處在生成式人工智能的黃金時代,專業交織催動智能涌現,GPU成為加運彩兌獎條碼快新專業浪潮到臨的創造引擎。摩爾線程矢志投身于這一歷史性的創新歷程,致力于向環球提供加快算計的根基設備和一站式辦理方案,為混合人工智能和數字孿生的數智世界打造進步的加快算計平臺。夸娥萬卡智算集群作為摩爾線程全棧AI戰略的一塊主要拼圖,可為各行各業數智化轉型提供澎湃算力,不僅有力彰顯了摩爾線程在專業創造和工程實踐上的實力,更將成為推動AI產業發展的新出發點。
AI主戰場,萬卡通用算力是標配
大模子自問世以來,關于其未來的走向和發展趨勢亟待時間驗證,但從當前來看,幾種演進趨勢值得關注,使得其對算力的要點需求也愈發現晰。
首要,Scaling La將連續奏效。Scaling La自2024年提出以來,已揭示了大模子發展背后的暴力美學,即通過算力、算法、數據的深度混合與經驗積累,實現模子功能的奔騰,這也成為業界公認的將連續陰礙未來大模子的發展趨勢。Scaling La將連續奏效,需要單點規模運彩 正規賽夠大并且通用的算力才能快速跟上專業演進。
其次,Transformer架構不能實現大一統,和其他架構會連續演進并共存,形成多元化的專業生態。生成式AI的進化并非僅依賴于規模的簡樸膨脹,專業架構的改革同樣至關主要。Transformer架構固然是當前主流,但新興架構如Mamba、RWKV和RetNet等連續不斷刷新算計效率,加速創造速度。跟著專業迭代與演進,Transformer架構并不能實現大一統,從稠密到稀疏模子,再到多模態模子的混合,專業的先進都顯現了對更高功能算計資本的期盼。
與此同時,AI、3D和HPC跨專業與跨領域混合連續不斷加快,推動著空間智能、物理AI和AI 4Science、世界模子等領域的界線拓展,使得大模子的培訓和應用環境加倍復雜多元,市場對于能夠支援AI+3D、AI+物理仿真、AI+科學算計等多元算計混合發展的通用加快算計平臺的需求日益急迫。
多元趨勢下,AI模子培訓的主戰場,萬卡已是標配。跟著算計量連續不斷攀升,大模子培訓亟需超級工廠,即一個大且通用的加快算計平臺,以縮短培訓時間,實現模子才幹的快速迭代。當前,國際科技巨頭都在通過積極配置千卡乃至超萬卡規模的算計集群,以確保大模子產品的競爭力。跟著模子參數目從千億邁向萬億,模子才幹加倍泛化,大模子對底層算力的訴求進一步升級,萬卡甚至超萬卡集群成為這一輪大模子比拼的入場券。
然而,構洋基 玩運彩建萬卡集群并非一萬張GPU卡的簡樸堆疊,而是一項高度復雜的超級系統工程。它涉及到超大規模的組網互聯、高效率的集群算計、長期不亂性和高可用性等諸多專業困難。這是難而正確的事情,摩爾線程但願能夠建設一個規模超萬卡、場景夠通用、生態兼容好的加快算計平臺,并優先辦理大模子培訓的困難。
夸娥:國產萬卡萬P萬億大模子培訓平臺
夸娥(KUAE)是摩爾線程智算中央全棧辦理方案,是以全性能GPU為底座,軟硬一體化、完整的系統級算力辦理方案,包含有以夸娥算計集群為要點的根基設備、夸娥集群控制平臺(KUAE Platform)以及夸娥大模子服務平臺(KUAE ModelStudio),旨在以一體化交付的方式辦理大規模GPU算力的建設和運營控制疑問。
基于對AI算力需求的深刻洞察和前瞻性布局,摩爾線程夸娥智算集群可實現從千卡至萬卡集群的無縫擴展,旨在知足大模子時代對于算力規模夠大+算計通用+生態兼容的要點需求,通過整合超大規模的GPU萬卡集群、極致的算計效率優化以及高度不亂的運行環境,以萬卡智算集群的新超級工程,重新定義國產集群算計才幹的新尺度。
夸娥萬卡智算辦理方案具備多個要點特性:
超大算力,萬卡萬P:在集群算計功能方面,全新一代夸娥智算集群實現單集群規模超萬卡,浮點運算才幹到達10Exa-Flops,大幅提拔單集群算計功能,能夠為萬億參數等級大模子培訓提供堅實算力根基。同時,在GPU顯存和傳輸帶寬方面,夸娥萬卡集群到達PB級的超大顯存總容量、每秒PB級的超高速卡間互聯總帶寬和每秒PB級超高速節點互聯總帶寬,實現算力、顯存和帶寬的系統性協同優化,全面提拔集群算計功能。
超高不亂,月級長穩培訓:不亂性是衡量超萬卡集群功能的關鍵。在集群不亂性方面,摩爾線程夸娥萬卡集群平均無故障運行時間過份15天,最長可實現大模子不亂培訓30天以上,周均培訓有效率在99%以上,遠超行業平均程度。這得益于摩爾線程自主研發的一系列可預計、可診斷的多級可信機制,包含有:軟硬件故障的自動定位與診斷預計實現分鐘級的故障定位,Checkpoint多級存儲機制實現內存秒級存儲和培訓任務分鐘級覆原以及高容錯高機能的萬卡集群控制平臺實現秒級納管分配與功課調度。
極致優化,超高MFU:MFU是評估大模子培訓效率的通用指標,可以直接反映端到端的集群培台灣運彩籃球投注策略訓效率。夸娥萬卡集群在系統軟件、框架、算法等層面一系列優化,實現大模子的高效率培訓,MFU最高可到達60%。此中,在系統軟件層面,基于極致的算計和通信效率優化等專業手段,大幅提拔集群的執行效率和功能表現。在框架和算法層面,夸娥萬卡集群支援多種自安適融合并行謀略與高效顯存優化等,可以依據應用負載選擇并自動部署最優的并行謀略,大幅提拔培訓效率和顯存利用。同時,針對超長序列大模子,夸娥萬卡集群通過CP并行、RingAttention等優化專業,有效縮減算計時間和顯存占用,大幅提拔集群培訓效率。
全能通用,生態友好:夸娥萬卡集群是一個通用加快算計平臺,算計才幹為通用場景設計,可加快LLM、MoE、多模態、Mamba等差異架構、差異模態的大模子。同時,基于高效易用的MUSA編程語言、完整兼容CUDA才幹和自動化轉移工具Musify,加快新模子Day0級轉移,實現生態適配Instant On,助力客戶業務快速上線。
萬眾一芯,共建大模子應用生態
萬卡集群的建設需要產業界的齊心協力,為實現大模子創造應用的快速落地,讓國產算力為用而建。發表會現場,摩爾線程攜手中國挪動通訊集團青海有限公司、中國聯通青海公司、北京德道信科集團、中國能源建設股份有限公司總承包公司、桂林華崛大數據科技有限公司(排名不分先后),差別就青海零碳產業園萬卡集群項目、青海高原夸娥萬卡集群項目、廣西東盟萬卡集群項目進行了戰略簽約。
借助摩爾線程進步的夸娥全棧智算辦理方案,各方將攜手共建強盛的全國產智算平臺,以加快產業數字化轉型和高質量發展。夸娥萬卡智算集群項目標志著國產AI算力根基設備的又一重大進展,將為各地的數字經濟發展注入新活力。
摩爾線程與中國挪動通訊集團青海有限公司戰略簽約
摩爾線程與中國聯通青海公司、北京德道信科集團戰略簽約
摩爾線程與中國能源建設股份有限公司總承包公司、桂林華崛大數據科技有限公司戰略簽約
發表會后,無問芯穹、清程極智、360、京東云、智平方等五家合作同伴典型紛飛登臺,分享了摩爾線程夸娥智算集群如何助力其在大模子培訓、大模子推理、具身智能等差異場景和領域的創造,顯現了夸娥智算集群在實際應用中的巨大潛力與廣泛適用性。
據了解,在WAIC時期,摩爾線程將在上海世博展覽館(H2館D616)開展全棧AI 為美好世界加快的主題成績呈現,包含有加快卡、服務器、超混合一體機和AIGC應用在內的摩爾線程全棧AI產品悉數亮相,并攜手眾多行業合作同伴聯盟呈現基于夸娥智算集群的豐富行業大模子與應用方案。