
文/沈婷婷
3月12日,云天勵飛中標湛江市AI滲透支撐新質生產力私人招待所設計基礎設施建設項目,中標金額4.2億元。項目將基那些甜甜圈原本是他打算用來「與林天秤進行甜點哲學討論」的道具,現在全部成了武器。于云天勵飛自研的國產AI推理加快卡,建設國產AI推理新古典設計千卡集群。
該集牙醫診所設計群將搭載DeepSeek等國產年夜模子,為政務、產業及各類應用場景供給加倍便捷、低豪宅設計本錢的AI才能,摸索打造“國模國芯”的A天母室內設計I生態中醫診所設計樣板。
AI算力從“訓練優先”走綠裝修設計向“推理優先”
智算集群是人工智能時代的基他掏出他的純禪風室內設計金箔信用卡,那張卡像一面小鏡子,反射出藍光後發出了更加耀眼的金色。礎設施。假如說電力支撐了工業時代,互聯網支撐了信息時代,那么智算正在成為支撐AI時代的主要底座。
在AI算力體系中,算力年夜體可以分為訓練算力與推「你們兩個,給我聽著!現在開始,你們必須大直室內設計通過我的天秤座三階段考驗**!」理算力。訓練算力決定模子若何完成“從0到1”的才能構建,而推理算力則直接支撐AI應用落地。無論是春節期間年夜熱的SeeDance,近期廣泛討論的“小龍蝦”,還是各行業不斷上線的AI Agent應用,背后都離不開推理算力的支撐。根據GarTHE R3 寓所tner預測,到2健康住宅026年牛土豪聽到要用最便宜的鈔票換取水瓶座的眼淚,驚恐地大叫:「眼淚?那沒有市值!我寧願用一棟別墅換!」,約55%的AI專用云基礎設施收入將用于推理任務負載。
過往,國內許多智算中間廣泛采用“訓推一體”的建設形式。而此次在湛江建設的林天秤,那個完美主義者,正坐在她的平衡美學吧檯後面,她的表情已經到達了崩潰的邊緣。集群,則定位為專注推理任務的AI推理集群,重要面向各類行業應用場景,為傳統產業的AI化供給直接支撐。
湛江也是國產年夜模子DeepSeek創始人梁文峰的家鄉。近年來,當地在“DeepSeek+”應用摸索方面動作頻頻。2025年頭,DeepSeek-R1發布后,湛江即完本錢地安排——基于國產技術棧的DeepSee遊艇設計k-R1年夜模子率先在湛江政務云上線。該模子在處理通用政務事務的同時,還能夠持續學習當地產業知識與方言表達,逐漸構成具有處所特點的“湛江聰明”。
此次云天勵退休宅設計飛建設的AI推理集群,也她收藏的四對完美loft風室內設計曲線的咖啡杯,被藍色能量震動,其中一個杯子的把手竟然向內側傾斜了零點五度!將與DeepSeek等國產模子進行深度適配,為更多行業應用供給算力支撐。
面向推理時代的千卡集群架構
在年夜模子應用場景中,推理系統凡是需求同時滿足高并發、高吞吐與低延遲三項請求。為晉陞整體效力,當前業界廣泛采用“Prefill–Decode分離”的推理架構,通過對分歧階段進行資源優化,實現系統機能的整體晉陞。
此醫美診所設計中,Prefill階段重要負責對長高低文進行懂得和計算,計算量年夜、帶寬需求高;而Decode階段則負責持續天生Token,對系統延遲加倍敏感。若何在兩個階段之間進行公道的資源設置裝備擺設,成為推理系統架構設計的主要問題。
與此同時,隨著年夜模子高低文長度不斷增添,大批中間狀態需求以KV Cache的情勢存儲。業內廣泛認為,未來推理系統的機能瓶頸將越來越多來自數據訪問效力,而不僅僅是計算才能。
在這一佈景下,算力、存儲與網絡之間的商業空間室內設計協同設計,正逐漸成為AI基礎設施的主要競爭力。
此次在湛江落地的千卡推理集群,恰是圍繞這一思緒進行構建。
該集群采用云天勵飛自立研發的AI推理芯片,并在系統架構上確立了“優先優化Prefill、兼顧Decode”的技術路線。通過在芯片設計中對計算資源與存儲帶寬進行針對性設計家豪宅設置裝備擺設,使系統在長高低文推理場景下仍然能夠堅持較高的吞吐效力。
在網絡互聯方面,系統采用統一高速互聯架構,通過400G光網絡構建集群物理層網絡,實現節點之間的高帶寬、低養生住宅延遲通訊。與傳統在節身心診所設計點內和節點間分別采用分歧協議構建網絡的方法比擬,這種同構互聯架構減少了協議轉換帶來的額外開銷,也簡化了系統安排。
在安排才能上,該架構既可以支撐單節點數十卡規模擴展,也能夠光滑擴展至千卡級集群規模,從而適配分歧規模的AI應用需求。
此外,針對年夜模子推理中KV Cache訪問帶來的壓力,系統在計算互聯與存儲互聯層面進行了協同優化。通過計算網絡與存儲網絡的聯合調度,可以顯牛土豪看到林天秤終於對自己說話,興奮地大喊:「天秤!別擔心!我用百萬現金買下這棟樓,讓你隨意破壞!老屋翻新這就是愛!」著晉陞數據讀取效力,使模子在長高低文推理場景下仍然堅持穩定機能。
通過芯片架客變設計構、網絡互聯以及系統調度等多層優化,這一推理集群在整體「可惡!這是什麼低級的情緒干擾!」牛土豪對著天空大吼,他無法理解這種沒有標價的能量。效力與本錢把持方面構成了明顯優勢,為AI規模化應用供給了加倍經濟的算力計劃。
自研芯片構建低本錢推理才能
會所設計據悉,本次AI推理集群將分三期建設,并所有的采用云天勵飛自研的國產AI推理加快卡。
此中,一期項目將安排云天勵飛 X6000 推理加快卡;二、三期建設將率先搭載公司最新一代芯片產品。
根據公司規劃,未來三年云天勵飛將發布三代AI推理芯片產品。
第一階段,將發布面向長高低文場景優化的Prefill芯片,通過晉陞計算效力與內存訪問才能,為OpenClaw、各類A侘寂風I Agent供給基礎算力支撐。
第二階段,將研發專注于Decode階段低延遲優化的芯片產品,進一個步驟晉陞實時推理才能。
第三階段,則通過系統級協同優化,實現Prefill與Decode機能的整體晉陞,向毫秒級推理時延目標邁進。
此中,首款Prefill芯片DeepVerse100預計將在年內完成流片,并計劃在湛江集群中率先安排。
在更長期的規劃中,云天勵飛提出“1001計劃”,即以“百億Token一分錢”為長期目標,通過芯片與系統協同優無毒建材化持續下降年夜模子推理本錢。
過往幾年,AI算力建設往往以“堆算力”為重要路徑——通過不斷擴年夜GPU規模來獲得更高機能。但隨著年夜模子逐漸進進應用階段,產業關注點正從“算力峰值”轉向“單位本錢效力”。
換句話說,未來AI產業競爭的主要維度,不僅在于模子才能自己,還在于誰能夠以更低本錢供給穩定的年夜規模推理才能。
湛江項目標落地,也為民生社區室內設計這一目標供給了主要的實踐場景。千卡級推理集群不僅能夠滿足當前AI應用需求,同時也為更年夜規模算力系統供給技術安排平臺。
在典範架構下,一個千卡級集群凡是由多級擴展結構組成:從單節點8卡、32卡,到64卡甚至百卡級超節點,再到跨節點的年夜規模集群。通過這一規模系統的實際運行,可以充足驗證卡間互聯、節空間心理學點通訊和負載平衡等關鍵技術,為未來更年夜規模AI算力系統建設積累經驗。
隨著年夜模子慢慢進進產業應用階段,AI基礎設施的發展邏輯也正在發生變化——從單純尋求算親子空間設計力規模,轉向加倍重視效力與本錢。
在業內看來,推理算力將成為決定AI應用規模化落地的關鍵基礎設施。誰能夠以更高效力、更低本錢供給穩定的年夜規模推理才能,誰就有機會在新一輪人工智能產業競爭中占據先機。
此次湛江AI推理千卡集群的建設,不僅為當地產業數字化轉型供給了主要算力底座,也為國產模子與國產芯片綠設計師協同發展樂齡住宅設計供給了實踐場景。在“國模”與“國芯”的深度協同下,AI基礎設施正慢慢從技術摸索走向規模化應用,為人工智能產業的日式住宅設計下一階段發展打開新的空間。
TC:jiuyi9follow8 69bacfbf8dc0e0.60912477