近日,由中國電子工業標準化技術協會數據存儲專業委員會主辦的 2025 數據存儲產業大會正式揭曉了“2025 年度數據存儲典型實踐案例”名單,大普微聯合華瑞指數云:“三節點KVCache存算融合一體機案例”成功入選。
01
廣電行業AI升級
算力與成本的“雙重焦慮”
該案例的落地客戶是一家行業領先的智算服務提供商。隨著廣電行業全面進入“智能化內容生產”階段,AI 模型在內容生成、視頻理解、語音識別、虛擬主持人、自動編導等任務的應用呈爆發式增長。然而,在面對實際業務落地時,傳統的GPU架構正面臨嚴峻挑戰:
極致實時性要求
視頻實時渲染、虛擬演播室交互、直播中的AI特效生成、以及虛擬主持人互動等場景中。毫秒級甚至亞毫秒級的延遲會直接導致音畫不同步、動作遲滯或交互卡頓,嚴重影響最終用戶的觀感和體驗流暢度。
海量上下文數據處理瓶頸
支撐高質量內容生成和理解(如長視頻摘要、復雜場景理解、多輪對話虛擬主持人)需要處理128K+ tokens超長上下文。這導致KVCache數據量激增,讀寫操作異常頻繁。傳統GPU架構依賴的高帶寬內存(HBM)容量有限且成本高昂,成為制約模型規模、會話長度和并發能力的關鍵瓶頸。
高并發與高吞吐壓力
規?;评砣蝿?/span>并發數量的激增(如同時處理多個頻道的實時渲染、為大量用戶提供個性化內容推薦或虛擬主播服務)要求極高的計算吞吐量,更對系統IOPS和內存/存儲帶寬提出了空前的要求。
容量與成本的矛盾
單純依賴高性能GPU搭配HBM的方案雖然算力強,但顯存容量有限且單位成本極高。面對需要支撐多用戶長會話、大模型多實例部署、以及歷史素材庫快速檢索調用的業務需求,純GPU方案在容量擴展性和總體擁有成本(TCO)上均難以承受。
復雜模型與異構負載支持
廣電AI應用往往涉及多種模態(文本、語音、圖像、視頻)的融合處理,以及生成式模型與判別式模型的混合部署。基礎設施需要靈活支持Transformer, Diffusion等不同架構和計算特性(計算密集型、訪存密集型)的任務,避免資源浪費。
高可用性與彈性擴展需求
作為支撐核心業務的生產系統,需要極高的穩定性和可用性。同時,需具備彈性伸縮能力,應對業務波峰波谷(如大型直播活動),在保障性能的前提下按需分配資源,優化成本。
因此,客戶迫切需要一套能在極致性能、超大容量、靈活擴展性以及可控成本之間取得最優平衡的高性能智算基礎設施解決方案。
02
推理速度提升5-8倍
助力廣電行業真正實現AI智能化升級
“岳磐”KVCache 存算融合一體機方案是大普微與華瑞指數云聯合打造的一款為應對AI與企業核心業務雙重挑戰而生的全棧解決方案。
該方案針對上述行業核心痛點,采用高度集成的“交鑰匙”式設計,將大普微高性能企業級SSD與華瑞指數云AI原生數據平臺軟件產品ExponTech WADP深度融合。通過硬件池化、網絡加速與框架調優,解決大模型推理中顯存瓶頸與高并發延遲問題,為高實時性的廣電行業AI應用場景提供了 PB 級 KVCache 擴展能力與微秒級響應保障。

● 岳磐方案架構
自方案上線以來,在性能、成本、容量、兼容性等維度全面取得了顯著效果:
03
助力廣電行業建設“高性能、低成本、可持續”的 AI 智算中心
在高性能存儲底座的支撐下,“岳磐KV Cache”聯合解決方案已在客戶多個核心生產場景中實現了效率的質變:
岳磐 KVCache 存算融合一體機方案以其存算融合的 KVCache 架構、低時延互聯與高擴展 NVMe 存儲體系,顯著提升了廣電行業的 AI 內容生產效率,也推動了節目制作、虛擬演播與智能渲染的算力革新,為廣電行業的智能化升級樹立了標桿。
深耕高性能存儲,共建 AI 產業新生態
“岳磐”KVCache 存算融合一體機的落地,是大普微將極致性能的 SSD 產品轉化為行業系統級解決方案的成功實踐。作為企業級存儲領域的深耕者,大普微不局限于單一硬件性能的提升,而是通過軟硬協同與架構創新,為廣電、金融、互聯網等關鍵行業提供量身定制的存儲解決方案。憑借持續的技術迭代,大普微正不斷拓展存儲能力邊界,為各行業的數據應用提供堅實支撐。
工作時間:周一至周五 9:00-18:00
業務聯系人:袁經理(0755-82964380)
業務郵箱:ex-channel@ex-channel.com
營銷聯系人:郭經理(0755-83273832)
營銷郵箱:marketing@ex-channel.com
地址:深圳市南山區深圳灣科技生態園10A棟21樓01-02室
Address: NO.01-02 ,21/F, Building 10A, Shenzhen Bay Science and Technology Ecological Park,Nanshan District, Shenzhen City, Guangdong Province
