日韩av视屏 I 欧美人与动牲交xxxxbbbb I 超碰在线人人爱 I 亚洲欧洲综合 I 久久国产乱子伦免费精品无码 I av无码中文字幕不卡一区二区三区 I 日本www在线 I 亚洲最大成人免费视频 I 色噜噜人体337p人体 I 五月综合婷 I 成人免费激情 I 国产日韩欧美高清在线 I 91黄在线 I 国产日产精品一区二区三区的介绍 I www在线视频观看 I 色婷婷亚洲五月 I 黄色三级软件 I av动漫精品 I 日本欧美一区二区三区在线播放 I 国产情人综合久久777777 I 日韩在线视频线观看一区 I 青青草av I 91在线公开视频 I 长腿校花无力呻吟娇喘 I 国产又粗又长又爽视频一区二区 I av片在线看 I 91视频最新网址 I 久久久久久免费免费精品软件 I 日韩精品欧美精品 I 国产区在线视频 I 97精品欧美91久久久久久 I 你懂的午夜在线视频 I 色丫头综合网 I 美女呻吟一区 I 亚洲色图 美腿丝袜

登錄
首頁 > 汽車測評 > 華為發布AI推理新技術 將于今年9月正式開源

華為發布AI推理新技術 將于今年9月正式開源

發布時間:2025-08-13 17:14:21

8月12日訊(記者 黃心怡)華為今日發布AI推理創新技術UCM(推理記憶數據管理器)。作為一款以KV Cache為中心的推理加速套件,其融合了多類型緩存加速算法工具,分級管理推理過程中產生的KV Cache記憶數據,擴大推理上下文窗口,以實現高吞吐、低時延的推理體驗,降低每Token推理成本。

據悉,華為計劃于2025年9月正式開源UCM,屆時將在魔擎社區首發,后續逐步貢獻給業界主流推理引擎社區,并共享給業內所有Share Everything(共享架構)存儲廠商和生態伙伴。

IDC預測,到2027年中國智能算力中,推理算力占比將從2023年的41%左右上升到72.6%左右。中國信息通信研究院人工智能研究所平臺與工程化部主任曹峰表示,大模型推理需求爆發。一方面大模型服務調用量、推理計算量將翻倍,另一方面大模型推理算力供給將超過訓練,基礎設施重心將逐步向推理偏移。

不過,當前AI推理應用落地過程中存在推不動、推得慢、推得貴等問題。華為數據存儲產品線總裁周躍峰舉例:中國互聯網大模型的首Token時延普遍慢于海外互聯網頭部的首Token時延,海外頭部大模型的推理吞吐率也要遠高于中國。因此,如何改進推理系統的效率和體驗是重要課題。這也是華為此次推出UCM推理記憶數據管理器的原因。

據介紹,UCM推理記憶數據管理器已經在中國銀聯的客戶服務、營銷策劃、辦公會議等業務場景中,開展AI推理加速應用試點。

華為數據存儲產品線副總裁、閃存領域總裁謝黎明表示,從銀行業來看,不管是生產環境的投研分析,還是輿情分析也好,都會涉及到非常多的長序列輸入。“比如一份投研報告就是上兆級別,精準營銷所需要輸入的上下文也是長序列,所以推不動這個問題經常出現。其次是推得慢的問題,核心就是并發上不去,上去之后每Token時延特別長。另外推得貴,原因是需要耗費大量的算力。”

華為數據存儲產品線AI存儲首席架構師李國杰進一步解釋,不管是行業調研報告、公司財務信息以及其他公開信息,都是超長上下文的多源信息匯聚。隨著邁向Agentic AI(代理式AI),這些信息會拆成很多步,逐步地深度挖掘,最終給出一個專業的趨勢判斷和報告。這對顯存、計算量都會有很大的壓力。

推理體驗和推理成本,將成為未來AI行業化落地的一大阻礙。“到了Agentic AI時代,Token消費相比以前是百萬級的,成本過高意味著落地就沒有了一個基本的前提,沒有人用得起。”謝黎明稱。

談及AI的發展趨勢,李國杰認為,模型智能轉向數據智能,這在專業領域已基本成為共識。未來,華為會基于UCM構筑更多的Agentic AI能力,以及多模檢索和數據湖的能力等等。

“從GPT5的發布可以看到,傳統的Scaling Law模式已經遇到瓶頸。從應用需求的角度來講,客戶開始關注AI的商業循環和商業變現,更關注體驗。從技術驅動的角度,當模型的智能水平遇到瓶頸,會系統化地轉向數據智能。因為其本質原因是缺少高質量數據,大量用AI合成數據、數據荒以及數據質量的問題,都會成為新的產業研究焦點。”

華為計劃于今年9月份開源UCM,目前已有訊飛等生態伙伴加入。李國杰透露,“很多政府行業、金融行業、制造行業等客戶,已經使用起來。我們會與更多的基礎設施和生態伙伴一起共建,也會與更多具有非常典型性或者行業性的客戶,一起共建。”

Copyright 2017-2025 新車測評網 版權所有  ICP備18049689號-30