8月12日,华为正式发布AI推理创新技术UCM(推理记忆数据管理器)。据了解,作为一款以KV Cache为中心的推理加速套件,UCM融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每Token推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智慧金融AI推理加速应用试点,并已取得成果。(人民财讯)
热门排行August 13
- 尹锡悦夫妇案牵扯出的韩国“统一教”和“建进法师”是啥来头?
- 王毅将主持澜湄合作第十次外长会并举行中老缅泰外长非正式会晤
- 李国庆发文辟谣自己婚礼 “高价卖门票”,拒绝任何商业操作
- 涉案超30亿巨贪被判死刑后,呼和浩特市水务局又有原“一把手”被查
- 商务部发声,我国消费结构将加快从商品消费主导向服务消费主导转变
- 威胁起诉鲍威尔、敦促降息50基点,美总统和财长“双打”施压
- 腾讯音乐大涨超15%创历史新高,二季度净利增超三成
- 金融监管总局:将消费贷贴息政策执行纳入监管、防止挪用和套现
- 财政部发声,“双贴息”政策到期后将开展效果评估,视情延长政策期限
- 蛇吞象!180亿身价的AI公司Perplexity有意345亿收购谷歌Chrome
评论