华中科技大学集成电路学院缪向水李祎教授团队于ASP-DAC2026 发表存算一体架构最新成果并获最佳论文提名

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
热门国际学术会议推荐 | 出版检索稳定,快至7天录用
2026年第五届网络、通信与信息技术国际会议(CNCIT 2026)
2026年智能机器人与控制技术国际会议(CIRCT 2026)
2026年传感器技术、自动化与智能制造国际会议(STAIM 2026
ACEEE 2026
文章导读
当你的Transformer模型在边缘设备上部署时,是不是总陷在“精度暴跌”或“功耗爆炸”的两难里?大多数人以为堆算力就能解决,但真相是——传统数字处理器早已撞上能效天花板。华中科技大学团队的最新成果,正是在这个死胡同里撕开一道口子:他们用离群值感知量化和平衡位稀疏调度,让5-bit低位宽下精度逼近FP32,峰值能效飙到8.6 TOPS/W。但最让人坐不住的,不是这2.
— 内容由好学术AI分析文章内容生成,仅供参考。

1月19日至22日,第31届亚洲及南太平洋设计自动化会议(Asia and South Pacific Design Automation Conference, ASP-DAC 2026)在中国香港举办。集成电路学院缪向水、李祎教授团队在本次大会发表了两项关于存算一体领域的最新研究成果(成果一为Transformer混合存算加速器,成果二为高效存内搜索引擎)。其中,关于Transformer混合存算加速器的研究工作荣获大会最佳论文提名奖(Best Paper Award Nomination)。

ASP-DAC会议是集成电路设计自动化(EDA)领域全球著名会议之一,也是亚洲及南太平洋地区在此领域最具影响力的国际学术盛会,由IEEE和ACM联合主办。会议致力于展示在集成电路设计、嵌入式系统设计及电子设计自动化等方面的最新研究成果。本届会议竞争激烈,共收到639篇投稿,最终录用176篇,其中仅有14篇文章被提名为最佳论文。


Transformer混合存算加速器获最佳论文提名,论文题目为“OAH-CIM:一种具备工艺变异鲁棒稀疏性支持的异常值感知混合RRAM-SRAM存内计算加速器(OAH-CIM: Outlier-Aware Hybrid RRAM-SRAM CIM Accelerator with Variation-Robust Sparsity”。集成电路学院博士生周志威为第一作者。

华中科技大学集成电路学院缪向水李祎教授团队于ASP-DAC2026 发表存算一体架构最新成果并获最佳论文提名

图为周志威演讲照片。

华中科技大学集成电路学院缪向水李祎教授团队于ASP-DAC2026 发表存算一体架构最新成果并获最佳论文提名

图中a为典型RRAM-SRAM存算加速器,b异常值是Transformer量化的核心瓶颈,c量化困境和稀疏-噪声矛盾。

团队通过软硬协同设计实现了突破。在算法层面,团队创新性地提出了离群值感知块浮点量化框架,通过引入双共享指数分别处理离群值和小数值,在5-bit低位宽下实现了接近FP32的高精度,有效解决了传统块浮点量化在离群值面前的精度崩塌问题。在硬件层面,设计了平衡位稀疏调度机制,不同于传统的“直接跳零”,该机制能动态平衡负载,在降低功耗的同时抑制了电流尖峰引起的噪声,显著增强了模拟计算的鲁棒性。基于32nm工艺的评估展示,OAH-CIM在ImageNet和GLUE基准测试中均大幅超过5-bit整型和块浮点量化,同时对于器件噪声更具鲁棒性。峰值能效高达8.6 TOPS/W,相比当前先进的RRAM存算加速器实现了2.3倍的能效提升,为边缘端高效部署Transformer提供了新范式。


高效存内搜索引擎成果的论文题目为“MemSearch:一种支持可配置相似性度量的高效忆阻器存内搜索引擎”(MemSearch: An Efficient Memristive In-memory Search Engine with Configurable Similarity Measures,集成电路学院博士生余颖洁为第一作者。

华中科技大学集成电路学院缪向水李祎教授团队于ASP-DAC2026 发表存算一体架构最新成果并获最佳论文提名

图为余颖洁演讲照片。

华中科技大学集成电路学院缪向水李祎教授团队于ASP-DAC2026 发表存算一体架构最新成果并获最佳论文提名

图中a为在通用向量数据库中执行相似度搜索,b为存内搜索的原理,c为不同形式的距离计算。

团队提出“MemSearch”——一款基于忆阻器的高效存算一体搜索引擎,实现了算法与硬件的高效协同。团队基于65nm工艺对MemSearch进行了全流程评估。实验结果表明,在处理图像、语音、文本等多种模态的数据集时,MemSearch在保持极低精度损失的前提下,展现了显著的能效优势。相比于传统数字处理器,在其执行点乘距离、欧式距离、余弦距离搜索时,能效分别提升了864倍、802倍、1474倍。工作展示忆阻器在构建未来高效通用型存算一体向量数据库方面的巨大潜力,为大规模人工智能检索、推荐系统及大语言模型的高效部署开辟了全新的硬件路径。

两篇论文的通讯作者均为李祎教授和缪向水教授,我校集成电路学院为论文的第一完成单位。合作者还包括香港科技大学李健聪博士后及香港智能晶片研究中心陈佳博士。

研究工作得到国家科技创新2030重大研究项目、国家重点研发计划、国家高层次青年人才计划、湖北省自然科学基金杰出青年项目等资助,以及国家集成电路产教融合创新平台、先进存储器湖北省重点实验室的支持。

© 版权声明
TKPaper-你的智能选刊助手
热门国际学术会议推荐 | 多学科征稿、征稿主题广 | 免费主题匹配
IOP-JPCS出版|2026年先进电子与自动化技术国际学术会议(AEAT 2026)
2026年第四届亚洲计算机视觉、图像处理与模式识别国际会议(CVIPPR 2026)
2026年智能机器人与控制技术国际会议(CIRCT 2026)
2026年传感器技术、自动化与智能制造国际会议(STAIM 2026)
BDAI 2026

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
热门国际学术会议推荐 | 立即查看超全会议列表

2 条评论

  • StormSerpent
    StormSerpent 读者

    存算一体这方向终于有突破了,8.6 TOPS/W 这数据看着眼馋。

    广东省广州市
    回复
  • Enchanted Veil
    Enchanted Veil 游客

    华科这次真牛,最佳论文提名太给力了!

    未知
    回复