清华大学钱鹤、吴华强教授团队在第68届国际电子器件大会(IEDM 2022)发表4篇存算一体技术领域学术论文

首页    研究进展    清华大学钱鹤、吴华强教授团队在第68届国际电子器件大会(IEDM 2022)发表4篇存算一体技术领域学术论文
 

1 基于单片三维集成的混合存算一体架

人工智能的快速发展对芯片的算力与能效提出了越来越高的要求。模拟型RRAM阵列能以极高的效率执行矩阵-向量乘法(MVM)运算,然而实际神经网络还包含如逻辑、缓存、激活函数(如ReLU)和重排等操作,目前无法在RRAM阵列上有效执行。此外,RRAM阵列和缓存之间需要通过总线进行的频繁数据传输,有限的带宽也会导致显著的延迟,限制计算的并行度。该论文提出了一种基于单片三维集成的混合存算一体架构,实现了硅CMOS逻辑层、基于RRAM的存算一体层和基于碳纳米管(CNT/氧化铟镓锌(IGZO)的近存计算层的片上垂直堆叠,通过高密度层间通孔(ILV)提供的超高带宽优势,可以高效地实现大规模复杂神经网络运算。此外,该论文利用后道兼容低温工艺首次实现基于CNT/IGZO的后道CFET结构,以此为基础单元实现后道CMOS近存计算功能层,实现神经网络层之间的缓存和逻辑运算。该工作以 A Hybrid Computing-In-Memory Architecture by Monolithic 3D Integration of BEOL CNT/IGZO-based CFET Logic and Analog RRAM 为题发表。材料学院博士生安然和集成电路学院博士生李怡均为该论文共同第一作者,集成电路学院唐建石副教授、吴华强教授以及材料学院李正操教授为本论文共同通讯作者

Image

基于单片三维集成的混合存算一体芯片架构及推理时间对比

 

2 基于RRAM的存算一体芯片多尺度热模

基于RRAM的存算一体芯片近年来得到了广泛关注与研究,芯片的集成规模和算力不断提高。但是,芯片的功耗密度,也在不断提高。并且由于RRAM阵列在计算过程中会全并行开启,造成局部的高功耗与热点。而RRAM器件作为模拟器件,其电导对于温度是敏感的,温度的升高会造成RRAM电导的漂移,进而引起芯片计算精度下降。该工作对基于 RRAM 的存算一体芯片进行了多尺度热建模,对影响温度分布的散热方式、技术节点、RRAM阵列功耗、ADCDAC功耗等多种因素进行了评估。并结合 RRAM 紧凑模型研究了RRAM器件随温度的电导漂移,及其对神经网络的精度退化的影响,并提出了有效的改善方法。该研究对基于RRAM的存算一体芯片运行深度神经网络,改善温度引起的计算精度下降具有重要参考价值。该工作以 A Multi-Scale Thermal Modeling of RRAM-based 3D Monolithic-Integrated Computing-in-Memory Chips 为题发表, 集成电路学院博士生马阿旺为第一作者,高滨副教授为通讯作者

Image

仿真框架(上)、电导随温度的漂移(左下)、推理精度随RRAM阵列功耗的变化(右下)

 

3 基于存算一体的同态加

同态加密是一种可以对密文进行运算的加密技术,独特的性质使其在区块链、云计算等场景中有重要应用,目前已有很多用ASICFPGAGPU等硬件来加速同态加密的工作。同态加密的加解密过程可以概括为多项式模乘法加小噪声,该工作首次在阻变存储器(RRAM)阵列上实现了同态加密,其中RRAM阵列分别用作矩阵向量乘法(MVM)单元和真随机数发生器(TRNG),来加速多项式模乘和产生小噪声。为了基于同一RRAM器件上实现MVMTRNG两种不同的功能,该工作采用了不同的初始化方案来调制噪声,使基于RRAMMVMTRNG分别获得了较高的稳定性和较好的随机性。之后,该工作在具有8144Kb RRAM阵列的硬件系统上实验了对隐私保护云推理任务的同态加密解密过程,基于RRAM列的同态加解密过程在实现了很小的精度损失的同时大大降低了功耗和时间开销。该工作以 First Demonstration of Homomorphic Encryption using Multi-Functional RRAM Arrays with a Novel Noise-Modulation Scheme 为题发表, 集成电路学院博士生李雪绮为第一作者,吴华强教授和高滨副教授为共同通讯作者。该工作由清华大学集成电路学院和中国移动研究院合作完成。

Image

隐私保护的云端推理任务流程图(左上),基于RRAM阵列的同态加密系统架构图(右上),系统的推理准确率、能效和时间开销对比(下)

 

4 基于存算一体的混合预编

信息技术包含信息的感知、计算、存储和通信。过去几十年,通信技术不断发展,使得数据传输带宽和速度都不断增大。5G/6G通信系统中,计算越来越多成为限制通信系统速度和稳定性的瓶颈。该工作第一次实现了面向5G/6G MIMO 通信系统的基于存算一体的混合预编码。为了实现大规模MIMO混合预编码所需要的大规模矩阵乘,该工作首次实现了128K 全并行大规模模拟阻变存储器阵列。为了解决大规模阵列中的IR-drop问题,该工作提出了一个紧凑模型以及相应的补偿方案。为了降低混合预编码的计算复杂性,该工作设计了一种新的与CIM兼容的模拟预编码算法框架和权重映射策略。最终,该工作实现了基于RRAM阵列的混合预编码,其性能相对于基于FPGA的混合预编码基本没有降低,且有超过20倍的能效提升。该工作首次探究了基于RRAM阵列的存算通一体的可行性。该工作以 Hybrid Precoding with a Fully-Parallel Large-Scale Analog RRAM Array for 5G/6G MIMO Communication System 为题发表, 集成电路学院博士生秦琦为第一作者,高滨副教授为通讯作者。该工作由清华大学集成电路学院、清华大学电子系, MemInsights Technology inc.,以及中国移动研究院合作完成。

Image

基于RRAM的混合预编码框架以及能效对

 

2022年12月19日 13:07
浏览量:0
收藏