新闻动态

0.4%比例入选!计算机系先进体系结构实验室团队获DATE 2024最佳论文奖

发布时间:2024-04-08

近日,电子设计自动化领域著名会议DATE 2024Design, Automation and Test in Europe,欧洲设计自动化与测试会议)在西班牙瓦伦西亚召开,上海交通大学电子信息与电气工程学院计算机科学与工程系先进体系结构实验室团队凭借点云神经网络的相关成果以接近满分的成绩获得了Track D的最佳论文奖2024DATE会议论文评选分为4Track,本年度共收到有效投稿996篇,接收244篇,最终以0.4%的比例评选出每个Track的最佳论文奖1篇。

获奖论文的题目为“FusionArch: A Fusion-Based Accelerator for Point-Based Point Cloud Neural Networks”,该研究针对点云神经网络关键路径中各阶段存在的串行执行、冗余计算、冗余访存三大挑战,提出了一套面向点云神经网络全流程的、基于融合的算法-架构协同设计方案,有效消除了冗余性,改善了并行度,解耦了阶段间的数据依赖关系,消除了执行中潜在的负载不均衡问题。本研究的算法对比基线模型取得了最高2.02%的精度提升,同时对比团队去年在DATE会议获得最佳论文奖的工作PRADA,该论文的协同设计方案取得了平均2.4倍的性能加速。

 

【研究背景】

基于点的点云神经网络因具有高精度的优势被广泛应用于自动驾驶、机器人等场景中,而其保证原始数据无损的代价便是数据规模庞大、特征维度高等问题,此外,不同点云神经网络的瓶颈阶段并不一致,前人针对特定阶段设计的优化算法和架构无法有效适配日益迭代的多种点云神经网络模型,这给基于点云的AI应用的落地带来了巨大挑战,尤其对于一些实时性需求高、安全攸关的场景,无论降低精度还是牺牲性能都是不可接受的。

具体而言,基于点的点云神经网络的关键执行路径中主要包含如下阶段:最远点采样(FPS)、邻居搜索、特征聚合和特征计算。其中,最远点采样阶段因数据依赖而只能串行执行,无法充分利用硬件资源,导致很长的执行时延,在PointNet++中该阶段的时间占比高达96%;由于点分布的不规则性,邻居搜索中为了对齐邻居向量,通常使用相同的填充点(“Filling Point”)填补较为稀疏的邻域,从而导致给特征计算阶段引入了大量冗余计算,在PointNet++中有64.8%的邻域中包含填充点,其中86.3%的邻域经历了不低于5次的重复计算;在聚合阶段,由于点呈聚集状分布,相邻中心点有很大概率会共享一部分邻居点,从而引入了大量的冗余访存,经统计,PointNet++中有73%的点的特征被重复访问超过4次。因此,为了满足点云应用的高精度、实时性需求,亟需一种既能保证精度,又能消除关键执行路径上的冗余计算和访存,以显著加速点云神经网络的执行,还能适应多种点云网络不同瓶颈阶段的软硬件解决方案。

 

【研究成果】

针对上述3类挑战,论文分别提出了3种解决方案:Fusion-FPSFusion-AggregationFusion-Computation。其中Fusion-FPS基于采样操作在层间依赖的传递性,将整个网络的FPS操作缩减到1次,即只在首层进行采样,后续层从首层的采样结果中按照指定中心点个数进行截取,显著降低了FPS阶段在整个网络中的执行开销,同时改变了层间数据依赖,使得所有后继层的邻居搜索阶段可以同时开始、并行执行;Fusion-Aggregation针对聚合阶段中由共享邻居引入的冗余访存,设计了一套访存合并策略;针对特征计算中填充点冗余计算的问题,Fusion-Computation策略在邻居搜索阶段识别并记录填充点的起始位置,并将其作为标签附在每个邻居向量上,当邻居向量传递到计算单元后,标签值将被识别,并据此跳过填充点的特征计算,然后根据标签值计算出对应填充点特征的内存地址,将先前计算过的点特征直接复制到对应位置。

最终实验表明,论文提出的算法由于避免了采样收缩现象,在精度方面几乎没有损失,甚至在Frustum-PointNet++模型上取得了高达2.02%的精度提升;在性能方面,论文所提方案取得了对比团队最新的、目前最领先的点云加速器(PRADA2.4倍的提升。

 

【作者信息】

论文的第一作者为上海交通大学电子信息与电气工程学院计算机科学与工程系博士研究生刘学渊,通讯作者为计算机系教师宋卓然。

 

宋卓然,上海交通大学电子信息与电气工程学院计算机科学与工程系助理教授,师从梁晓峣教授。主要研究方向包括计算机体系结构,AI专用加速器设计,AI性能优化方法研究。曾获上海市计算机学会优博奖,ACM Chinasys优秀博士论文奖,EDA旗舰会议DATE2023年最佳论文奖等荣誉。目前共发表论文30余篇,作为第一作者在体系结构顶级会议、期刊ISCAMICROASPLOSDACTPDSTCAD上发表过论文。

 

【会议介绍】

欧洲设计自动化与测试学术会议(Design, Automation and Test in EuropeDATE)是固定在欧洲每年举行的电子设计自动化的主题会议,同样也是电子设计自动化领域(EDA)的四大顶级会议之一,吸引着全世界各地学者的关注与参与。创办三十年来,DATE已经成为全球电子设计与测试领域的著名学者、企业界专家的交流盛会。会议涉及电子和(嵌入式)系统工程技术研究的各个方面,涵盖了从集成电路到大规模分布式系统的电子产品设计自动化的设计、测试和工具。会议范围还包括为电信、无线通信、多媒体、医疗保健和汽车系统等具有挑战性的应用领域制定设计要求和新架构。

联系我们 webmaster@cs.sjtu.edu.cn

上海交通大学计算机科学与工程系版权所有 @ 2013