校园动态
计算机科学与技术学院首次在计算机体系结构领域顶会FAST发表论文
发布时间:2021-04-15 10:25:49 7034

【计算机科学与技术学院 宣】近日,计算机体系结构领域顶级学术会议USENIX FAST'21(19th USENIX Conference on File and Storage Technologies)以长文形式(regular paper)收录了计算机科学与技术学院夏文课题组的最新研究进展 “The Dilemma between Deduplication and Locality: Can Both be Achieved?”。 该项工作第一署名单位为哈尔滨工业大学(深圳),博士生邹翔宇为第一作者,夏文副教授为通讯作者,张海军和王轩教授为共同作者。

USENIX FAST是中国计算机学会推荐计算机体系结构领域的A类国际会议,也是存储系统领域最高水平会议,一般在美国召开,参与者为全球从事存储系统研究的高校、研究所、企业的科研人员,参会人员多达千人。受疫情影响,本次会议首次以线上会议的形式召开,来自亚欧美十多个国家的三百余人参加了会议。会议每年录用来自全球的论文仅二十余篇,国内仅有清华、上海交大、华中科大等顶尖高校在该会议上发表过论文,这篇论文亦是哈尔滨工业大学一校三区首次以第一和通讯作者单位在该会议上发表论文。

数据去重(Data Deduplication)是一项在存储系统中广泛应用的数据缩减技术,通过有效检测存储系统中的重复数据,并只将重复数据保存一份,从而实现节省数据的存储开销。由于数据去重会导致存储系统中的数据被分散存储,从而导致数据恢复和垃圾回收性能变差,这是当前数据去重系统所面临的主要挑战。本项工作从观察数据如何被调用出发,首次发现了重复数据的生命周期与局部性之间的关联。根据这个观察,在微观上以生命周期为依据构建最优局部单元,在宏观上以局部单元之间的逻辑特征为依据来决定局部单元的摆放顺序,最终得到了整体上局部性接近最优的数据布局。另一方面,还根据该数据布局在面对增量数据负载时的不变性特征,设计了对应的存储布局演进算法,降低了对应存储布局的维护开销。实验表明,应用该数据存储布局和演进算法的MFdedup系统实现了零开销的垃圾回收,并且相对于传统的数据去重框架,MFDedup将数据恢复性能提升了2.6-11.3倍,并且几乎完全发挥出了存储介质的最佳性能(接近数据恢复速度的理论极限)。

该研究工作主要得到了国家自然科学基金委和深圳市科创委等单位的资助支持。论文下载链接地址:https://www.usenix.org/conference/fast21/presentation/zou。

1.png

论文封面

2.png

整体系统架构图

1618453644667016788.png

邹翔宇同学线上报告截图

1618453666480039081.jpg

邹翔宇同学线上交流截图