中国电信云计算研究院在DAC 2026发表最新研究成果:负载感知的I/O协同优化
2026-02-28

近日,电子设计自动化(EDA)领域顶级会议Design Automation Conference(DAC 2026)揭晓论文录用榜单,由中国电信云计算研究院团队独立完成的论文《Cache Where It Counts: Towards Workload-Aware I/O Coordination for NUMA Storage Systems》成功入选。该论文在中国电信首席科学家、云计算研究院院长吴杰教授的指导下,由云计算研究院汤闻达、王彦文、王一多等人合作完成。DAC由美国计算机协会(ACM)和电气与电子工程师协会(IEEE)联合主办,拥有超过60年的历史,是全球芯片设计与自动化领域规模宏大、影响深远、历史悠久的顶级会议之一,也是中国计算机学会(CCF)推荐的A类会议,在计算机体系结构、并行与分布计算以及存储系统等领域享有极高的国际声誉。

随着云计算和人工智能应用的蓬勃发展,现代数据中心正向多NUMA架构快速演进,以充分释放NVMe SSD、CXL等先进存储硬件的性能潜力。然而,传统Linux I/O栈设计理念与现代NUMA存储拓扑的不匹配,成为制约云服务性能提升的关键瓶颈。研究团队发现,在典型的Dual-socket NUMA服务器中,CPU跨socket的远程存储访问会导致高达45%的性能损失,而工作负载无感的Page Cache页面淘汰策略在不同读写场景下的性能差异可达2倍。

Laelaps架构图

针对这一核心挑战,研究团队深入分析了NUMA存储系统的I/O执行路径,识别出现阶段操作系统关于存储拓扑无感的内存分配策略、文件亲和性无关的CPU调度以及工作负载无感的Page Cache页面缓存淘汰策略三大协调空白。创新性地提出了Laelaps跨层I/O协调框架,包括三项关键技术:一是存储拓扑感知的页面缓存放置,通过PCIe到NUMA映射发现和竞争感知迁移,实现缓存与存储设备的智能共置;二是存储拓扑感知的CPU调度,基于文件亲和性跟踪引导I/O线程到最优NUMA节点;三是工作负载感知的自适应页面缓存,采用影子策略仿真技术在扫描抗性LRU和抖动抗性LFU间自动切换。该方案成功将大多数跨NUMA访问开销显著降低。

在多种真实应用负载的实验验证下,Laelaps框架实现了1.41倍的几何平均吞吐量提升,个别场景提升高达1.75倍,并保持低运行时开销。相比业界最先进的解决方案,性能提升达1.25倍,充分验证了动态存储感知协调相比静态优化策略的显著优势。

中国电信云计算研究院始终致力于云计算底层核心技术攻关,持续推动“智能泛在云”技术体系创新。此次论文获得国际顶会认可,标志着团队在高性能存储系统架构领域的技术突破获得国际学术界高度认可。未来,团队将继续深耕存储架构优化、存储-计算协同等前沿技术方向,推动相关成果在中国电信云服务和边缘计算场景中的规模化应用。

中国电信云计算研究院在DAC 2026发表最新研究成果:负载感知的I/O协同优化
2026-02-28

近日,电子设计自动化(EDA)领域顶级会议Design Automation Conference(DAC 2026)揭晓论文录用榜单,由中国电信云计算研究院团队独立完成的论文《Cache Where It Counts: Towards Workload-Aware I/O Coordination for NUMA Storage Systems》成功入选。该论文在中国电信首席科学家、云计算研究院院长吴杰教授的指导下,由云计算研究院汤闻达、王彦文、王一多等人合作完成。DAC由美国计算机协会(ACM)和电气与电子工程师协会(IEEE)联合主办,拥有超过60年的历史,是全球芯片设计与自动化领域规模宏大、影响深远、历史悠久的顶级会议之一,也是中国计算机学会(CCF)推荐的A类会议,在计算机体系结构、并行与分布计算以及存储系统等领域享有极高的国际声誉。

随着云计算和人工智能应用的蓬勃发展,现代数据中心正向多NUMA架构快速演进,以充分释放NVMe SSD、CXL等先进存储硬件的性能潜力。然而,传统Linux I/O栈设计理念与现代NUMA存储拓扑的不匹配,成为制约云服务性能提升的关键瓶颈。研究团队发现,在典型的Dual-socket NUMA服务器中,CPU跨socket的远程存储访问会导致高达45%的性能损失,而工作负载无感的Page Cache页面淘汰策略在不同读写场景下的性能差异可达2倍。

Laelaps架构图

针对这一核心挑战,研究团队深入分析了NUMA存储系统的I/O执行路径,识别出现阶段操作系统关于存储拓扑无感的内存分配策略、文件亲和性无关的CPU调度以及工作负载无感的Page Cache页面缓存淘汰策略三大协调空白。创新性地提出了Laelaps跨层I/O协调框架,包括三项关键技术:一是存储拓扑感知的页面缓存放置,通过PCIe到NUMA映射发现和竞争感知迁移,实现缓存与存储设备的智能共置;二是存储拓扑感知的CPU调度,基于文件亲和性跟踪引导I/O线程到最优NUMA节点;三是工作负载感知的自适应页面缓存,采用影子策略仿真技术在扫描抗性LRU和抖动抗性LFU间自动切换。该方案成功将大多数跨NUMA访问开销显著降低。

在多种真实应用负载的实验验证下,Laelaps框架实现了1.41倍的几何平均吞吐量提升,个别场景提升高达1.75倍,并保持低运行时开销。相比业界最先进的解决方案,性能提升达1.25倍,充分验证了动态存储感知协调相比静态优化策略的显著优势。

中国电信云计算研究院始终致力于云计算底层核心技术攻关,持续推动“智能泛在云”技术体系创新。此次论文获得国际顶会认可,标志着团队在高性能存储系统架构领域的技术突破获得国际学术界高度认可。未来,团队将继续深耕存储架构优化、存储-计算协同等前沿技术方向,推动相关成果在中国电信云服务和边缘计算场景中的规模化应用。