近日,中国电信云计算研究院作为第一完成单位撰写的论文《I/O Optimizations for Graph-Based Disk-Resident Approximate Nearest Neighbor Search: A Design Space Exploration》被计算机数据库领域国际会议Very Large Data Bases (VLDB) 2026录用。该工作在中国电信首席科学家、云计算研究院院长吴杰教授的指导下,由云计算研究院李梁、杨亚南、王一多与东北大学巩树凤等人合作完成。
VLDB是国际数据库与数据管理领域的顶级学术会议,也是中国计算机学会(CCF)推荐的A类会议,与 SIGMOD、ICDE并称为数据领域三大顶会。

DiskANN向量检索的磁盘布局设计面临随机I/O的性能挑战
大模型、RAG等检索密集型应用爆发,向量检索成为核心支撑。十亿级向量规模下,高成本内存型ANN方案难以为继,磁盘驻留型方案成为必然选择,但现有系统 I/O 操作占查询延迟 70%-90%,严重制约性能。作为工业界标杆的DiskANN(被 Microsoft Azure、华为 GaussDB 等采用),存在数据局部性差、带宽闲置、搜索路径长、缓存命中率低四大 I/O 缺陷,且现有优化缺乏统一框架,难以突破瓶颈。如图1,研究团队创新提出三维I/O优化框架(内存布局、磁盘布局、搜索算法优化)与Page级复杂度模型,量化关键因素对 I/O 的影响。基于此打造的OctopusANN融合五大核心优化:MemGraph 单用可减45%I/O,PageShuffle与 PageSearch 强协同,DynamicWidth智能适配搜索阶段。实验显示,100M级数据集上,OctopusANN 在Recall@10=90% 时大幅超越现有方案,95% 高召回率下仍占优,且仅增30-50MB内存开销。团队同步给出选型指南:内存充足选 HNSW,内存受限可选All-in-Storage,高并发高召回率场景 OctopusANN 为最优解。
中国电信云计算研究院始终深耕云计算、大数据等核心技术领域。 此次成果填补了磁盘ANN I/O 优化系统性研究空白,为大规模向量检索提供了高性能、易落地的解决方案,显著降低硬件成本与查询延迟。未来团队将进一步优化十亿级数据集处理能力,探索高维数据 I/O 优化策略,为数字经济发展提供更强大的底层技术支撑。
近日,中国电信云计算研究院作为第一完成单位撰写的论文《I/O Optimizations for Graph-Based Disk-Resident Approximate Nearest Neighbor Search: A Design Space Exploration》被计算机数据库领域国际会议Very Large Data Bases (VLDB) 2026录用。该工作在中国电信首席科学家、云计算研究院院长吴杰教授的指导下,由云计算研究院李梁、杨亚南、王一多与东北大学巩树凤等人合作完成。
VLDB是国际数据库与数据管理领域的顶级学术会议,也是中国计算机学会(CCF)推荐的A类会议,与 SIGMOD、ICDE并称为数据领域三大顶会。

DiskANN向量检索的磁盘布局设计面临随机I/O的性能挑战
大模型、RAG等检索密集型应用爆发,向量检索成为核心支撑。十亿级向量规模下,高成本内存型ANN方案难以为继,磁盘驻留型方案成为必然选择,但现有系统 I/O 操作占查询延迟 70%-90%,严重制约性能。作为工业界标杆的DiskANN(被 Microsoft Azure、华为 GaussDB 等采用),存在数据局部性差、带宽闲置、搜索路径长、缓存命中率低四大 I/O 缺陷,且现有优化缺乏统一框架,难以突破瓶颈。如图1,研究团队创新提出三维I/O优化框架(内存布局、磁盘布局、搜索算法优化)与Page级复杂度模型,量化关键因素对 I/O 的影响。基于此打造的OctopusANN融合五大核心优化:MemGraph 单用可减45%I/O,PageShuffle与 PageSearch 强协同,DynamicWidth智能适配搜索阶段。实验显示,100M级数据集上,OctopusANN 在Recall@10=90% 时大幅超越现有方案,95% 高召回率下仍占优,且仅增30-50MB内存开销。团队同步给出选型指南:内存充足选 HNSW,内存受限可选All-in-Storage,高并发高召回率场景 OctopusANN 为最优解。
中国电信云计算研究院始终深耕云计算、大数据等核心技术领域。 此次成果填补了磁盘ANN I/O 优化系统性研究空白,为大规模向量检索提供了高性能、易落地的解决方案,显著降低硬件成本与查询延迟。未来团队将进一步优化十亿级数据集处理能力,探索高维数据 I/O 优化策略,为数字经济发展提供更强大的底层技术支撑。