中国电信云计算研究院联合北京科技大学发表最新算子融合编译优化研究成果
2026-05-07

近日,中国电信云计算研究院与北京科技大学联合研究团队在深度学习编译优化领域的研究成果《FusionAdvisor: Decision Guidance for Efficient Operator Fusion in Deep Models》被Big Data Mining and Analytics(BDMA)期刊正式接收。Big Data Mining and Analytics是由教育部主管、清华大学主办的国际学术期刊,目前位列CCF计算领域高质量科技期刊 T1 类和中科院1区Top期刊(计算机科学大类),是大数据与人工智能领域国际权威学术平台。该工作由北京科技大学研究生蒋畅,中国电信云计算研究院研究员杨亚南、高深在北京科技大学李建江教授,中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授的指导下合作完成,并得到了中国电信天翼云科技有限公司智算平台事业部的帮助。

随着大语言模型、多模态模型规模与复杂度持续攀升,单次推理涉及成百上千算子,内存读写、核函数启动、中间张量搬运带来巨大开销,成为推理性能与功耗的主要瓶颈。算子融合(Operator Fusion)通过合并多个算子减少内存访问与 kernel 启动,是提升推理效率的关键技术。但现有方法多依赖人工规则、启发式搜索或逐候选编译与性能测量,在现代模型中面临搜索空间大、可扩展性受限以及调优成本高等挑战。因此,如何在无需逐一编译和测量所有候选方案的情况下,快速筛选出高潜力融合策略,并减少专家调优和反复试错成本,成为学界与产业界共同关注的问题。

图1 FusionAdvisor运行框架示意图

针对上述问题,研究团队提出FusionAdvisor 智能算子融合决策框架。该框架构建专用融合策略数据集,采用嵌入增强多层感知机E-MLP预测融合加速比,并结合融合路径搜索、性能评估和 Top-k 推荐机制,对候选融合路径进行快速评分与推荐,从而为后续融合策略选择和性能验证提供数据驱动的决策参考。实验结果表明,FusionAdvisor 在所评估的多类经典模型上均表现出良好的应用潜力,相比 LSTM、XGBoost 等基线模型取得更好的预测效果。研究团队还进一步扩展提出 E-MLP-X,用于探索跨平台性能预测与少样本适配能力。该工作有望为大模型推理加速、端云协同编译等场景提供技术支持。

此次成果是中国电信云计算研究院在智能编译、大模型高效推理、云原生算力优化方向产学研合作的又一标志性成果。未来,中国电信云计算研究院将持续深耕高效编译、隐私计算、云边端协同等核心方向,为智慧城市、行业智能化等场景提供安全、高效、可信的算力支撑与技术保障。

中国电信云计算研究院联合北京科技大学发表最新算子融合编译优化研究成果
2026-05-07

近日,中国电信云计算研究院与北京科技大学联合研究团队在深度学习编译优化领域的研究成果《FusionAdvisor: Decision Guidance for Efficient Operator Fusion in Deep Models》被Big Data Mining and Analytics(BDMA)期刊正式接收。Big Data Mining and Analytics是由教育部主管、清华大学主办的国际学术期刊,目前位列CCF计算领域高质量科技期刊 T1 类和中科院1区Top期刊(计算机科学大类),是大数据与人工智能领域国际权威学术平台。该工作由北京科技大学研究生蒋畅,中国电信云计算研究院研究员杨亚南、高深在北京科技大学李建江教授,中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授的指导下合作完成,并得到了中国电信天翼云科技有限公司智算平台事业部的帮助。

随着大语言模型、多模态模型规模与复杂度持续攀升,单次推理涉及成百上千算子,内存读写、核函数启动、中间张量搬运带来巨大开销,成为推理性能与功耗的主要瓶颈。算子融合(Operator Fusion)通过合并多个算子减少内存访问与 kernel 启动,是提升推理效率的关键技术。但现有方法多依赖人工规则、启发式搜索或逐候选编译与性能测量,在现代模型中面临搜索空间大、可扩展性受限以及调优成本高等挑战。因此,如何在无需逐一编译和测量所有候选方案的情况下,快速筛选出高潜力融合策略,并减少专家调优和反复试错成本,成为学界与产业界共同关注的问题。

图1 FusionAdvisor运行框架示意图

针对上述问题,研究团队提出FusionAdvisor 智能算子融合决策框架。该框架构建专用融合策略数据集,采用嵌入增强多层感知机E-MLP预测融合加速比,并结合融合路径搜索、性能评估和 Top-k 推荐机制,对候选融合路径进行快速评分与推荐,从而为后续融合策略选择和性能验证提供数据驱动的决策参考。实验结果表明,FusionAdvisor 在所评估的多类经典模型上均表现出良好的应用潜力,相比 LSTM、XGBoost 等基线模型取得更好的预测效果。研究团队还进一步扩展提出 E-MLP-X,用于探索跨平台性能预测与少样本适配能力。该工作有望为大模型推理加速、端云协同编译等场景提供技术支持。

此次成果是中国电信云计算研究院在智能编译、大模型高效推理、云原生算力优化方向产学研合作的又一标志性成果。未来,中国电信云计算研究院将持续深耕高效编译、隐私计算、云边端协同等核心方向,为智慧城市、行业智能化等场景提供安全、高效、可信的算力支撑与技术保障。