近日,中国电信云计算研究院在云网融合与智能服务质量保障方向取得系列研究进展,四项研究成果被服务质量领域重要国际会议 IEEE/ACM International Symposium on Quality of Service(IWQoS)2026 录用。相关成果围绕新型云网基础设施和智能化服务系统中的 QoS 保障需求,覆盖云网资源调度、端云协同大模型推理、分布式解码加速和行业智能感知等关键环节,提出了一系列面向实际系统约束的优化方法与技术框架。四项成果中,既有云计算研究院研究员面向云网融合和大模型系统优化开展的自主科研成果,也有云计算研究院与北京科技大学联合培养博士生、与吉林大学联合培养博士后作为主要完成人参与完成的产学研协同创新成果,体现了云计算研究院在前沿技术攻关、科研梯队建设和高水平人才培养方面的持续积累。
论文《Chain-Based Service Function Chain Placement: Optimizing Latency in Multi-Topology Networks》是中国电信云计算研究院在服务功能链(Service Function Chain,SFC)部署与低时延云网资源调度方向取得的最新研究成果。该工作由中国电信云计算研究院研究员全硕、陈子轩完成,得到中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授的指导,是云计算研究院面向云网融合关键技术攻关的重要成果。该工作面向安全服务、5G、云边协同等场景中的 SFC 部署需求,针对链式业务在异构资源和多拓扑网络环境下面临的低时延部署难题,提出面向端到端时延优化的 SFC 部署方法。研究团队结合不同网络拓扑下的通信时延特征,设计了基于交换与重排序的轻量化部署算法,以及基于容量/时延感知的生成树算法。实验结果表明,该方法能够在多种网络拓扑和资源条件下改善 SFC 部署质量,降低端到端通信时延,并保持较低调度开销,为云网融合场景下 QoS 感知的网络服务部署提供了新的技术思路。

图1:安全服务场景下链式SFC部署示意图
论文《TAILOR: Token-Aware Transformer Inference for Edge-Cloud Systems》是中国电信云计算研究院在大模型端云协同推理与智能算力调度方向取得的最新研究成果。该工作由中国电信云计算研究院黄潇瑶完成,得到中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授的指导,是云计算研究院面向云网融合与大模型系统优化关键技术攻关的重要成果。该工作面向大语言模型在协同边缘—云环境中部署时面临的推理时延、显存占用和资源利用效率问题,针对 Transformer 自回归生成过程中输出 token 长度不可预测、长尾分布显著,导致边缘资源利用不足、显存溢出以及高时延云端回退等挑战,提出面向 token 异质性的端云协同推理框架 TAILOR。该框架将离线策略优化与在线请求调度相结合,通过 bucket 级时延—显存代价模型构建层到设备划分策略池,并结合 token 长度预测、冲突感知和时延感知调度机制动态选择执行路径。实验结果表明,TAILOR 能够有效降低端到端推理时延和显存溢出导致的云端回退率,提升动态 token 工作负载下大模型端云协同推理的稳健性与资源效率。

图2:TAILOR系统框架
论文《Ygg: Tree-Based Collaborative Speculative Decoding with Token-Only Transmission》是中国电信云计算研究院与北京科技大学联合研究团队在分布式机器学习与大模型高效推理方向取得的最新研究成果。该工作由中国电信云计算研究院与北京科技大学联合培养一年级博士生李斯嘉、中国电信云计算研究院研究员梁雨萌完成,得到中国电信导师吴杰教授和北京科技大学导师李建江教授共同指导,是云计算研究院与外部高校在高水平人才培养和产学研协同创新方面的重要成果。该工作面向大语言模型推理系统中的 QoS 保障需求,针对传统云端投机解码共同部署草稿模型和目标模型带来的显存开销,以及现有端云协同方法传输全量概率分布导致的通信瓶颈,提出纯 Token 传输的树形协同投机解码框架 Ygg。该方法将轻量级草稿模型部署至边缘设备,并结合树形并行验证、自适应草稿生成和异步流水线机制,有效降低端云通信与计算等待时间。实验结果表明,该框架能够在提升系统吞吐量、降低服务成本的同时缩短整体推理延迟,为端云协同的大模型高效推理提供了经济实用的解决方案。

图3:Ygg 树形协同投机解码流程示意图
论文《SE-STGAE: A Shapelet-Enhanced Spatiotemporal Graph Autoencoder for Early Anomaly Detection》是中国电信云计算研究院与吉林大学联合研究团队在移动群智感知与时空数据智能处理方向取得的最新研究成果。该工作由吉林大学周孚佳、中国电信云计算研究院与吉林大学联合培养博士后刘文彬完成,得到中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授,吉林大学王恩教授、杨博教授的共同指导,是云计算研究院与外部高校在产学研合作和博士后人才培养方面的重要成果。该工作面向高速公路网络化感知系统中的 QoS 保障需求,针对事故早期信号稀疏、异常传播复杂以及低误报率条件下可靠预警困难等问题,提出形状子增强时空图自编码模型 SE-STGAE。该方法通过 Shapelet 捕捉局部片段级异常先兆,利用动态多跳空间增强刻画异常在道路网络中的传播关系,并结合跨视图对齐、残差融合和尾部 Top-K 评分机制,在严格误报率预算下实现更可靠的早期报警。实验结果表明,该方法在多个真实高速公路数据集上取得良好效果,能够在降低漏检率的同时提前发现事故风险,为智能交通系统中的 QoS 感知异常检测提供了有效解决方案。

图4:智慧交通事故早期异常的时空传播示意图
IEEE/ACM International Symposium on Quality of Service(IWQoS)是服务质量(Quality of Service,QoS)领域历史悠久、具有重要影响力的国际学术会议。自 1993 年创办以来,IWQoS 长期围绕网络、系统和服务中的性能保障、资源管理、可靠性和服务质量优化等关键问题开展交流,已成为 QoS 领域展示前沿研究成果、研讨关键技术趋势的重要国际平台。近年来,随着云计算、边缘计算、人工智能和大模型系统快速发展,IWQoS 的研究议题持续拓展至智能算力调度、AI 训练与推理系统优化、数据分析与机器学习服务保障等新兴方向,进一步体现了 QoS 研究在新型信息基础设施和智能化服务系统中的基础性作用。
本次中国电信云计算研究院四项成果被 IWQoS 2026 录用,充分体现了云研究院在 QoS 保障、云网融合、端云协同智能和智能系统优化等方向的研究深度,也展现了云研究院与高校联合开展前沿科研攻关和高水平人才培养的协同创新成效。下一步,中国电信云计算研究院将持续面向新型信息基础设施建设和中国电信云网融合发展需求,聚焦智能泛在云、云网融合、智能算力调度、大模型系统优化和行业智能化应用等重点方向,推进原创技术研究、系统能力构建和应用场景落地,为构建高效、可靠、智能的新型云网基础设施提供技术支撑。
近日,中国电信云计算研究院在云网融合与智能服务质量保障方向取得系列研究进展,四项研究成果被服务质量领域重要国际会议 IEEE/ACM International Symposium on Quality of Service(IWQoS)2026 录用。相关成果围绕新型云网基础设施和智能化服务系统中的 QoS 保障需求,覆盖云网资源调度、端云协同大模型推理、分布式解码加速和行业智能感知等关键环节,提出了一系列面向实际系统约束的优化方法与技术框架。四项成果中,既有云计算研究院研究员面向云网融合和大模型系统优化开展的自主科研成果,也有云计算研究院与北京科技大学联合培养博士生、与吉林大学联合培养博士后作为主要完成人参与完成的产学研协同创新成果,体现了云计算研究院在前沿技术攻关、科研梯队建设和高水平人才培养方面的持续积累。
论文《Chain-Based Service Function Chain Placement: Optimizing Latency in Multi-Topology Networks》是中国电信云计算研究院在服务功能链(Service Function Chain,SFC)部署与低时延云网资源调度方向取得的最新研究成果。该工作由中国电信云计算研究院研究员全硕、陈子轩完成,得到中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授的指导,是云计算研究院面向云网融合关键技术攻关的重要成果。该工作面向安全服务、5G、云边协同等场景中的 SFC 部署需求,针对链式业务在异构资源和多拓扑网络环境下面临的低时延部署难题,提出面向端到端时延优化的 SFC 部署方法。研究团队结合不同网络拓扑下的通信时延特征,设计了基于交换与重排序的轻量化部署算法,以及基于容量/时延感知的生成树算法。实验结果表明,该方法能够在多种网络拓扑和资源条件下改善 SFC 部署质量,降低端到端通信时延,并保持较低调度开销,为云网融合场景下 QoS 感知的网络服务部署提供了新的技术思路。

图1:安全服务场景下链式SFC部署示意图
论文《TAILOR: Token-Aware Transformer Inference for Edge-Cloud Systems》是中国电信云计算研究院在大模型端云协同推理与智能算力调度方向取得的最新研究成果。该工作由中国电信云计算研究院黄潇瑶完成,得到中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授的指导,是云计算研究院面向云网融合与大模型系统优化关键技术攻关的重要成果。该工作面向大语言模型在协同边缘—云环境中部署时面临的推理时延、显存占用和资源利用效率问题,针对 Transformer 自回归生成过程中输出 token 长度不可预测、长尾分布显著,导致边缘资源利用不足、显存溢出以及高时延云端回退等挑战,提出面向 token 异质性的端云协同推理框架 TAILOR。该框架将离线策略优化与在线请求调度相结合,通过 bucket 级时延—显存代价模型构建层到设备划分策略池,并结合 token 长度预测、冲突感知和时延感知调度机制动态选择执行路径。实验结果表明,TAILOR 能够有效降低端到端推理时延和显存溢出导致的云端回退率,提升动态 token 工作负载下大模型端云协同推理的稳健性与资源效率。

图2:TAILOR系统框架
论文《Ygg: Tree-Based Collaborative Speculative Decoding with Token-Only Transmission》是中国电信云计算研究院与北京科技大学联合研究团队在分布式机器学习与大模型高效推理方向取得的最新研究成果。该工作由中国电信云计算研究院与北京科技大学联合培养一年级博士生李斯嘉、中国电信云计算研究院研究员梁雨萌完成,得到中国电信导师吴杰教授和北京科技大学导师李建江教授共同指导,是云计算研究院与外部高校在高水平人才培养和产学研协同创新方面的重要成果。该工作面向大语言模型推理系统中的 QoS 保障需求,针对传统云端投机解码共同部署草稿模型和目标模型带来的显存开销,以及现有端云协同方法传输全量概率分布导致的通信瓶颈,提出纯 Token 传输的树形协同投机解码框架 Ygg。该方法将轻量级草稿模型部署至边缘设备,并结合树形并行验证、自适应草稿生成和异步流水线机制,有效降低端云通信与计算等待时间。实验结果表明,该框架能够在提升系统吞吐量、降低服务成本的同时缩短整体推理延迟,为端云协同的大模型高效推理提供了经济实用的解决方案。

图3:Ygg 树形协同投机解码流程示意图
论文《SE-STGAE: A Shapelet-Enhanced Spatiotemporal Graph Autoencoder for Early Anomaly Detection》是中国电信云计算研究院与吉林大学联合研究团队在移动群智感知与时空数据智能处理方向取得的最新研究成果。该工作由吉林大学周孚佳、中国电信云计算研究院与吉林大学联合培养博士后刘文彬完成,得到中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授,吉林大学王恩教授、杨博教授的共同指导,是云计算研究院与外部高校在产学研合作和博士后人才培养方面的重要成果。该工作面向高速公路网络化感知系统中的 QoS 保障需求,针对事故早期信号稀疏、异常传播复杂以及低误报率条件下可靠预警困难等问题,提出形状子增强时空图自编码模型 SE-STGAE。该方法通过 Shapelet 捕捉局部片段级异常先兆,利用动态多跳空间增强刻画异常在道路网络中的传播关系,并结合跨视图对齐、残差融合和尾部 Top-K 评分机制,在严格误报率预算下实现更可靠的早期报警。实验结果表明,该方法在多个真实高速公路数据集上取得良好效果,能够在降低漏检率的同时提前发现事故风险,为智能交通系统中的 QoS 感知异常检测提供了有效解决方案。

图4:智慧交通事故早期异常的时空传播示意图
IEEE/ACM International Symposium on Quality of Service(IWQoS)是服务质量(Quality of Service,QoS)领域历史悠久、具有重要影响力的国际学术会议。自 1993 年创办以来,IWQoS 长期围绕网络、系统和服务中的性能保障、资源管理、可靠性和服务质量优化等关键问题开展交流,已成为 QoS 领域展示前沿研究成果、研讨关键技术趋势的重要国际平台。近年来,随着云计算、边缘计算、人工智能和大模型系统快速发展,IWQoS 的研究议题持续拓展至智能算力调度、AI 训练与推理系统优化、数据分析与机器学习服务保障等新兴方向,进一步体现了 QoS 研究在新型信息基础设施和智能化服务系统中的基础性作用。
本次中国电信云计算研究院四项成果被 IWQoS 2026 录用,充分体现了云研究院在 QoS 保障、云网融合、端云协同智能和智能系统优化等方向的研究深度,也展现了云研究院与高校联合开展前沿科研攻关和高水平人才培养的协同创新成效。下一步,中国电信云计算研究院将持续面向新型信息基础设施建设和中国电信云网融合发展需求,聚焦智能泛在云、云网融合、智能算力调度、大模型系统优化和行业智能化应用等重点方向,推进原创技术研究、系统能力构建和应用场景落地,为构建高效、可靠、智能的新型云网基础设施提供技术支撑。