近日,中国电信云计算研究院在Serverless工作流调度领域取得重要进展。由汤闻达、杨亚南研究员与中国电信首席科学家、云计算研究院院长吴杰合作完成的论文《Metis: A Non-Clairvoyant, Workflow-Aware OS Scheduler for Serverless Applications》被云计算领域的国际顶级学术会议ACM SoCC (Symposium on Cloud Computing)录用。该研究聚焦Serverless的工作流调度优化问题,从理论模型到实际工作负载分析,对关键路径优先调度算法及其在高并发场景中的性能与公平性进行了探索。
随着无服务器计算(Serverless)的广泛应用,现代云平台正在从单一函数执行逐步扩展到支持复杂业务的工作流。这些工作流通常由多个轻量级函数组成,并通过业务依赖关系协调执行。然而,现有操作系统调度器(如Linux CFS)仍然采用函数级调度策略,缺乏对工作流整体结构和关键路径的感知。这种局限性导致部分工作流关键任务容易受到非关键任务或长时间低优先级任务的影响,延长了Serverless工作流的端到端完成时间。同时,在多租高并发环境下,现有调度器难以平衡系统的公平性和资源利用效率,进一步限制了无服务器计算平台的性能提升。
为解决这一难题,研究团队提出了一种针对Serverless工作流的操作系统级调度器——Metis。与传统调度器不同,Metis将工作流视为一级调度实体,通过“工作流感知最少服务时间”(WLAS)算法,动态优化调度决策,优先处理关键路径任务,减少阻塞延迟,从而显著提升端到端性能。Metis无需预知工作流的具体结构或任务执行时间,而是通过追踪工作流级虚拟时钟和关键路径估计实现高效调度。此外,Metis采用了轻量化设计,通过eBPF技术动态集成到现有操作系统中,避免了大量系统级改动,具有良好的适配性和部署灵活性。实验结果表明,Metis在多种场景下均表现出较好的性能,改善了平均工作流完成效率,降低了尾延迟,同时在高并发和动态环境下展现了更强的公平性和稳定性。
图1: Metis调度器整体架构图
ACM SoCC (Symposium on Cloud Computing) 是云计算领域最具影响力的国际学术会议之一,由美国计算机协会主办,专注于云计算技术的创新与应用。SoCC 汇聚了来自全球的研究人员、开发者和行业实践者,共同探讨云计算领域的理论进展和实际应用。近年来,SoCC 发展迅猛,已成为推动云计算技术在工业界落地的重要桥梁,同时为学术界提供了一个高水平的交流与合作空间,持续引领云计算技术的未来方向。
作为中国电信科技创新的重要研究机构,中国电信云计算研究院持续推进“智能泛在云”技术体系建设,不断深化前沿技术研究。本次在Serverless工作流调度领域的研究突破,不仅填补了函数级调度与工作流级性能优化之间的空白,也为无服务器计算平台的高效调度提供了创新性解决方案。这一成果将有效助力行业客户在应对高并发和动态计算需求时,实现更高效、更公平、更稳定的资源利用。未来,中国电信云计算研究院将继续聚焦Serverless技术的深度优化与创新,探索更加智能、高效的云端工作流调度体系,为推动云计算技术的持续发展和广泛应用贡献新的力量。
近日,中国电信云计算研究院在Serverless工作流调度领域取得重要进展。由汤闻达、杨亚南研究员与中国电信首席科学家、云计算研究院院长吴杰合作完成的论文《Metis: A Non-Clairvoyant, Workflow-Aware OS Scheduler for Serverless Applications》被云计算领域的国际顶级学术会议ACM SoCC (Symposium on Cloud Computing)录用。该研究聚焦Serverless的工作流调度优化问题,从理论模型到实际工作负载分析,对关键路径优先调度算法及其在高并发场景中的性能与公平性进行了探索。
随着无服务器计算(Serverless)的广泛应用,现代云平台正在从单一函数执行逐步扩展到支持复杂业务的工作流。这些工作流通常由多个轻量级函数组成,并通过业务依赖关系协调执行。然而,现有操作系统调度器(如Linux CFS)仍然采用函数级调度策略,缺乏对工作流整体结构和关键路径的感知。这种局限性导致部分工作流关键任务容易受到非关键任务或长时间低优先级任务的影响,延长了Serverless工作流的端到端完成时间。同时,在多租高并发环境下,现有调度器难以平衡系统的公平性和资源利用效率,进一步限制了无服务器计算平台的性能提升。
为解决这一难题,研究团队提出了一种针对Serverless工作流的操作系统级调度器——Metis。与传统调度器不同,Metis将工作流视为一级调度实体,通过“工作流感知最少服务时间”(WLAS)算法,动态优化调度决策,优先处理关键路径任务,减少阻塞延迟,从而显著提升端到端性能。Metis无需预知工作流的具体结构或任务执行时间,而是通过追踪工作流级虚拟时钟和关键路径估计实现高效调度。此外,Metis采用了轻量化设计,通过eBPF技术动态集成到现有操作系统中,避免了大量系统级改动,具有良好的适配性和部署灵活性。实验结果表明,Metis在多种场景下均表现出较好的性能,改善了平均工作流完成效率,降低了尾延迟,同时在高并发和动态环境下展现了更强的公平性和稳定性。
图1: Metis调度器整体架构图
ACM SoCC (Symposium on Cloud Computing) 是云计算领域最具影响力的国际学术会议之一,由美国计算机协会主办,专注于云计算技术的创新与应用。SoCC 汇聚了来自全球的研究人员、开发者和行业实践者,共同探讨云计算领域的理论进展和实际应用。近年来,SoCC 发展迅猛,已成为推动云计算技术在工业界落地的重要桥梁,同时为学术界提供了一个高水平的交流与合作空间,持续引领云计算技术的未来方向。
作为中国电信科技创新的重要研究机构,中国电信云计算研究院持续推进“智能泛在云”技术体系建设,不断深化前沿技术研究。本次在Serverless工作流调度领域的研究突破,不仅填补了函数级调度与工作流级性能优化之间的空白,也为无服务器计算平台的高效调度提供了创新性解决方案。这一成果将有效助力行业客户在应对高并发和动态计算需求时,实现更高效、更公平、更稳定的资源利用。未来,中国电信云计算研究院将继续聚焦Serverless技术的深度优化与创新,探索更加智能、高效的云端工作流调度体系,为推动云计算技术的持续发展和广泛应用贡献新的力量。