近日,云计算研究院作为第一完成单位撰写的论文《gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform》被计算机系统领域国际会议ASPLOS 2026录用。该工作在中国电信首席科学家、云计算研究院院长吴杰教授的指导下,由云计算研究院杨亚南、李梁、张健松与天翼云科技有限公司江政雄、祝美祺等人合作完成。
ASPLOS (全称International Conference on Architectural Support for Programming Languages and Operating Systems) 与ISCA、MICRO、HPCA并称为国际计算机体系结构四大旗舰会议,也是中国计算机学会推荐的CCF-A类会议。本次ASPLOS Summer轮共有840篇投稿,录用89篇,录取率约为10%,会议将于2026年3月份在美国匹兹堡召开。
当前AI应用正在加速普及,针对传统云计算GPU资源供给模型存在的粗粒度分配、弹性能力不足以及运行成本高昂等一系列痛点问题,云计算研究院联合天翼云公有云事业部-函数计算团队和基础架构事业部-异构计算团队共同开展了面向AI智能应用的高效GPU云函数课题研究,用于满足中小模型推理、边缘智能等“泛在化”“动态化”和“碎片化”的加速器算力需求。
图1 基于vGPU重映射的动态共享GPU云函数设计
该课题以Kata-container作为函数运行时载体,通过I/O直通的低开销GPU虚拟化技术,基于快速显存交换的vGPU重映射技术以及调度延迟感知的GPU切片再分配技术,实现多租户函数对GPU设备的高效“时空动态”共享。测试结果表明,该研究能够显著提高Serverless平台的GPU资源利用率,降低采购成本;云租户也能够根据GPU共享力度享受到对应价格折扣,从而提高用户粘性。目前该研究的相关技术已在天翼云函数计算产品线投入使用。
作为中国电信科技创新的重要研究机构,中国电信云计算研究院持续推进“智能泛在云”技术体系建设,不断深化前沿技术研究。未来,中国电信云计算研究院将携手天翼云科技有限公司继续聚焦Serverless GPU云函数定价模型、高性能AI沙箱等技术的深度优化与创新,为推动云计算技术的持续发展和广泛应用贡献力量。
[论文信息:Yanan Yang, Zhengxiong Jiang, Meiqi Zhu, Hongqiang Xu, Yujun Wang, Liang Li, Jiansong Zhang, Jie Wu. gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform. ASPLOS 2026. Pittsburgh, USA. (Accepted)]
近日,云计算研究院作为第一完成单位撰写的论文《gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform》被计算机系统领域国际会议ASPLOS 2026录用。该工作在中国电信首席科学家、云计算研究院院长吴杰教授的指导下,由云计算研究院杨亚南、李梁、张健松与天翼云科技有限公司江政雄、祝美祺等人合作完成。
ASPLOS (全称International Conference on Architectural Support for Programming Languages and Operating Systems) 与ISCA、MICRO、HPCA并称为国际计算机体系结构四大旗舰会议,也是中国计算机学会推荐的CCF-A类会议。本次ASPLOS Summer轮共有840篇投稿,录用89篇,录取率约为10%,会议将于2026年3月份在美国匹兹堡召开。
当前AI应用正在加速普及,针对传统云计算GPU资源供给模型存在的粗粒度分配、弹性能力不足以及运行成本高昂等一系列痛点问题,云计算研究院联合天翼云公有云事业部-函数计算团队和基础架构事业部-异构计算团队共同开展了面向AI智能应用的高效GPU云函数课题研究,用于满足中小模型推理、边缘智能等“泛在化”“动态化”和“碎片化”的加速器算力需求。
图1 基于vGPU重映射的动态共享GPU云函数设计
该课题以Kata-container作为函数运行时载体,通过I/O直通的低开销GPU虚拟化技术,基于快速显存交换的vGPU重映射技术以及调度延迟感知的GPU切片再分配技术,实现多租户函数对GPU设备的高效“时空动态”共享。测试结果表明,该研究能够显著提高Serverless平台的GPU资源利用率,降低采购成本;云租户也能够根据GPU共享力度享受到对应价格折扣,从而提高用户粘性。目前该研究的相关技术已在天翼云函数计算产品线投入使用。
作为中国电信科技创新的重要研究机构,中国电信云计算研究院持续推进“智能泛在云”技术体系建设,不断深化前沿技术研究。未来,中国电信云计算研究院将携手天翼云科技有限公司继续聚焦Serverless GPU云函数定价模型、高性能AI沙箱等技术的深度优化与创新,为推动云计算技术的持续发展和广泛应用贡献力量。
[论文信息:Yanan Yang, Zhengxiong Jiang, Meiqi Zhu, Hongqiang Xu, Yujun Wang, Liang Li, Jiansong Zhang, Jie Wu. gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform. ASPLOS 2026. Pittsburgh, USA. (Accepted)]