近日,中国电信云计算研究院和吉林大学合作在稀疏感知与城市时空预测方向取得重要进展,论文《SH-Imputer: Spatiotemporal Data Imputation under Sparse Historical Data for Sparse Sensing》面向“历史训练数据极度稀疏”条件下的时空补全难题,提出自适应两阶段补全框架,该工作由吉林大学博士生杜昊、中国电信云计算研究院与吉林大学联合培养博士后刘文彬和中国电信云计算研究院梁雨萌研究员合作完成;论文《CSTDFormer: Empowering Transformers to Learn Spatio-Temporal Delays via Contrastive Learning》聚焦真实城市场景中普遍存在的“时空延迟”现象,提出基于对比学习的延迟建模方法,该工作由吉林大学硕士生吕佳健、中国电信云计算研究院与吉林大学联合培养博士后刘文彬和中国电信云计算研究院王睿嘉研究员合作完成。上述两项工作得到吉林大学软件学院副院长王恩教授和中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授指导,分别从“稀疏数据补全范式”和“城市时空动态机理建模”切入,为面向真实世界的高可靠时空智能提供了新的技术路径。
图1 ST-Imputer框架图
在稀疏感知场景中,数据补全的效果高度依赖训练阶段的历史数据质量,但现实系统往往面临历史数据长期缺失、缺失率极高的情况。针对“基于先验的方法鲁棒但上限受限、深度学习方法数据充足时强但在稀疏历史数据下易失效”的矛盾,SH-Imputer 在框架上采用两阶段自适应思路:首先通过 VDMF 与 AVDCDE刻画时空内在结构与动态的不确定性,再引入轻量的 ST-Mamba高效挖掘复杂依赖关系,并用自适应机制在“先验鲁棒性”和“数据驱动表达能力”之间动态权衡,从而在不同历史稀疏程度下保持稳定表现。该工作同时给出了关键设计的理论支撑,并开源了实现代码,便于后续研究与落地复用。
为验证方法有效性,论文在空气质量、气象与交通等多类真实数据上开展实验,并与多类代表性方法进行系统对比,结果显示 SH-Imputer 在统一设置下能够稳定取得最优或显著领先的补全误差。进一步地,实验还通过不同“历史稀疏比例/当前观测比例”的变化,验证了方法在“历史极稀疏 + 当前观测很少”的苛刻条件下仍具备优势,体现出面向真实稀疏感知系统的应用价值。
另一项工作 CSTDFormer 则面向城市交通、环境与应急等任务中的时空预测问题,指出现有方法常隐含“信息即时传播”的假设,容易忽略由城市事件、地理因素与通信延迟引入的短程与长程时空延迟,从而限制真实场景建模能力。为此,CSTDFormer 在纯 Transformer 框架内引入对比学习机制:通过 STD-CL配合自注意力刻画细粒度短程延迟效应,并通过 LG-CL配合交叉注意力学习长程延迟关系,同时抑制与目标区域无关的噪声交互。论文在五个真实城市场景数据集上对九类基线方法进行对比,实验结果验证了方法的有效性,并强调“显式建模时空延迟”对提升预测可靠性的重要意义。
图2 CSTDFormer框架图
IEEE INFOCOM 是网络与分布式系统领域的中国计算机学会(CCF)A类会议,录用论文需经过严格同行评审。两篇论文的入选,体现了团队在“稀疏数据条件下的可靠时空补全”与“真实城市动态机理的可学习建模”方面的持续探索能力,也为智慧城市感知、城市运行分析与高可靠决策支持等应用提供了关键技术支撑。
近日,中国电信云计算研究院和吉林大学合作在稀疏感知与城市时空预测方向取得重要进展,论文《SH-Imputer: Spatiotemporal Data Imputation under Sparse Historical Data for Sparse Sensing》面向“历史训练数据极度稀疏”条件下的时空补全难题,提出自适应两阶段补全框架,该工作由吉林大学博士生杜昊、中国电信云计算研究院与吉林大学联合培养博士后刘文彬和中国电信云计算研究院梁雨萌研究员合作完成;论文《CSTDFormer: Empowering Transformers to Learn Spatio-Temporal Delays via Contrastive Learning》聚焦真实城市场景中普遍存在的“时空延迟”现象,提出基于对比学习的延迟建模方法,该工作由吉林大学硕士生吕佳健、中国电信云计算研究院与吉林大学联合培养博士后刘文彬和中国电信云计算研究院王睿嘉研究员合作完成。上述两项工作得到吉林大学软件学院副院长王恩教授和中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授指导,分别从“稀疏数据补全范式”和“城市时空动态机理建模”切入,为面向真实世界的高可靠时空智能提供了新的技术路径。
图1 ST-Imputer框架图
在稀疏感知场景中,数据补全的效果高度依赖训练阶段的历史数据质量,但现实系统往往面临历史数据长期缺失、缺失率极高的情况。针对“基于先验的方法鲁棒但上限受限、深度学习方法数据充足时强但在稀疏历史数据下易失效”的矛盾,SH-Imputer 在框架上采用两阶段自适应思路:首先通过 VDMF 与 AVDCDE刻画时空内在结构与动态的不确定性,再引入轻量的 ST-Mamba高效挖掘复杂依赖关系,并用自适应机制在“先验鲁棒性”和“数据驱动表达能力”之间动态权衡,从而在不同历史稀疏程度下保持稳定表现。该工作同时给出了关键设计的理论支撑,并开源了实现代码,便于后续研究与落地复用。
为验证方法有效性,论文在空气质量、气象与交通等多类真实数据上开展实验,并与多类代表性方法进行系统对比,结果显示 SH-Imputer 在统一设置下能够稳定取得最优或显著领先的补全误差。进一步地,实验还通过不同“历史稀疏比例/当前观测比例”的变化,验证了方法在“历史极稀疏 + 当前观测很少”的苛刻条件下仍具备优势,体现出面向真实稀疏感知系统的应用价值。
另一项工作 CSTDFormer 则面向城市交通、环境与应急等任务中的时空预测问题,指出现有方法常隐含“信息即时传播”的假设,容易忽略由城市事件、地理因素与通信延迟引入的短程与长程时空延迟,从而限制真实场景建模能力。为此,CSTDFormer 在纯 Transformer 框架内引入对比学习机制:通过 STD-CL配合自注意力刻画细粒度短程延迟效应,并通过 LG-CL配合交叉注意力学习长程延迟关系,同时抑制与目标区域无关的噪声交互。论文在五个真实城市场景数据集上对九类基线方法进行对比,实验结果验证了方法的有效性,并强调“显式建模时空延迟”对提升预测可靠性的重要意义。
图2 CSTDFormer框架图
IEEE INFOCOM 是网络与分布式系统领域的中国计算机学会(CCF)A类会议,录用论文需经过严格同行评审。两篇论文的入选,体现了团队在“稀疏数据条件下的可靠时空补全”与“真实城市动态机理的可学习建模”方面的持续探索能力,也为智慧城市感知、城市运行分析与高可靠决策支持等应用提供了关键技术支撑。