中国电信云计算研究院

中国电信云计算研究院在大模型内容安全领域取得新进展论文被EMNLP 2025录用

2025-08-22

近日，中国电信云计算研究院在大模型内容安全领域取得重要进展。由吴洋、王睿嘉、吴杰研究团队完成的论文《Non-Existent Relationship: Fact-Aware Multi-Level Machine-Generated Text Detection》被自然语言处理顶级国际会议EMNLP 2025主会录用。该研究聚焦机器生成文本检测难题，旨在有效识别人类书写文本和机器生成文本，为保障大模型内容安全提供新的技术路径。

随着云计算的发展，大模型能够通过云端服务被快速调用，其生成的文本与人类书写的文本越来越相似。这在提升智能应用便利性的同时，也带来了潜在风险，例如被滥用于制造假新闻、钓鱼邮件等。尽管大模型在模仿人类写作风格方面表现突出，但仍存在“事实幻觉”问题，即文本中的实体关系与现实世界不一致，而现有方法尚未充分利用这一关键判别特征。为此，本研究提出一个事实感知模型FAML，通过比较文本抽取的实体-关系图与事实知识库中的实体-关系图差异来识别机器生成文本。为了全面分析上下文信息，本研究采用带门控单元的分层特征提取方式，自适应融合实体、句子和文档级别的多粒度特征，显著提升了机器生成文本的识别准确率，为云计算环境下的内容安全防护提供了技术支撑。

图1: FAML模型整体架构图

EMNLP (Conference on Empirical Methods in Natural Language Processing) 是由国际计算语言学协会（ACL）举办的顶级国际学术会议之一，在人工智能和自然语言处理领域具有显著影响力。本届EMNLP 2025 共收到8174篇有效投稿，最终主会录用率为22.16%，将于2025年11月5日至9日在中国苏州召开。

作为中国电信科技创新的重要研究机构，中国电信云计算研究院持续推进“智能泛在云”技术体系建设，不断深化前沿技术研究。本次在大模型安全领域的研究突破，不仅丰富了云计算环境下的内容安全防护手段，也为大模型的可信应用奠定了坚实基础。这一成果将有效提升云端智能服务的安全性和可控性，助力行业客户在享受大模型带来便利的同时，降低虚假信息传播和安全隐患的风险。未来，中国电信云计算研究院将继续聚焦云计算与大模型的深度融合，探索更加安全、可信和智能的云端新型服务体系。