近日,中国电信云计算研究院在大模型内容安全领域取得重要进展。由吴洋、王睿嘉、吴杰研究团队完成的论文《Non-Existent Relationship: Fact-Aware Multi-Level Machine-Generated Text Detection》被自然语言处理顶级国际会议EMNLP 2025主会录用。该研究聚焦机器生成文本检测难题,旨在有效识别人类书写文本和机器生成文本,为保障大模型内容安全提供新的技术路径。
随着云计算的发展,大模型能够通过云端服务被快速调用,其生成的文本与人类书写的文本越来越相似。这在提升智能应用便利性的同时,也带来了潜在风险,例如被滥用于制造假新闻、钓鱼邮件等。尽管大模型在模仿人类写作风格方面表现突出,但仍存在“事实幻觉”问题,即文本中的实体关系与现实世界不一致,而现有方法尚未充分利用这一关键判别特征。为此,本研究提出一个事实感知模型FAML,通过比较文本抽取的实体-关系图与事实知识库中的实体-关系图差异来识别机器生成文本。为了全面分析上下文信息,本研究采用带门控单元的分层特征提取方式,自适应融合实体、句子和文档级别的多粒度特征,显著提升了机器生成文本的识别准确率,为云计算环境下的内容安全防护提供了技术支撑。
图1: FAML模型整体架构图
EMNLP (Conference on Empirical Methods in Natural Language Processing) 是由国际计算语言学协会(ACL)举办的顶级国际学术会议之一,在人工智能和自然语言处理领域具有显著影响力。本届EMNLP 2025 共收到8174篇有效投稿,最终主会录用率为22.16%,将于2025年11月5日至9日在中国苏州召开。
作为中国电信科技创新的重要研究机构,中国电信云计算研究院持续推进“智能泛在云”技术体系建设,不断深化前沿技术研究。本次在大模型安全领域的研究突破,不仅丰富了云计算环境下的内容安全防护手段,也为大模型的可信应用奠定了坚实基础。这一成果将有效提升云端智能服务的安全性和可控性,助力行业客户在享受大模型带来便利的同时,降低虚假信息传播和安全隐患的风险。未来,中国电信云计算研究院将继续聚焦云计算与大模型的深度融合,探索更加安全、可信和智能的云端新型服务体系。
近日,中国电信云计算研究院在大模型内容安全领域取得重要进展。由吴洋、王睿嘉、吴杰研究团队完成的论文《Non-Existent Relationship: Fact-Aware Multi-Level Machine-Generated Text Detection》被自然语言处理顶级国际会议EMNLP 2025主会录用。该研究聚焦机器生成文本检测难题,旨在有效识别人类书写文本和机器生成文本,为保障大模型内容安全提供新的技术路径。
随着云计算的发展,大模型能够通过云端服务被快速调用,其生成的文本与人类书写的文本越来越相似。这在提升智能应用便利性的同时,也带来了潜在风险,例如被滥用于制造假新闻、钓鱼邮件等。尽管大模型在模仿人类写作风格方面表现突出,但仍存在“事实幻觉”问题,即文本中的实体关系与现实世界不一致,而现有方法尚未充分利用这一关键判别特征。为此,本研究提出一个事实感知模型FAML,通过比较文本抽取的实体-关系图与事实知识库中的实体-关系图差异来识别机器生成文本。为了全面分析上下文信息,本研究采用带门控单元的分层特征提取方式,自适应融合实体、句子和文档级别的多粒度特征,显著提升了机器生成文本的识别准确率,为云计算环境下的内容安全防护提供了技术支撑。
图1: FAML模型整体架构图
EMNLP (Conference on Empirical Methods in Natural Language Processing) 是由国际计算语言学协会(ACL)举办的顶级国际学术会议之一,在人工智能和自然语言处理领域具有显著影响力。本届EMNLP 2025 共收到8174篇有效投稿,最终主会录用率为22.16%,将于2025年11月5日至9日在中国苏州召开。
作为中国电信科技创新的重要研究机构,中国电信云计算研究院持续推进“智能泛在云”技术体系建设,不断深化前沿技术研究。本次在大模型安全领域的研究突破,不仅丰富了云计算环境下的内容安全防护手段,也为大模型的可信应用奠定了坚实基础。这一成果将有效提升云端智能服务的安全性和可控性,助力行业客户在享受大模型带来便利的同时,降低虚假信息传播和安全隐患的风险。未来,中国电信云计算研究院将继续聚焦云计算与大模型的深度融合,探索更加安全、可信和智能的云端新型服务体系。