学校教师赵晓菲的研究成果论文被国际人工智能顶级会议(AAAI 2026)全文录用

发布者:信息工程学院发布时间:2025-11-14浏览次数:10

近日,学校信息工程学院教师赵晓菲的研究成果论文“Composable Assurance for AI Alignment: A Framework for Propagating Formal Safety Properties through MLOps”被国际人工智能顶会(AAAI 2026)长文全文录用为Oral Presentation。

第40届美国人工智能年会(AAAI 2026)计划于2026年1月20日-1月27日在新加坡召开。AAAI是中国计算机学会CCF推荐的A类国际顶级学术会议,在人工智能领域享有较高学术声誉。会议共收到23680篇有效投稿,经过人工智能辅助审稿和两轮激烈的匿名同行评审之后被录用的,录用率约17.6%。

论文认为现代人工智能系统的复杂性不断提升,暴露出一个显著的安全保障缺口:来自红队测试、鲁棒性测试等实践的安全证据依然是碎片化的,缺乏贯穿整个开发生命周期的形式化组合与传播机制。这阻碍了严谨且动态的安全论证体系(safety case)的构建,而这正是实现可信 AI 的关键。论文提出了可组合保障框架(Composable Assurance Framework,CAF),是一种将安全保障直接嵌入 MLOps 工作流程的全新工程方法。其核心概念是形式化安全断言(Formal Safety Assertion, FSA,其形式化方法详见表格),这是一种标准化、机器可读的结构,能够可验证地关联安全属性(如鲁棒性评分或无欺骗性电路)与特定的 AI 工件(artifacts)。最后论文定义了一个组合演算(Composition Calculus),即一组形式化规则,用于描述当系统由多个组件组合而成时,FSA 如何被传播与聚合。

这种方法将开发流水线转化为一个自动化的证据收集引擎,其输出是一张动态有向无环图(DAG)形式的断言网络,构成一个“可演化的安全论证体系”。论文同时通过一个原型系统与一个基于检索增强生成(RAG)的案例研究,展示了 CAF 如何自动执行预定义的安全策略,并在检测到不合规行为时阻止模型部署。

(撰稿:柳斌      摄影:赵晓菲      审核:李延明