大语言模型推理能力刻画与安全水印设计（高小山与合作者）----中国科学院国家数学与交叉科学中心 (NCMIS)

高小山团队及合作团队在大语言模型（LLM）推理能力刻画与安全的数学理论研究上取得重要进展，论文在2025年12月举办的人工智能顶会PeurIPS 2025做报告。

CoT-LLM推理与插值能力刻画[1]。近期工作证明，思维链（CoT）可以提高LLM对若干数学问题的推理能力。该文通过对CoT-LLM插值能力刻画，研究CoT是否在所有推理任务上都能提高LLM的推理能力，并给出了否定的答案。具体，给出了LLM插值有限数据集所需参数个数的上下界；在忽略一些小量后，上下界都为O(N)，N为数据集个数。该结果表明，对于某些推理任务，CoT-LLM和no-CoT-LLM具有相同的插值或推理能力，即CoT并不能提高LLM解决这些推理问题的能力。该文还首次研究了CoT-LLM在无限数据集上的插值能力，证明了CoT-LLM不能以正置信度解决Zp上的算术运算。

针对投毒数据的可证明水印[2]。数据投毒不仅用于使学习算法失效、也常于保护私有数据免遭未授权使用，因此需要对投毒数据的所有权加以确认、防止滥用。本文引入两种投毒数据可证明且实用的水印方法：投毒后水印与投毒时水印。并证明对于投毒后水印、当水印长度为O(d^0.5/e_w)时，或对于投毒时水印、当水印长度在O(1/e_w^2)与O(d^0.5/w_p)之间时(d是数据维数、e_w是水印半径、e_p是投毒半径)，带有水印的投毒数据集能够同时可证明地确保水印可检测性与投毒有效性。这说明了在数据投毒攻击场景下水印技术的实用性。

接受论文：

[1] Lijia Yu, Xiao-Shan Gao, Lijun Zhang. Analyzing the Power of Chain of Thought through Memorization Capabilities. PeurIPS 2025.

[2] Yifan Zhu, Lijia Yu, Xiao-Shan Gao. Provable Watermarking for Data Poisoning Attacks. PeurIPS 2025.