找到了。文章是:
Waight H, Yang E, Yuan Y, Messing S, Roberts ME, Stewart BM, Tucker JA. “State media control influences large language models.” Nature. Published 13 May 2026. DOI: 10.1038/s41586-026-10506-7. �
Nature
这篇文章的核心结论
这篇 Nature 文章的主张是:
国家对媒体的控制,会通过训练数据进入大语言模型,从而影响模型回答政治问题时的倾向。
作者认为,LLM 不只是被开发公司、算法和后期安全训练影响,也会被训练语料本身的政治生态影响。也就是说,如果某种语言环境中的网页、新闻、转载内容大量来自国家控制或国家协调的媒体,那么模型在该语言下回答相关政治问题时,可能更容易呈现亲政府、亲官方的语气。Nature 摘要明确说,研究通过六项研究显示,全球范围内政府控制媒体已经通过训练数据影响 LLM 输出;媒体自由度较低国家的语言中,LLM 输出呈现更强的亲政府倾向。�
Nature
研究怎么做的?
文章设计了六项研究,大致逻辑是:
第一,检查开源训练语料中是否存在中国国家协调媒体内容。作者用 CulturaX 这类大型多语种语料库,和中国国家媒体、脚本化宣传材料等做文本相似度匹配。结果显示,中文训练语料中有大量内容与中国国家协调媒体相似。配套网页总结称,约 310 万份中文文档,即 1.64% 的中文子集,与国家协调媒体语料匹配;这一比例约为中文维基百科匹配率的 41 倍。涉及政治领导人和政治机构的文档中,匹配率可高达 24%。�
State Media Influences LLMs
第二,测试商业 LLM 是否“记住”了国家媒体的特色表达。作者发现,当给模型输入国家协调媒体中特征短语的前半句时,商业模型有时会补出预期后半句,比例约 3–10%,说明这些表达可能确实进入过训练分布。�
State Media Influences LLMs
第三,做因果实验。作者用开源模型 Llama-2-13B,额外用中国国家协调媒体内容继续预训练。结果显示,这种额外训练会使模型在回答有关中国政治机构、领导人、政治议题的问题时更正面、更亲政府。配套资料称,即使用 6,400 篇训练文档,继续训练后的模型在中文提示下,相比基础模型,接近 80% 的情况下会给出更亲政府的回答。�
State Media Influences LLMs
第四和第五,审计商业模型。研究者用同一政治问题分别用中文和英文提问,再比较回答倾向。结果显示,在有关中国政治机构和领导人的问题上,商业模型用中文回答时,往往比英文回答更正面。盲评人工标注中,中文回答在 75.3% 的比较中被评为更有利于中国一方。�
State Media Influences LLMs
第六,做跨国比较。作者不只看中国,还看了 37 个主要由单一语言代表的国家。结论是:媒体自由度越低的国家,其本国语言提示下的 LLM 回答越容易比英文基线更亲本国政府。�
State Media Influences LLMs
这篇文章真正说了什么?
它不是简单说“中国洗脑 AI”,这个说法太微博化、太粗糙。
它更严谨的意思是:
国家控制的媒体内容会污染或塑造公共网络文本环境;公共网络文本又会进入 LLM 训练语料;于是模型可能把原本有政治来源的叙事,重新包装成看似中立、客观、知识型的回答。
Princeton 的新闻稿里用了一个很关键的表述:国家协调内容不只是官方媒体本身,而是通过报纸、App、转载网页、普通网页反复流通,最后看起来像“广泛存在的信息环境”。一旦进入训练数据,模型可能把它“洗白”为中立信息。�
Princeton SPIA
这个判断很重要。因为 LLM 输出时通常不会告诉你:“这句话的叙事源头可能来自某国宣传体系。”用户看到的是一个“知识助手”的回答,而不是新华社、人民日报、RT 或其他国家媒体的署名文章。
对截图里那段中文评论的评价
截图里说:
“中国不只要靠洗脑治国,还要靠洗 AI 的脑来治天下……”
这个说法有情绪化夸张,但不是完全无根据。文章确实支持一个较弱但严肃的结论:
如果一个国家长期控制本国语言的信息生态,其官方叙事可能通过互联网语料进入全球 LLM,并在该语言回答中留下可测量痕迹。
但截图里的说法有两个过度推断:
第一,文章没有证明“中国政府主动设计了一个洗 AI 脑的全球战略”。文章说的是国家媒体控制造成训练数据影响,可能是有意的信息控制,也可能是非直接针对 AI 的结构性结果。作者的确警告,国家和强大机构未来会有更强战略激励去利用媒体控制影响 LLM 输出,但这不是说已经证明存在一个明确的“洗 AI 脑计划”。�
Nature
第二,文章也不是只针对中国。中国是机制研究的重点案例,但第六项研究试图推广到其他媒体自由度低的国家。也就是说,俄罗斯、越南、土库曼斯坦、朝鲜等信息环境理论上都有类似问题。�
State Media Influences LLMs
可信度与局限
这篇文章可信度不低:发表在 Nature,有同行评审;作者来自 University of Oregon、Purdue、UCSD、NYU、Princeton 等机构;Nature 页面显示收稿 2024 年 10 月、接受 2026 年 4 月、发表 2026 年 5 月。�
Nature
但也要注意局限:
跨国部分主要是相关性,不是直接因果。 Nature 摘要自己也承认,跨国结果是 correlational,所以作者才用中国案例、训练语料匹配、记忆测试、额外预训练实验来三角验证机制。�
Nature
商业模型训练数据不透明。 作者不能真正打开 GPT、Claude、Gemini 等商业模型的全部训练集,只能用开放语料、模型行为审计、开源模型实验来推断。
“中文更亲中”不一定全部来自国家媒体。 也可能有语言社区结构、用户偏好、审查环境、中文互联网内容分布、模型后训练策略、翻译差异等因素共同作用。文章的价值在于证明“国家协调媒体内容是一个可检出的重要因素”,但不是证明它是唯一因素。
我的总结判断
这篇文章的实质意义很大。它说明:
AI 的所谓“客观知识”,并不是从真空中来的,而是从既有信息生态中提炼出来的。哪个国家、机构、媒体集团长期占据某种语言的信息生产权,就可能间接塑造未来 AI 对这个国家和世界的叙述。
所以,对普通用户来说,最实际的结论是:
问政治、历史、国际关系、政府评价、战争、民族问题、台湾/香港/新疆/俄乌/中东等高度叙事化问题时,不要只用一种语言问,也不要只问一个模型。同一个问题可以用中文、英文分别问,再要求列出证据来源。差异越大,越说明这个问题受到语言信息生态和政治叙事的影响。
