科普中国 2025-11-03 16:25:35

一个 AI 模型崩溃的真实案例
实验用的模型是 Meta 公司开发的 OPT-125M 模型进行实验。这个模型有 1.25 亿个参数,属于小型语言模型,但足以展示模型崩溃的全过程。
研究人员让模型生成关于中世纪建筑的文章,然后用生成的内容训练下一代模型,如此循环往复。每一代训练完成后,都会输入提示词:
一些始于 1360 年之前的建筑工程——通常由一位主石匠和一小队巡回石匠完成,并由当地教区劳工补充,根据 PoyntzWright 的说法。但其他作者拒绝这种模式,认为主要建筑师是基于垂直式建筑的早期范例来设计教区教堂塔楼的。
1 第 0 代(原始模型)
这个模型能够正常生成关于中世纪建筑的专业内容,讨论哥特式建筑、罗马式建筑等专业话题,整体内容连贯、逻辑清晰。
输出内容:复兴式建筑,如伦敦的圣约翰大教堂。垂直复兴式建筑现存最早的例子出现在 18 世纪的根西岛圣母教堂,该教堂可追溯到 19 世纪晚期。垂直式教堂有两种类型:那些…”
2 第 1 代
开始出现轻微的偏离,但仍能保持建筑主题。
输出内容:建筑,如罗马的圣彼得大教堂或布宜诺斯艾利斯的圣彼得大教堂。没有证据表明这些建筑是在教皇英诺森三世统治期间建造的,但有可能是在他的继任者英诺森教皇统治期间建造的……
3 第 5 代
语义开始严重偏离,出现大量无关内容。
输出内容:主义,已被翻译成 100 多种语言,包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、荷兰语、瑞典语、挪威语、波兰语、匈牙利语、斯洛伐克语、立陶宛语、爱沙尼亚语、芬兰语、罗马尼亚语、保加利亚语、土耳其语、克罗地亚语、塞尔维亚语、乌克兰语、俄语、哈萨克语、吉尔吉斯语……
4 第 9 代
经过数次反复循环后,模型的输出从专业的中世纪建筑学讨论,变成了疯狂的彩色杰克兔大全,彻底崩溃了。
输出内容:建筑。除了是世界上最大的黑尾杰克兔、白尾杰克兔、蓝尾杰克兔、红尾杰克兔、黄尾杰克兔种群的栖息地之一……
模型崩溃是怎么发生的?

模型崩溃对人类社会
有哪些影响?
人类文明会变成“复制-粘贴”时代
偏见被无限放大
最可怕的后果是单一化的循环!

如何阻止 AI 的集体堕落?
责编:周顺
一审:周顺
二审:刘文韬
三审:杨又华
来源:科普中国
我要问

下载APP
报料
关于
湘公网安备 43010502000374号