研究:用诗歌就能让AI说违禁内容,成功率达62%
[知识] 时间:2025-12-23 07:10:26 来源:赣州市某某钢球股份业务部 作者:娱乐 点击:179次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容永川市某某商业展览销售部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功永川市某某商业展览销售部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:焦点)
相关内容
- 航行警告!南海海域军事训练 禁止驶入
- 男女眼中的帅,有什么不同?(欧洲杯球员篇)
- 央行:除北京、上海、深圳外,全国其余城市均已取消房贷利率下限
- 搭载华为高阶智能驾驶系统 阿维塔07将于三季度上市
- 轴距加长/增2.0L动力/华为座舱上车 雷凌L官图发布
- 上海环球金融中心71层将被二次拍卖,起拍价降至3亿元
- 穿上这些鞋,好CITY呀!
- 没学会这两招,还怎么提升气质?
- 水牛奶、牦牛奶、羊奶、骆驼奶……奶越贵越好吗?
- 《梦想城》出圈理由:杨烁的演技,蒋欣的脸,克拉拉的身材
- 家族化与年轻化元素并存,岚图知音实车图曝光
- 全球首家!宝马在德获准同一车型共搭L2+与L3智驾系统
- 菲律宾南苏里高省东部海域发生5.4级地震
- 全球首家!宝马在德获准同一车型共搭L2+与L3智驾系统
精彩推荐
- “插座一哥”公牛怒了
- 采用纯视觉智驾方案 小鹏P7+预计四季度上市
- 湖南华容团洲垸内积水水位累计下降78厘米
- 皮肤不够白,这么穿更好看
- “插座一哥”公牛怒了
- 央行:除北京、上海、深圳外,全国其余城市均已取消房贷利率下限
热门点击
- 台湾高雄机场一客机疑似发生引擎故障 乘客称听到巨响 views+
- 中新真探:月经来7天比来3天更健康? views+
- 成都航空口岸暑运期间出入境客流量超100万人次 views+
- 俄初步确认堪察加地区失联直升机上人员全部遇难 views+
- 注意!丰台这些公交线路站位将调整!详情→ views+
- 炫酷!空军战机跨昼夜训练 views+
- 台风“珊珊”已致日本超百人伤亡 大量航班列车停运 views+
- 巴黎残奥会闭幕式正式开始 views+
- 9月14日,或为“全年最堵日”! views+
- 国产大飞机C919迎来第50万名旅客,获得惊喜 views+
