OpenAI DALL-E 3 模型存生成“不当内容”漏洞，一微软员工上报后反遭“封口令”

您好！欢迎来到国科网

通行证注册 | 登录登录登录登录

2026-07-17 06:54:02 星期五

立足国科融媒，服务先进科技

网站首页资讯中心科技人工智能

OpenAI DALL-E 3 模型存生成“不当内容”漏洞，一微软员工上报后反遭“封口令”

点赞

0

发布时间：2024年02月04日浏览量：220次所属栏目：人工智能发布者：田佳恬

2 月 2 日消息，微软软件工程部门经理 Shane Jones 日前发现 OpenAI 旗下 DALL-E 3 模型存在漏洞，据称能够生成一系列 NSFW 不当内容，在上报相关漏洞后，Shane Jones 却被下达“封口令”，不过该员工最终还是选择向外界披露相关漏洞。

▲ 图源 Shane Jones 对外披露的报告

IT之家注意到，Shane Jones 在去年 12 月通过独立研究发现 OpenAI 文字生成图片的 DALL-E 3 模型存在一项漏洞，能绕过 AI 护栏（AI Guardrail）生成一系列 NSFW 不当内容。

之后 Shane Jones 将漏洞曝光上报微软及 OpenAI，并在领英上发布公开信，声称相关漏洞会对大众造成安全风险，呼吁 OpenAI 在解决漏洞前应暂时下架 DALL-E 3 模型。

随后 Shane Jones 被微软法务部及高管找上门，并警告他立即删除领英公开信并停止对外披露任何内容，但却并未给予任何解释说明，此后 Shane Jones 屡次寻求公司内部沟通，但均未得到公司回应，而漏洞也未修复，之后 Shane Jones 便向媒体及有关部门披露了相关漏洞。

Shane Jones 提到，近日网络上出现 AI 生成的知名歌手 Taylor Swift（泰勒・斯威夫特）不雅照便与该漏洞有一定关联，这些不雅照据称是使用微软 Designer AI 功能生成，而 Designer 底层模型正是 DALL-E 3，因此微软在本次事件中下达“封口令”存在重大过失。

此后微软官方回应 Engadget 等媒体，声称将解决相关员工的疑虑，并修复相关漏洞，不过微软同时声称 Shane Jones 披露的漏洞实际上成功率较低，“无法绕过微软为模型设置的所有安全机制”、“目前还不清楚该漏洞与 Taylor Swift 不雅照事件是否有关联性”。

分享说明：转发分享请注明出处。

上一篇：不分割成token，直接从字节中高效学习，Mamba原来还能这样用

下一篇：万事达卡推出反欺诈AI模型金融科技拥抱生成式AI

热点推荐

热点图讯

2025数字军工大会在西安成功召开

最新资讯

最新图讯

2025数字军工大会在西安成功召开

相关资讯

相关图讯

最新入驻

-゛就是丶不理你°

张超²⁰²⁵

网站简介 | 联系我们 | 广告服务 | 监督电话

本网站由国科网运营维护国科网讯（北京）技术有限公司版权所有  咨询电话：010-88516927
地址：北京市海淀区阜石路甲69号院1号楼1层一单元114
ICP备案号：京ICP备15066964号-8   违法和不良信息举报电话：010-67196565
12300电信用户申诉受理中心   网络违法犯罪举报网站   中国互联网举报中心   12321网络不良与垃圾信息举报中心   12318全国文化市场举报网站
代理域名注册服务机构：阿里巴巴云计算（北京）有限公司