人工智能挑战！GPT-4 攻破 AI-Guardian 防御机制-工信会

人工智能挑战！GPT-4 攻破 AI-Guardian 防御机制

来源：PConline太平洋科技

2023-08-11 16:02:43

462

管理

据最新消息，谷歌DeepMind的研究人员NicholasCarlini在一篇题为“AI-Guardian的LLM辅助开发”的论文中，探讨了使用GPT-4“设计攻击方法、撰写攻击原理”的方案，并使用了OpenAI的GPT-4来攻破其他AI模型的安全防护措施，该方案目前已经应用并成功攻破了AI-Guardian的防御机制。

AI-Guardian是一种用于检测图片的AI审核系统，能够检测图片中是否存在不当内容，同时还可以识别图片是否被其他AI修改过。一旦发现有不当内容或篡改迹象，该系统将提示管理员进行处理。

（图片来源：网络）

该实验展示了聊天机器人在推进安全研究方面的潜在价值，并突出了GPT-4等强大语言模型对未来网络安全的影响。不过AI-Guardian的开发者也同时指出，谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用，考虑到别的模型也会随之跟进，因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。

编辑点评：虽然GPT-4的能力为未来的安全研究提供了参考，但也强调了人类专业知识和协作努力的重要性。随着人工智能语言模型的不断发展，我们更应该加强对于AI模型安全性的关注与研究，以确保用户信息和网络安全。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

ChatGPT放大AI引爆未来可能！复旦邱锡鹏：AI一定要与人类价值观“对齐”

2023-08-11 16:23

GPT-4正式公布！可在60秒内写出一款游戏

2023-08-11 15:57