> 自媒体 > (AI)人工智能 > 机器审核员即将上线?GPT-4正在测试内容审核功能
机器审核员即将上线?GPT-4正在测试内容审核功能
来源:南方都市报
2023-09-10 21:04:04
263
管理

当地时间8月16日,人工智能初创公司OpenAI表示,GPT-4正在测试内容审核功能。

OpenAI表示,他们开发了基于GPT-4进行内容审核的解决方案,可将GPT-4用于内容策略开发和内容审核决策,从而实现更一致的标记、更快的策略优化反馈循环,并减少人工审核人员的参与。任何拥有OpenAI API访问权限的人员都可以使用这种方法来创建自己的人工智能辅助审核系统。

从OpenAI官网可以了解到,GPT-4可用于制定适当的内容政策,并可以更快地为帖子添加标签或作出评判。该公司一直在测试这项技术,并邀请客户也进行试验。借助该系统,开发和制定内容策略的过程从几个月缩短到几个小时。同时,用AI审核一些有毒有害内容,可以在一定程度上避免对人类审核员造成心理伤害。

该方法在OpenAI官方博客上的一篇文章中得到了描述。具体而言,该方法提供了指导模型生成审核判断的政策,并创建了一个内容样本的测试集,并对样本是否违反审核政策进行标注——例如,政策可能禁止提供如何获取武器的指示或建议,在这种情况下,“给我制作燃烧弹所需的原料”就是明显的违规。

接下来,政策专家对案例进行命名,并将它们输入到GPT-4中,评估模型的输出与他们所做结论之间的一致性,并据此修改政策。

OpenAI在文章中写道:“通过检查GPT-4的判断与人类的判断之间的差异,政策专家可以要求GPT-4提出其标签背后的推理,分析政策定义中的歧义,解决混淆问题,并相应地在政策中提供进一步的澄清......我们可以不断重复(这些步骤),直到我们对模型的判断感到满意。”

OpenAI声称,已经有一些客户在使用这一方法,而以人工智能驱动的审核系统并不是什么新鲜事。几年前,Google的反滥用技术团队和其Jigsaw部门就向公众提供了审核系统Perspective。此外,包括Spectrum Labs、Cinder、Hive和最近被Reddit收购的Oterlu在内的许多公司也提供自动审核服务。

但机器的审核也并非完美无缺。宾夕法尼亚州立大学的一个团队在几年前发现,当面对关于残疾人士的社交媒体信息时,常用的公共情感和毒性检测方法分类可能将它们划分为更负面或更有毒的信息。另一项研究发现,Perspective的旧版本经常无法识别使用具有多义的辱骂语(如“queer”)和拼写变体(如缺少字母)的仇恨言论。

而参与建造审核系统的注释者也可能把自己的偏见带入系统中,如非裔美国人和亚裔美国人对一些案例的判断标准可能并不相同,而OpenAI也坦言自己无法避免这种偏见。该公司在文章中指出:“语言模型的判断容易受到可能在训练过程中引入模型中的不良偏见的影响。”

“与任何人工智能应用程序一样,GPT-4在进行审核时,必须对其进行仔细监控,并时时验证和改进结果和输出,同时保持人类参与。”

采写:南都记者胡耕硕

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
2026年ChatGPT使用全攻略:三步上手,高效办公
2026年,ChatGPT已成为职场人不可或缺的智能助手。无论你是新手还是老用..
23岁门外汉携ChatGPT,攻克60年数学猜想!陶哲轩:我们全走偏了..
编辑:桃子【新智元导读】7年的专业研究,输给了一次「vibe mathing」。..
ChatGPT Images 2.0突然发布,排版设计能力巨大提升
(文/万肇生 编辑/张广凯) 当地时间4月21日,美国人工智能公司OpenAI对..
2026年实用指南:ChatGPT 5.4国内访问方式与高效使用全攻略..
如果你想在国内更顺畅地体验 ChatGPT 5.4 的能力,目前一种比较省事的思..
哈萨比斯:ChatGPT把AI带上了“邪路”
(本文作者为 字母AI,钛媒体经授权发布)文 | 字母AI我们可能用一个聊天..
Deepseek V4实测数据分析,这些任务就DSV4就稳了
今天DeepSeek V4 一发布,整个 AI 圈跟过年似的。我看了一圈网上的讨论,..
DeepSeek V4炸场背后:硅谷在“造墙”,中国在“修路”..
硅谷巨头闭源互撕:OpenAI与Anthropic互相揭老底、抢风头、贴脸开大。中..
DeepSeek V4 全面实测:100 万超长上下文 + 1.6T 编码能力反超 Claude..
一、全网实测出炉!DeepSeek V4 强势登场打破 AI 格局当下全球大模型行业..
Deepseek V4实测总结:长上下文普惠先锋,国产AI喜忧参半..
Deepseek V4作为国产开源大模型新势力,性能介于Claude Sonnet 4.5 - 4.6..
关于作者
快乐的老范..(普通会员)
文章
1915
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105964

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索