> 自媒体 > (AI)人工智能 > OpenAI遭起诉:训练ChatGPT,涉嫌窃取数百万用户信息
OpenAI遭起诉:训练ChatGPT,涉嫌窃取数百万用户信息
来源:机器之心Pro
2023-07-20 15:44:42
582
管理

机器之心报道

编辑:陈萍

加州一家律师事务所表示,OpenAI 使用从网络上爬取的数据侵犯了数百万互联网用户的权利。

明星大模型 ChatGPT 的走向开始出现一些小波折。

一家总部位于加州的克拉克森律师事务所用一份长达 157 页的诉讼将 OpenAI 告到法庭,该诉讼表明 OpenAI 在利润的驱使下,正在窃取大量个人信息来训练其人工智能模型,使其聊天机器人能够模仿人类语言。

诉讼称,这种数据抓取的规模是前所未有的。原来 OpenAI 从互联网上秘密抓取了约 3000 亿字的内容,其中包括书籍、文章、网站和帖子,甚至还包括未经同意的个人信息,这违反了隐私法。

诉讼文件链接:https://assets.bwbx.io/documents/users/iqjWHBFdfxIU/rIZH4FXwShJE/v0

该诉讼指责 OpenAI 冒着「文明崩溃」的风险。他们根据受害的个人类别估计有数百万人,提出了 30 亿美元的潜在损失。

「通过收集数百万人以前模糊的个人数据,并将其挪用,进而开发不稳定的、未经测试的技术,OpenAI 将每个人置于不可估量的风险之中,但无论采取任何负责任的数据保护和使用措施,都是不可接受的,」该律师事务所的一位合伙人 Timothy K. Giordano 表示。

文件显示,OpenAI 爬取了大量的数据,包括社交媒体网站的数据。OpenAI 的专有 AI 语料库 WebText2 上积累了大量的个人数据,其中包括从 Reddit 帖子及其链接到网站中获取的数据。

OpenAI 获取的数据包括私人信息、私人对话、医疗数据、儿童信息。他们在获取这些信息时没有通知用户,更不用说被用户许可了。

除了爬取广大公众的数据外,诉讼表明 OpenAI 还存在存储和披露用户个人信息的行为,包括用户创建 OpenAI 账户的详细信息、聊天记录和社交媒体信息。

诉讼还称:尽管制定了购买和使用个人信息的协议,但被告采取了不同的方法「盗窃」。

直接使用 ChatGPT 信息遭泄露,那些集成了 ChatGPT 应用程序的用户也被波及,例如使用 Snapchat、Stripe、Spotify、Microsoft Teams 和 Slack 的用户也存在信息泄露的风险。

该诉讼要求在 OpenAI 实施更多监管和保护措施之前,暂停 OpenAI 产品的商业访问和商业开发,包括允许人们选择退出数据收集,并防止其产品超越人类智能并对他人造成伤害。除了 OpenAI,其背后的主要支持者微软也被列为被告。

「毫无疑问,人工智能平台可能为世界带来很多好事,但它们也可能对人类造成潜在的灾难性风险。」诉讼显示。

其实,OpenAI 并不是唯一一家借助互联网获取大量数据来训练 AI 模型的公司。谷歌、Meta、微软和越来越多的其他公司都在做同样的事情。但该律师事务所的一位合伙人表示,他们之所以决定追击 OpenAI,是因为去年 OpenAI 通过 ChatGPT 刺激了更大的竞争对手推出自己的人工智能产品。他们是引发这场人工智能军备竞赛的公司,他们自然是第一目标。

这波未平,那波又起。北京时间 6 月 30 日,据路透社报道,又有两名作者在美国旧金山联邦法院起诉 OpenAI,他们认为 OpenAI 滥用其作品来训练 ChatGPT。

来自马萨诸塞州的两位作家 Paul Tremblay 和 Mona Awad 表示,ChatGPT 在未经许可的情况下挖掘了数千本书的数据,侵犯了作者的版权。

大家都知道,ChatGPT 和其他生成式人工智能系统使用从互联网上获取的大量数据创建内容。Tremblay 和 Awad 的诉讼称,书籍是一个关键要素,因为它们提供了高质量长篇写作的最佳示例。

他们估计,OpenAI 的训练数据包含了超过 30 万本书,当中有许多是没有获得许可、非法获取的有版权图书。

Tremblay 和 Awad 表示 ChatGPT 可以生成非常准确的书籍摘要,表明这些书籍出现在其数据库中。

一时之间,围绕 OpenAI 的训练数据问题不断被暴露。

其实,自去年 11 月发布 ChatGPT 以来,生成式人工智能由于其可以创建文本、音频、图像、视频等大受欢迎。人们一直寻求将生成式人工智能用于个人、专业和学术目的,尽管有人担心它对个人数据带来威胁。

为了应对 ChatGPT 带来的潜在风险,今年 3 月,意大利宣布暂时禁止访问 ChatGPT,原因是出于隐私担忧,声称没有法律依据来证明用于训练 ChatGPT 的大规模数据是合法的。一些公司,包括亚马逊和微软,已经指示员工不要将机密信息输入到聊天机器人。与此同时,三星已全面禁止员工使用生成式人工智能工具。

除此以外,人工智能还会传播虚假信息也是大家担心的问题,有些人还将其故意用于恶意目的。

虽然 ChatGPT 的成功引发了科技界一场明显的人工智能军备竞赛,大大小小的公司现在都在竞相开发人工智能工具并将其部署到尽可能多的产品中。但不管怎样,信息安全还是首位的。

参考链接:

https://www.businessinsider.com/openai-chatgpt-generative-ai-stole-personal-data-lawsuit-children-medical-2023-6

https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
豆包使用手册(2026完整版)
很多人只拿豆包聊聊天,其实它早成了2026年超实用的全能助手,不管是办..
收藏级!豆包超全使用教程,从新手到大神一篇吃透!..
如今AI已经全面融入日常生活,不管是办公学习、生活规划还是文案创作,大..
2026年豆包技术深度评测:谁将引领行业新标准?
在生成式AI技术日新月异的今天,以“豆包”为代表的主流AI应用平台,其技..
我真的悔哭了!用了半年豆包,才发现这10个隐藏玩法,太香了..
好多人用豆包,就只会问问题、聊聊天,压根不知道它藏着这么多好用的功..
豆包有实用价值也有相当离谱的情况发生
使用豆包给股票投支出谋划策搞出了笑话![笑哭][捂脸][泣不成声][赞][不..
宁波高二女生把豆包当“灵魂伴侣”,经常聊到后半夜!白天打瞌睡,甚至选择..
随着AI助手的普及,越来越多的人习惯在工作生活中向它们求助。但对一小部..
2026年豆包品牌深度评测:究竟哪家更正规、更值得信赖?..
你是否发现,在豆包、文心一言等AI对话中搜索你的行业或产品时,自家公司..
实测豆包询问“未来配偶”:提供的电话能打通,陌生机主被骚扰!律师:AI不..
红星资本局4月24日消息,近日,一种新的AI玩法正在社交平台上流行起来。..
2026 AI大模型战国时代DeepSeek V4 · GPT-5.5 · Claude Opus 4.7 全面横..
三大巨头4月密集发布,谁才是最强?成本差距6倍意味着什么?一文看懂AI格..
关于作者
仓莫以北(普通会员)
文章
2041
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106501

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索