> 自媒体 > (AI)人工智能 > 科技企业争抢“国产ChatGPT”,谁会胜出?
科技企业争抢“国产ChatGPT”,谁会胜出?
来源:南方日报
2023-05-04 22:31:09
547
管理

“带资入组,不在意岗位、薪资和title,求组队。”原美团联合创始人王慧文一言激起千层浪。就在前几天,他在社交媒体上发布“宣言”,表示将出资5000万美元进军人工智能领域,期待联合顶级研发人才,共同打造中国的OpenAI,日后产出如ChatGPT一般的AI产品。

而在此之前,360、百度、阿里巴巴、腾讯、字节跳动、京东、科大讯飞、网易有道、快手等科技互联网企业也已纷纷表态,宣布要在ChatGPT及相关赛道布局。

他们之中,有的技术过硬,有的资本雄厚,有的掌握核心流量入口。那么,风口之下的这场“国产ChatGPT”争夺战,究竟谁能笑到最后?

●南方日报记者 许隽

扎堆入局

上线一周吸引上百万用户试用,推出两个月就达成“月活破亿”的成就,成为史上最受欢迎的消费者应用……ChatGPT的爆红“出圈”,让国内外科技互联网行业有些“上火”。

本月初,为对抗ChatGPT带来的冲击,谷歌仓促发布同类人工智能聊天机器人“Bard”;在国内,百度率先宣布将在3月初面向公众推出“文心一言”,且目前已邀请超过50家机构参与内测评估。除此之外,阿里巴巴、腾讯等十多家科技互联网“大厂”也在争先恐后。

以阿里巴巴为例,此前该公司向南方日报记者证实,其旗下的阿里达摩院正在研发类ChatGPT的对话机器人,目前处于内测阶段;字节跳动方面,相关产品据称也在测试中。至于腾讯,虽然并没有直接上马“国产ChatGPT”的迹象,但其不乏在AI大模型、机器学习算法等领域的技术储备,未来有望有序推进针对ChatGPT和AIGC产业的专项研究。

而除上述传统“大厂”外,一些互联网垂类赛道的玩家也在摩拳擦掌。比如,据媒体报道,好未来就有引入“类ChatGPT”技术的规划,目前公司正着手筹备研发ChatGPT相关教育项目;快手也曾对外透露,公司正开展大规模语言模型的相关研究,并已启动专项,覆盖LLM模型训练、文案自动创作与生成、对话系统开发等领域。

正如百度所说,“ChatGPT是人工智能里程碑,更是分水岭,这意味着AI技术发展到临界点,企业需要尽早布局。”不难预见,今后该技术领域还会迎来更多国内企业参与。

大厂突围

新兴赛道,竞争者众。单从技术储备来说,百度无疑是优势最突出的一方。

公开资料显示,早在成立之初,百度就已在人工智能领域积极投入。经过数十年的积累,百度已经具备人工智能运算所需的算力、算法和数据,在底层芯片、深度学习框架、大模型及最上层应用等领域均有布局,是国内少数拥有AI全栈能力的企业。

以大模型领域为例。与ChatGPT依托GPT-3模型完成训练类似,百度拟于今年3月推出的“文心一言”AI聊天机器人也有自己独创的训练模型——文心大模型ERNIE,且模型参数高达2600亿量级,远超GPT-3的1750亿。也就是说,如果将“人机对话”简单地比作一场考试,那么“文心一言”很可能比ChatGPT做过更多的真题。

与百度一样,阿里巴巴在“国产ChatGPT”争夺战中也有着很强的竞争力。根据日前曝光的阿里巴巴“达摩院版ChatGPT”测试结果,该工具同样拥有知识问答、生成程序代码、小说续写、报告撰写、诗词写作等功能,可以跟用户完成高效、流畅的互动;公司打造的多模态预训练模型M6拥有10万亿量级的参数规模,平均单卡可承载200亿参数。

据业内人士分析,“国产ChatGPT”争夺战第一阶段的胜方,一定是从百度、阿里巴巴这类巨头企业中产生,原因是“打造类ChatGPT产品,不仅需要搭建科学、前沿的训练模型,更需要前台交互和云计算技术作为支撑,这显然是大型互联网公司才能满足的要求。”

除此之外,还有成本的考量。有研究机构测算,训练1750亿参数语言大模型GPT-3,需要上万个CPU/GPU24小时不间断录入数据,所消耗的能耗相当于开车往返地球和月球,且单次训练就需要花费460万美元。这样“烧钱”的模式,中小企业显然无力承受。

重重挑战

抢占“ChatGPT”领域的技术高地,已经成为我国人工智能行业的共识。问题是,即便大厂成功突围,顺利打造出类ChatGPT产品,那与真正的ChatGPT之间又会有多少差距?

首先要面对的是训练参数上的差距。资料显示,支撑ChatGPT的GPT自然语言预训练大模型,自2018年到2021年已进行了三轮迭代,参数规模实现了从1亿、15亿到1750亿这一指数级别的增长。也正是通过对如此海量文本数据(覆盖网页、书籍、新闻等渠道)的深度学习,ChatGPT获得了比其他AI聊天工具更丰富的知识储备,即便面对复杂开放式问题也能迅速作答。而目前,除百度文心大模型ERNIE(2600亿)暂时实现超越外,国内大多数训练模型的参数还无法与ChatGPT所依托的GPT-3比肩。

而据最新消息显示,OpenAI筹备的GPT-4模型也将于不久后发布。根据往代GPT模型的迭代速度不难预测,其一旦上线,势必要引发国内企业的新一轮追赶。

再者,在训练模型上,我国企业还需要直面与ChatGPT依托的GPT-3之间的“代差”。有专家指出,在AI模型的发展理念以及相关技术的理解上,谷歌与GPT模型背后的OpenAI公司实际上存在半年到一年的差距,而国内企业则更是落后了两年左右。

此外,我国在部分核心芯片领域也面临“卡脖子”难题。正因如此,就短期而言,大厂打造的“国产类ChatGPT”产品即使面世,也可能需要正视差距,暂时扮演“追赶者”的角色。

但并非没有“弯道超车”的机会。据容联云AI研究院院长刘杰说,中国移动互联网的活跃度和体量领先全球,互联网应用发展速度也最快,这为AI技术和平台落地应用提供了广泛的场景。“在局部应用中开始超越,这也是业界的共识。”

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文
嘻疯 发自 凹非寺量子位 | 公众号 QbitAI刚刚,NeurIPS 2025最佳论文奖、..
阿里千问开源4款Qwen3.5小尺寸模型,满足资源受限至轻量应用不同需求..
【太平洋科技快讯】3月3日消息,阿里千问近日开源四款Qwen3.5更小尺寸模..
实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%..
它用时四分钟左右,写完了1200多行代码。从实测结果来看,游戏设计与前端..
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队..
衡宇 发自 凹非寺量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具..
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus..
衡宇 发自 凹非寺量子位 | 公众号 QbitAI三天不开源,Qwen团队手就痒。昨..
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
全球最快的开源大模型来了——速度达到了每秒2000个tokens!虽然只有320..
激活170亿参数 Qwen3.5实测 重构大模型性价比逻辑
2月16日Qwen3.5正式开源,以3970亿总参数、仅170亿激活参数的架构实现性..
Qwen最新闭源模型曝光!实测夸克“对话助手”
10月23日,阿里旗下夸克正式上线“对话助手”。从界面上看,它像是“塞进..
林俊旸离职后,Qwen的变与不变
来源:视觉中国OpenAI早期也曾采用垂直整合的架构模式,并集中资源完成了..
关于作者
乖乖(普通会员)
文章
1968
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索