> 自媒体 > (AI)人工智能 > 复旦版ChatGPT升级中!目标打造中文大型语言模型,研究成果将会开源
复旦版ChatGPT升级中!目标打造中文大型语言模型,研究成果将会开源
来源:上观新闻
2023-05-16 01:08:52
567
管理

“基本功能都实现了”

“有ChatGPT那味儿”

“一本正经地胡说八道”……

为致敬《流浪地球2》而取名MOSS的复旦版ChatGPT“火”了,大量内测申请、采访、投资、合作邀约扑面而来。

项目开发者——复旦大学计算机科学技术学院邱锡鹏团队,对此有点出乎意料。

邱锡鹏把MOSS比作一个“聪明的小孩”,已展示出成为通用人工智能(AGI)大框架的潜能,即便现在还不擅长写诗、解题,但也在逐步的学习和升级中。

实际上,邱锡鹏也让6岁的女儿和MOSS聊天,发现小朋友可以愉快地和MOSS对话很长时间。

当然,MOSS模型的目标不止于追求和ChatGPT能力相近。邱锡鹏说,MOSS的定位是自然语言处理领域乃至是通用人工智能领域最前沿的探索。与ChatGPT更看重落地性能不同,而我们更看重MOSS的下一代发展,即如何实现通用人工智能。

有限资源下做出的类ChatGPT

但是,作为学术研究型实验室,MOSS的服务器资源相对有限。

2月20日晚,MOSS冲上微博热搜后,服务器瞬时访问量达到上千万,一度导致网络崩溃。

目前,MOSS服务器的最大容纳人数在几万左右,研究团队会随机选择报名用户发送内测邀请码。

当然,与ChatGPT最大差距还有参数规模。ChatGPT的参数量多达1750亿个,而MOSS的参数量大约是前者的1/10左右。

“我们认为在这个参数级别上,这些模型也能涌现出一定的智能能力,我们也能赋予它们对话的能力,实验结果证实了我们的猜想。”邱锡鹏坦言,“我们选择百亿规模这样级别的参数,是因为学术界主要是做一些探索性的技术,这个规模也在财力物力承受范围之内。”

除此之外,在迭代能力方面,MOSS与ChatGPT也存在着较大差异。

用户量越大,交互数据越多,模型的迭代能力就越强。参数规模、用户交互数据体量上的巨大差异,导致了与ChatGPT相比,MOSS在事实类知识储备上稍显不足。

但在邱锡鹏看来,MOSS的理解能力、学习能力以及思维能力,表现其实还不错。

目标中文大型语言模型

但是,小也有小的好处,MOSS的特点是容易适应个性化需求,如果接入外部知识库,增加搜索特定领域资源的能力,就可以精准地为各行各业赋能。

不过,当前的MOSS,中文水平还存在明显不足,研发团队已经开始构造高质量中文数据库。

“ChatGPT模型并不向中国内地开放,而且国外开发者不可能以中文为主去发展他们的模型。”邱锡鹏说,中国要想站在大型语言模型或者将来的通用人工智能等技术的最前沿,就必须要建设自己的语言模型基座。我们相信MOSS将来一定会具有很好的中文理解能力和生成能力,我们的目标是打造一个具有中国特色的中文大型语言模型。

更高质量的中文数据、更多的交互数据、更大的参数规模,是未来MOSS优化的重点。

邱锡鹏透露,团队将把研究成果无偿地分享给学术界,并在规范使用的前提下开放给业界,让更多企业可以个性化应用。

研发顺利的话,MOSS将会在3月底左右开源。

从科幻片的一个角色,到真实存在的中文大型语言模型,在邱锡鹏眼中,MOSS可以说是理想照进了现实。

他认为,未来5到10年,我们会像现在接受搜索引擎一样,接受通用人工智能。

撰稿:白羽 通讯员 殷梦昊 许文嫣

摄影:戚心茹 寸菲

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文
嘻疯 发自 凹非寺量子位 | 公众号 QbitAI刚刚,NeurIPS 2025最佳论文奖、..
阿里千问开源4款Qwen3.5小尺寸模型,满足资源受限至轻量应用不同需求..
【太平洋科技快讯】3月3日消息,阿里千问近日开源四款Qwen3.5更小尺寸模..
实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%..
它用时四分钟左右,写完了1200多行代码。从实测结果来看,游戏设计与前端..
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队..
衡宇 发自 凹非寺量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具..
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus..
衡宇 发自 凹非寺量子位 | 公众号 QbitAI三天不开源,Qwen团队手就痒。昨..
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
全球最快的开源大模型来了——速度达到了每秒2000个tokens!虽然只有320..
激活170亿参数 Qwen3.5实测 重构大模型性价比逻辑
2月16日Qwen3.5正式开源,以3970亿总参数、仅170亿激活参数的架构实现性..
Qwen最新闭源模型曝光!实测夸克“对话助手”
10月23日,阿里旗下夸克正式上线“对话助手”。从界面上看,它像是“塞进..
林俊旸离职后,Qwen的变与不变
来源:视觉中国OpenAI早期也曾采用垂直整合的架构模式,并集中资源完成了..
关于作者
国务院环卫工..(普通会员)
文章
1983
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索