> 自媒体 > (AI)人工智能 > 浪潮信息:公司源1.0大模型结构与GPT-3类似,参数量增加40%
浪潮信息:公司源1.0大模型结构与GPT-3类似,参数量增加40%
来源:澎湃新闻
2023-04-11 13:11:26
609
管理

2月14日,服务器厂商浪潮信息(000977)在深交所互动平台上回复投资者问题时表示,公司在AIGC(人工智能生成内容)赛道已从底层计算能力、中间层大模型算法能力和上层行业应用方面进行布局和待续研发投入,未来将会持续发布AIGC的支撑产品。

浪潮信息还介绍,公司2021年发布的源1.0大模型是面向中文的超大规模预训练自然语言模型,模型结构与GPT-3类似,与GPT-3相比参数量增加40%,训练数据集提升10倍,达到了2457亿参数,训练使用了5TB的高质量中文数据。

GPT-3是美国OpenAI研发的聊天机器人程序ChatGPT目前采用的模型结构。华安证券报告称,GPT3模型就需要上千片A100芯片超一个月的训练时间,其中包括1750亿个参数、45TB数据量。

浪潮信息还表示,公司一直在推进大模型的行业应用落地,如“AI剧本杀”、“ 心理咨询AI陪练”、“AI反诈”、“金陵诗会”、企业”智能客服大脑”等应用。“ChatGPT是一款非常优秀的应用产品,对我们规划设计产品也提供了非常好的借鉴。未来我们也会持续不断地发布基于源大模型的落地应用产品。”

有投资者提问浪潮信息,是否有能力为人工智能生成内容和对话机器人提供算力服务?浪潮信息表示,公司在人工智能服务器领域的市占率位居全球AI服务器市场第一,在中国市场份额已连续五年保持50%以上,相关AI产品对于内容生成的全流程的计算能力需求都可满足。百度、腾讯是公司重要客户。

2月14日收盘,浪潮信息股价为33.92元,涨幅3.86%。进入2月份以来,市场对ChatGPT概念热捧,浪潮信息股价已经大幅上涨43.36%。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文
嘻疯 发自 凹非寺量子位 | 公众号 QbitAI刚刚,NeurIPS 2025最佳论文奖、..
阿里千问开源4款Qwen3.5小尺寸模型,满足资源受限至轻量应用不同需求..
【太平洋科技快讯】3月3日消息,阿里千问近日开源四款Qwen3.5更小尺寸模..
实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%..
它用时四分钟左右,写完了1200多行代码。从实测结果来看,游戏设计与前端..
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队..
衡宇 发自 凹非寺量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具..
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus..
衡宇 发自 凹非寺量子位 | 公众号 QbitAI三天不开源,Qwen团队手就痒。昨..
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
全球最快的开源大模型来了——速度达到了每秒2000个tokens!虽然只有320..
激活170亿参数 Qwen3.5实测 重构大模型性价比逻辑
2月16日Qwen3.5正式开源,以3970亿总参数、仅170亿激活参数的架构实现性..
Qwen最新闭源模型曝光!实测夸克“对话助手”
10月23日,阿里旗下夸克正式上线“对话助手”。从界面上看,它像是“塞进..
林俊旸离职后,Qwen的变与不变
来源:视觉中国OpenAI早期也曾采用垂直整合的架构模式,并集中资源完成了..
关于作者
秋叶无痕(普通会员)
文章
2016
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索