> 自媒体 > (AI)人工智能 > ChatGPT-5“不够惊艳”?最新实测来了
ChatGPT-5“不够惊艳”?最新实测来了
来源:财联社
2025-08-30 11:04:31
166
管理

《科创板日报》8月8日讯(记者 李佳怡)ChatGPT-5,技术封顶了?

北京时间8月8日凌晨1点,人工智能巨头OpenAI正式推出GPT-5。发布会上,山姆·奥特曼比喻到:“GPT-3如对话高中生,偶有灵光但稳定性不足;GPT-4如与大学生对话,兼具智能性与实用性;而GPT-5则像是与专家交谈,一名各个领域堪称博士级的专家。”

发布会现场,OpenAI团队展示出GPT-5在编程、数理逻辑、文本创作、健康咨询、视觉感知等多维度,整体智能水平较前代产品均有较大更新与提升。

GPT-5在编程方面提升最大,尤其在复杂前端架构生成与大型代码库调试环节表现突出,用户只需提出相应需求,GPT-5就能生成网站、游戏等;文本创作模块同步升级,可将抽象概念转化为兼具文学性、情感共鸣与专业韵律的内容;此外在健康医疗领域,GPT-5能够基于用户背景、知识储备及地域特征动态生成个性化建议。

此外,GPT-5在事实性准确性方面也有较大进步。据OpenAI数据显示,相较于GPT-4o,GPT-5在通用任务中的事实错误率降低约45%;启用深度思考模式后,其错误率较o3模型下降约80%。

据OpenAI透露,目前GPT-5已向免费版、Plus版、Pro版以及Team版用户开放,企业版和教育行业的用户则需再等待一周方可使用新模型。其中,免费版用户虽可直接使用GPT-5,但仍有一定的限额,超额后将自动切换至GPT-5 Mini模型。

《科创板日报》记者随即更新ChatGPT,并对其进行实测发现,免费版用户现已可访问GPT-5基础功能。在中文版“自定义ChatGPT”界面中,能够看到最新上线的“人格”模式,包括挑剔者(犀利毒舌型)、机械(高效直言型)、倾听者(善解人意型)、技术宅(热情探究型)四类预设交互风格,用户可依据需求自主切换输出风格。

据OpenAI介绍,在GPT-5中部署了新型安全训练框架——安全补全(safe completions),即让模型在预设安全框架内生成最大化实用性的回答,而涉及潜在风险的请求,GPT-5则会明确标注拒绝原因并提供合规替代路径。

因此,当记者提出“怎么制作炸药”的问题时,GPT-5未简单拒绝回答,而是明确声明该问题涉及高危、违法信息,因此无法提供配方、比例及操作步骤等关键内容。同时主动转向建设性引导,询问用户是否需要整理炸药的化学原理与历史演变等合规替代材料。

需要注意的是,ChatGPT-5信息处理的稳定性还有待观望。记者先后向GPT-5发送硕士毕业论文与期刊论文,要求其归纳总结论文主题、框架、研究思路以及研究结论等信息,并生成相应的研究框架。

在针对学术文本处理能力的实测中可以看到,GPT-5对万字左右的期刊文献展现出高效稳定的解析能力,可快速提炼研究主题、逻辑框架与核心结论,并自主调用Python代码生成可视化研究导图。然而当处理超过4万字的硕士论文时,模型出现明显的逻辑断层与编码异常,未能完整构建研究框架。

形成完整思维导图的期刊文献与编码异常的硕士论文

记者也留意到,GPT-5全球上线短短一天内,小红书、X等海内外主流平台涌现密集用户反馈,质疑其实际体验与宣传存在落差,如人格模式机械感过强、长上下文理解稳定性不足、额度太少、功能升级幅度未达预期等问题。

“此次更新没有颠覆性惊艳的地方,给人一种OpenAI能力封顶的感觉。”有用户向记者坦言,“不如GPT-4好用。”

上海交通大学副教授、上海人工智能实验室青年科学家谢伟迪也向记者表示,感觉上OpenAI "还是太注重语言模型了,没有特别的注重多模态模型,没有当时GPT4或者GPT 4V的出来的时候惊艳了。”

针对用户对GPT-5缺乏创新性的质疑,西南证券研究院计算机首席分析师王湘杰则向记者指出,此次更新或为OpenAI战略重心转向"All in One"生态整合的标志。据其观察,以OpenAI为首的海外大模型厂商已从追求单点技术爆破,转为聚焦高可靠性架构优化与场景易用性升级,这也是产业进入下半场竞争的必然选择。

王湘杰表示,OpenAI内部希望未来ChatGPT能够成为用户日常刚性需求的首选入口,“就像现在大家每天都打开微信,对于OpenAI来说,他们希望将ChatGPT从工具进化为‘All in one’的AI Agent,最终在青年群体数字生活中占据绝对地位。”

此外,面对GPT-5在编程、医疗等领域逼近人类水平引发的职业替代忧虑,王湘杰向记者明确表示:“当前AI仍不具备取代人类职业的基础条件。”

“离AI取代人类的职业还有很长的路要走,包括AI的可靠性、适配性、能耗等方面,目前来看还是远远不够的。”王湘杰强调,AI向AGI演进仍需突破多重技术屏障,中长期定位仍是“效率增强工具”,核心价值在于重构人机协作范式、提高用户效率,而非替代人类角色。

(科创板日报记者 李佳怡)

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
新车品质“糟糕”榜,BBA被按在地上摩擦,中国品牌无一上榜..
好吧,漫哥承认标题党了。根据J.D.Power最新的2025美国新车质量排行榜,..
2026新势力品牌新车前瞻:零跑还会继续领跑吗?
【太平洋汽车 汽车动态】2025年,各大造车新势力都交出了不错的销量成绩..
我买了5辆车后才明白:普通家庭买车必须看品牌,避免踩坑吃亏..
我买了5辆车才明白:普通家庭买车,品牌就是“护身符”这两年,我身边不..
合资车接连退场!若只剩国产车,我们真能扛住吗?
2025年7月8日,广汽菲克被法院正式裁定破产,曾经风光无限的Jeep品牌,彻..
合资车全撤,只剩国产?广汽菲克破产后,中国车市的终极拷问来了..
广汽菲克破产清算的消息,像一颗石子投进了平静的湖面,却没激起太大的水..
预算8-10万最值得入手的合资车!便宜抗造省油,开到80岁不用换..
预算8-10万落地最值得入手的6款自动挡合资车,没错全是自动挡,而且还是..
领克900主打家用豪华,比合资车强在哪?
领克900比合资车强在它更懂中国家庭的实际需求,从空间灵活性、安全防护..
合资车的“省心经济学”
#春节与智己从容出行#买卡罗拉车前,2025年1月18日老公给我的一串数据,..
太惨!1月合资车销量完整排名:轩逸再丢冠,皓影、宝来未进前20..
看完乘联会公布的2026年1月合资车销量榜单,给人最直观的感受就是“冷清..
关于作者
御赐铲屎官..(普通会员)
文章
1857
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103930

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索