> 自媒体 > (AI)人工智能 > 实测豆包新上线视觉大模型1.6-vision,OpenAI GPT5要失眠了
实测豆包新上线视觉大模型1.6-vision,OpenAI GPT5要失眠了
来源:人人都是产品经理
2025-10-07 13:16:24
200
管理

凌晨上线的豆包 1.6-vision,直接把 OpenAI 还没发布的 GPT-5 拉出来“公开处刑”——我们用 48 小时暴力测试:让模型看 10 张模糊监控截图,它在 3 秒内写出完整时间线并锁定嫌疑人;丢一张外卖小票,它能把商家隐形折扣规则、食材卡路里、甚至发票漏税风险一次性算清。

这个很好理解,缩放、裁剪、旋转、划线都是图片工具的一种。

当下真的幻视我七八年前用OpenCV打比赛,不知道还有没有人记得这张包浆照片,当年但凡是做图像处理的都应该用过来改色、或者丢给CNN(卷积神经网络)来识别。

隔壁GPT5-thinking的识别准确率只有15.4%,能看出来它已经在努力放大细节了,但是每个字的划分区域不够准确导致的错误。

绘线几何|POINT

刚好提到point,我还给模型们准备了数学几何题,

Seed-1.6-vision在单次思考的过程也不是只会在固定的两点画线的,

point可以随意移动,超长的上下文让它可以一次输出十几张过程图。

GPT5-thinking这波属于是“虚空画线“了,

看来是用的PIL没有定点和连线的功能,

一句话总结就是好用,

实打实的好用,

默认开启的图像工具降低了写提示语的成本,

两两组合还可以完成画线,准点画框、旋转 八倍放大的操作,

求赶紧同步发布到可以直接使用的网页端,

降低使用门槛,

这样我们都可以用上我们自己的,

最好的模型。

@ 作者 / 卡尔

本文由人人都是产品经理作者【null】,微信公众号:【卡尔的AI沃茨】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
顶级超跑魅力来袭,你感受到了吗?
感受顶级超跑的夜驾魅力。Mclaren 765LT,Lamborghini Aventador svj,Ma..
春风又搞大动作!500SR四缸跑车新造型,要是3万出头你冲不冲?..
好消息来了!工信部这波操作,属实是提前剧透了!春风500SR的证件照刚流..
法拉利首款纯电超跑「Luce」内饰公开!传统与创新的结合!..
法拉利在美国旧金山与创意工作室 LoveFrom 联合举办发布会,宣布新车定名..
一辆人人都可以买得起的超级跑车,雪佛兰科尔维特 (2)..
这是一辆人人都可以买的起的超级跑车,雪佛兰科尔维特。因车标酷似五菱,..
6款新车信息:大众ID新车3月上市,2款复古跑车官图发布..
50年前的设计,如今还有人买单吗?Donkervoort P24 RS跑车近日发布官图,..
2025国内跑车销量榜,你的爱车在榜几啊?
2025年国内跑车市场格局稳定,奔驰CLE稳居主流跑车前列,保时捷911与718..
日产将标志性的超级跑车隐藏在一款不起眼的轿跑车中..
汽车制造商通常需要数年时间才能研发出一款新车,在此期间,这些公司会竭..
预算有限买不起法拉利时,可以考虑的10款超级跑车
1. 兰博基尼 Huracán除了法拉利之外,兰博基尼Huracán通常是汽车爱好者..
特斯拉:Model X和Model S将逐步停产,预计4月推出一款跑车,马斯克:机器..
1月29日,特斯拉CEO埃隆·马斯克称,2026年资本支出将“非常大”;预计下..
关于作者
帝王之星(普通会员)
文章
1879
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体104855

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索