> 自媒体 > (AI)人工智能 > Ideogram 4.0 开源图像模型,GPT image 2 的强劲对手
Ideogram 4.0 开源图像模型,GPT image 2 的强劲对手
来源:小轻软件
2026-06-15 15:26:59
130
管理

AI 图像生成公司 Ideogram 发布了 4.0 版本文本到图像模型,首次以开放权重形式发布。该模型参数量为 93 亿,支持原生 2K 分辨率、透明背景和精确的布局控制。

Ideogram 4.0

Ideogram 4.0 是一个基于 Diffusion Transformer 架构的文本到图像模型,采用单流设计,文本和图像 token 在 34 层网络中共享投影。文本编码器使用 Qwen3-VL-8B-Instruct ,从 13 个中间层提取隐藏状态(来源: Ideogram 官网)。

该模型新增了四项核心功能。原生 2K 分辨率输出,无需后期放大。透明背景生成,设计师无需额外抠图。基于边界框的精确布局控制,用户可以通过 JSON 描述物体位置。文字渲染能力提升,适用于 Logo 和海报设计(来源: The Decoder )。

Ideogram 表示,可编辑文字和图层功能将在后续版本中上线(来源: Ideogram 官网)。

评测排名

根据 DesignArena 排行榜, Ideogram 4.0 在所有开放权重模型中排名第一。在文本到图像竞技场中,该模型在质量模式下排名第一,综合排名第九,仅落后于 OpenAI 和 Google 的闭源模型(来源: The Decoder )。

在 The Decoder 的基准测试中, Ideogram 4.0 超过了 Midjourney v8 ,与 Flux 基本持平(来源: The Decoder )。

定价

Ideogram 4.0 通过官方 API 提供三个质量层级(来源: Ideogram 官网):

质量层级

每张图片价格

Turbo

0.03 美元

Default

0.06 美元

Quality

0.10 美元

开放与授权

Ideogram 4.0 的权重和代码已在 GitHub 开源( ideogram-oss/ideogram-4 ),用户可以下载并在本地硬件上运行。模型支持使用自有数据进行微调。商业使用需要付费授权(来源: Ideogram 官网)。

该模型同步上线多个合作伙伴平台,包括 Hugging Face 、 ComfyUI 、 fal 、 Runware 、 Magnific 、 Krea AI 、 Leonardo AI 、 Picsart 、 Cloudflare 、 Replicate 等(来源: The Decoder )。

公司背景

Ideogram 成立于 2022 年,总部位于加拿大多伦多,创始团队来自 Google Brain 、 UC Berkeley 、 CMU 和多伦多大学。公司于 2024 年完成 8000 万美元 A 轮融资,目前约有 67 名员工(来源: Ideogram 官网 / LeadIQ )。

竞争格局

2026 年 AI 图像生成领域竞争激烈。微软于 5 月 26 日发布了 MAI-Image-2.5 ,在 Arena 排名第三。 Google 的 Gemini Omni 支持多模态输入和视频编辑。 Ideogram 4.0 的差异化在于开放权重和文字渲染能力(来源: Gigazine )。

从版本迭代速度看, Ideogram 从 1.0 到 4.0 用了约 18 个月。版本 1.0 发布于 2024 年 2 月, 2.0 于 2024 年 8 月, 3.0 于 2025 年 3 月(来源: Ideogram 文档)。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
横道不笑(普通会员)
文章
2150
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113750

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索