🎉 GLM Image 已发布 - 开源 SOTA 文字渲染能力

用 GLM Image 生成精准文字渲染的专业图像

GLM Image 采用自回归+扩散解码器混合架构
擅长生成商业海报、PPT、科普图等知识密集型场景图像

💎 工业级生成质量,支持多种分辨率

placeholderplaceholderplaceholderplaceholderplaceholderplaceholder

99+ 用户正在使用 GLM Image

hero

什么是 GLM Image?

GLM Image 是 Z.AI 推出的新一代图像生成模型,采用混合架构,在文字渲染和知识密集型场景生成方面达到开源 SOTA 水平。

混合架构创新

采用自回归模型+扩散解码器混合架构,兼顾全局指令理解与局部细节刻画。

精准文字渲染

在文字渲染准确性方面达到开源 SOTA 水平,支持多区域、长文本的精准生成。

知识密集场景

擅长生成包含复杂逻辑关系、流程描述和文字标注的科普插图和原理示意图。

多种分辨率

支持 1:1、3:4、4:3、16:9 等多种比例,分辨率范围 512px-2048px。

为何选择 GLM Image

开源 SOTA 水平的文字渲染能力,专为知识密集型场景优化。

在 CVTG-2K 和 LongText-Bench 评测中,GLM Image 的文字渲染准确性位居开源模型第一。

GLM Image 应用场景

适用于多种需要精准文字渲染和复杂布局的图像生成场景:

1

商业海报

生成节日海报和商业宣传图,构图完整、视觉层次清晰,文字内容精准嵌入,适用于品牌传播等商业场景。

2

科普插图

创作包含复杂逻辑关系、流程描述和文字标注的科普插图和原理示意图,清晰准确传达知识结构。

3

多格漫画

生成电商展示图、故事漫画等多格图像时,有效保持整体内容风格和主体形象一致性,提高多处文字生成准确性。

4

社交媒体图文

创作封面设计和版式结构相对复杂的社交媒体图文内容,支持灵活排版和多样化表达。

GLM Image 核心特性

先进的技术架构,带来卓越的图像生成能力。

混合架构

9B 自回归模型 + 7B DiT 扩散解码器,兼顾语义理解与细节刻画。

文字渲染专家

Word Accuracy 0.9116,NED 0.9557,开源模型第一。

多分辨率支持

支持 1:1、3:4、4:3、16:9 等比例,512px-2048px 范围。

快速生成

通过 API 调用即可快速生成高质量图像,简单高效。

高质量

提供工业级图像生成能力。

完善的 API

提供 Python、Java 等多语言 SDK,易于集成。

开源 SOTA 水平

在权威评测中表现出色。

0.9116 Word Accuracy

0.9116

Word Accuracy

0.9557 NED 评分

0.9557

NED 评分

2048px 最大分辨率

2048px

最大分辨率

用户对 GLM Image 的评价

听听设计师、开发者和内容创作者如何使用 GLM Image 提升工作效率。

GLM Image 的文字渲染能力太强了!以前生成海报总是文字错乱,现在可以直接用于商业项目,节省了大量时间。

张晓明, 平面设计师

张晓明

平面设计师

生成科普插图时,GLM Image 能准确呈现复杂的流程图和文字标注,让我的内容更加专业易懂。

李梅, 科普博主

李梅

科普博主

用 GLM Image 快速生成 PPT 配图和产品宣传图,文字嵌入精准,视觉效果出色,大大提高了工作效率。

王强, 产品经理

王强

产品经理

社交媒体图文创作的好帮手,支持多种布局和文字排版,生成的图片质量高,互动效果明显提升。

陈思, 自媒体运营

陈思

自媒体运营

API 集成简单,文档清晰,价格也很实惠。已经在我的 SaaS 产品中使用,用户反馈非常好。

刘浩, 独立开发者

刘浩

独立开发者

生成电商主图和多格展示图时,GLM Image 能保持风格一致,文字清晰准确,转化率提升了 30%。

赵芳, 电商运营

赵芳

电商运营

关于 GLM Image 的常见问题

还有其他问题?欢迎访问官方文档或联系我们。







开始使用 GLM Image 生成精美图像

立即体验开源 SOTA 级别的文字渲染能力。