GLM Image 采用自回归+扩散解码器混合架构
擅长生成商业海报、PPT、科普图等知识密集型场景图像
💎 工业级生成质量,支持多种分辨率
99+ 用户正在使用 GLM Image

GLM Image 是 Z.AI 推出的新一代图像生成模型,采用混合架构,在文字渲染和知识密集型场景生成方面达到开源 SOTA 水平。
采用自回归模型+扩散解码器混合架构,兼顾全局指令理解与局部细节刻画。
在文字渲染准确性方面达到开源 SOTA 水平,支持多区域、长文本的精准生成。
擅长生成包含复杂逻辑关系、流程描述和文字标注的科普插图和原理示意图。
支持 1:1、3:4、4:3、16:9 等多种比例,分辨率范围 512px-2048px。
开源 SOTA 水平的文字渲染能力,专为知识密集型场景优化。
适用于多种需要精准文字渲染和复杂布局的图像生成场景:
生成节日海报和商业宣传图,构图完整、视觉层次清晰,文字内容精准嵌入,适用于品牌传播等商业场景。
创作包含复杂逻辑关系、流程描述和文字标注的科普插图和原理示意图,清晰准确传达知识结构。
生成电商展示图、故事漫画等多格图像时,有效保持整体内容风格和主体形象一致性,提高多处文字生成准确性。
创作封面设计和版式结构相对复杂的社交媒体图文内容,支持灵活排版和多样化表达。
先进的技术架构,带来卓越的图像生成能力。
9B 自回归模型 + 7B DiT 扩散解码器,兼顾语义理解与细节刻画。
Word Accuracy 0.9116,NED 0.9557,开源模型第一。
支持 1:1、3:4、4:3、16:9 等比例,512px-2048px 范围。
通过 API 调用即可快速生成高质量图像,简单高效。
提供工业级图像生成能力。
提供 Python、Java 等多语言 SDK,易于集成。
在权威评测中表现出色。
Word Accuracy
NED 评分
最大分辨率
听听设计师、开发者和内容创作者如何使用 GLM Image 提升工作效率。
GLM Image 的文字渲染能力太强了!以前生成海报总是文字错乱,现在可以直接用于商业项目,节省了大量时间。
张晓明
平面设计师
生成科普插图时,GLM Image 能准确呈现复杂的流程图和文字标注,让我的内容更加专业易懂。
李梅
科普博主
用 GLM Image 快速生成 PPT 配图和产品宣传图,文字嵌入精准,视觉效果出色,大大提高了工作效率。
王强
产品经理
社交媒体图文创作的好帮手,支持多种布局和文字排版,生成的图片质量高,互动效果明显提升。
陈思
自媒体运营
API 集成简单,文档清晰,价格也很实惠。已经在我的 SaaS 产品中使用,用户反馈非常好。
刘浩
独立开发者
生成电商主图和多格展示图时,GLM Image 能保持风格一致,文字清晰准确,转化率提升了 30%。
赵芳
电商运营
还有其他问题?欢迎访问官方文档或联系我们。