智谱公司正式揭晓了其‘智谱2025开源年’计划的首个核心成果:CogView4。这款全新的开源文本生成图像模型不仅在性能上表现出色,更在汉字生成领域实现了重大突破.这是一款开创性的开源文生图模型,特别之处在于它首次实现了对汉字生成的支持。
CogView4模型内含60亿参数,专为中文环境设计,不仅支持原生中文输入,还能将中文文本直接转化为图像。其最显著的技术更新在于,该模型能够无缝处理中英文双语提示词,将字符巧妙融入图像之中,且对长达上百字的复杂提示词也能精准理解。
CogView4不仅是首个支持汉字生成的开源模型,还是首个遵循Apache 2.0协议的图像生成模型。智谱科技承诺,未来将陆续推出ControlNet、ComfyUI等生态支持,并即将发布一套完整的微调工具包,以满足用户多样化的需求。
CogView4在实际应用中展现出了惊人的创造力。无论是中英文海报的原图直出,还是根据古诗词意境绘制的精美插图,CogView4都能精准理解用户意图,将文字转化为生动形象的画面。该模型还支持超长提示词生成四格漫画或精细画面,为用户提供了前所未有的创作体验。
例如,用户只需输入一句简短的诗句“野径云俱黑,江船火独明”,CogView4就能迅速捕捉到诗句中的意象,将黑云、船、灯光、野径等元素巧妙融入画面之中,营造出一种静谧而神秘的氛围。

CogView-4 模型,该模型具有6B权重,支持原生中文输入,支持中文文字绘画。你可以前往在线体验。
相关导航
暂无评论...