Stability AI发布了关于Stable Diffusion 3(SD3)的研究论文,揭示了这一最新模型的技术细节。SD3在诸如DALL·E 3、Midjourney v6、Ideogram v1等先进的文本到图像生成系统中,在字体渲染和命令遵循方面根据人类偏好评估取得了更好的表现。SD3引入了一种新的多模态扩散变换器(MMDiT)架构,使用独立的权重集处理图像和语言表示,比以前的版本在文本理解和拼写能力上有所提高。
Stable Diffusion 3论文:一种新的多模态扩散变换器(MMDiT)架构
-
by 小互
- Categories: AI 论文
Related Content
Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考
by
小互
2024年12月25日
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
by
小互
2024年12月25日
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
by
小互
2024年12月24日
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
by
小互
2024年12月24日
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
by
小互
2024年12月23日