Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行

by 小互
2024年6月12日
in XiaoHu.AI日报
0 0
0
Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行
0
SHARES
484
VIEWS
Share on FacebookShare on Twitter

Stability AI 开源其Stable Diffusion 3 Medium 模型,该模型是其迄今为止最先进的文本到图像开放模型,包含 20 亿个参数。

Stable Diffusion 3 Medium 模型的尺寸较小,这使得它能够在消费级 PC 和笔记本电脑以及企业级 GPU 上良好运行。同时,它的这种尺寸特点也使其有潜力成为文本到图像模型的下一个标准。

X2Twitter.com_1800866335028879360(720p)

主要特性与功能:

  • 图像质量改进:该模型在图像质量上有显著提升,能够生成更高质量、更细腻的图像。
  • 复杂提示理解:改进了对复杂文本提示的理解能力,能够更准确地将文本描述转换为图像。
  • 资源效率:在资源使用方面进行了优化,能够在更少的计算资源下实现较高的性能。
SD3 Medium 的独特之处:
  • Photorealism:克服常见的手部和面部瑕疵,无需复杂工作流程即可提供高质量图像。
  • Prompt Adherence:理解涉及空间关系、构图元素、动作和风格的复杂提示。
  • Typography:在生成文本方面取得前所未有的成果,无人工痕迹和拼写错误。
  • Resource-efficient:适用于标准消费级 GPU,低 VRAM 占用。
  • Fine-Tuning:能够从小数据集吸收细微细节,适合定制。

模型介绍:

  • 模型名称:Stable Diffusion 3 Medium
  • 模型类型:多模态扩散变压器 (MMDiT) 文本到图像生成模型
  • 技术详情:使用三个固定的预训练文本编码器(OpenCLIP-ViT/G、CLIP-ViT/L 和 T5-xxl)

训练数据和方法:

  • 预训练数据:模型在 10 亿张图像上进行了预训练,这些图像包括合成数据和过滤的公开数据。
  • 精调数据:精调数据包括 3000 万高质量美学图像和 300 万偏好数据图像,重点关注特定视觉内容和风格。

要尝试 Stable Diffusion 3 模型,可以使用 Stability Platform 上的 API ,在 Stable Artisan 上注册免费的三天试用,并通过 Discord 尝试 Stable Artisan。

官方介绍:https://stability.ai/news/stable-diffusion-3-medium

模型下载:https://huggingface.co/stabilityai/stable-diffusion-3-medium

  • 技术报告:技术报告链接
  • GitHub 资源:
    • ComfyUI
    • StableSwarmUI

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
615
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 自然采光

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 特殊效果

256 VIEWS
2024年4月26日
PersonaTalk:字节跳动开发出可精准给视频进行AI配音的模型 能保持口型同步、说话风格完美匹配

PersonaTalk:字节跳动开发出可精准给视频进行AI配音的模型 能保持口型同步、说话风格完美匹配

1.4k VIEWS
2024年10月27日
哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息

哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息

336 VIEWS
2024年10月4日
儿童图书插图提示示范 为儿童创作引人入胜的插图

儿童图书插图提示示范 为儿童创作引人入胜的插图

346 VIEWS
2024年5月7日
VSR:利用AI算法精确识别 一键去除视频中的字幕

VSR:利用AI算法精确识别 一键去除视频中的字幕

961 VIEWS
2024年4月20日
英国作家协会调查显示,1/3的翻译者和1/4的插画师已经因AI失去了工作

英国作家协会调查显示,1/3的翻译者和1/4的插画师已经因AI失去了工作

577 VIEWS
2024年4月28日
Runway :关于未来AI生成式媒体工具界面和交互的设计原则

Runway :关于未来AI生成式媒体工具界面和交互的设计原则

121 VIEWS
2024年9月12日
微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI

微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI

285 VIEWS
2024年10月22日
浦语灵笔 IXC-2.5:能看懂视频,完整书写文章、自动生成网站的多模态模型

浦语灵笔 IXC-2.5:能看懂视频,完整书写文章、自动生成网站的多模态模型

338 VIEWS
2024年7月7日
由人类细胞构成 能够自我移动具有自组装能力的微小活体机器人

由人类细胞构成 能够自我移动具有自组装能力的微小活体机器人

10 VIEWS
2024年3月6日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版