Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行

by 小互
2024年6月12日
in XiaoHu.AI日报
0 0
0
Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行
0
SHARES
484
VIEWS
Share on FacebookShare on Twitter

Stability AI 开源其Stable Diffusion 3 Medium 模型,该模型是其迄今为止最先进的文本到图像开放模型,包含 20 亿个参数。

Stable Diffusion 3 Medium 模型的尺寸较小,这使得它能够在消费级 PC 和笔记本电脑以及企业级 GPU 上良好运行。同时,它的这种尺寸特点也使其有潜力成为文本到图像模型的下一个标准。

X2Twitter.com_1800866335028879360(720p)

主要特性与功能:

  • 图像质量改进:该模型在图像质量上有显著提升,能够生成更高质量、更细腻的图像。
  • 复杂提示理解:改进了对复杂文本提示的理解能力,能够更准确地将文本描述转换为图像。
  • 资源效率:在资源使用方面进行了优化,能够在更少的计算资源下实现较高的性能。
SD3 Medium 的独特之处:
  • Photorealism:克服常见的手部和面部瑕疵,无需复杂工作流程即可提供高质量图像。
  • Prompt Adherence:理解涉及空间关系、构图元素、动作和风格的复杂提示。
  • Typography:在生成文本方面取得前所未有的成果,无人工痕迹和拼写错误。
  • Resource-efficient:适用于标准消费级 GPU,低 VRAM 占用。
  • Fine-Tuning:能够从小数据集吸收细微细节,适合定制。

模型介绍:

  • 模型名称:Stable Diffusion 3 Medium
  • 模型类型:多模态扩散变压器 (MMDiT) 文本到图像生成模型
  • 技术详情:使用三个固定的预训练文本编码器(OpenCLIP-ViT/G、CLIP-ViT/L 和 T5-xxl)

训练数据和方法:

  • 预训练数据:模型在 10 亿张图像上进行了预训练,这些图像包括合成数据和过滤的公开数据。
  • 精调数据:精调数据包括 3000 万高质量美学图像和 300 万偏好数据图像,重点关注特定视觉内容和风格。

要尝试 Stable Diffusion 3 模型,可以使用 Stability Platform 上的 API ,在 Stable Artisan 上注册免费的三天试用,并通过 Discord 尝试 Stable Artisan。

官方介绍:https://stability.ai/news/stable-diffusion-3-medium

模型下载:https://huggingface.co/stabilityai/stable-diffusion-3-medium

  • 技术报告:技术报告链接
  • GitHub 资源:
    • ComfyUI
    • StableSwarmUI

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
338
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
450
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
279
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
617
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
429

Recommendeds

2023-12-21 18:02:32 Twitter

5 VIEWS
2024年3月6日
Google开发了一种名为TimesFM的时间序列预测模型 可预测未来

Google开发了一种名为TimesFM的时间序列预测模型 可预测未来

497 VIEWS
2024年5月12日
Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动

Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动

60 VIEWS
2024年3月13日
Google扩充Gemma开源家族 推出CodeGemma 和 RecurrentGemma模型

Google扩充Gemma开源家族 推出CodeGemma 和 RecurrentGemma模型

311 VIEWS
2024年4月10日
Llama3 中文综合资源库 集合了与Llama3 模型相关的各种中文资料

Llama3 中文综合资源库 集合了与Llama3 模型相关的各种中文资料

755 VIEWS
2024年5月11日
Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面

Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面

374 VIEWS
2024年5月6日
微软正式推出 Microsoft Designer 与 Microsoft 产品无缝集成 随时随地进行图像设计

微软正式推出 Microsoft Designer 与 Microsoft 产品无缝集成 随时随地进行图像设计

396 VIEWS
2024年7月22日
Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

124 VIEWS
2024年7月25日
OpenAI 与 Thrive 公司将创建一个AI健康教练 改变人们的健康习惯预防疾病发生

OpenAI 与 Thrive 公司将创建一个AI健康教练 改变人们的健康习惯预防疾病发生

304 VIEWS
2024年7月10日
Mistral AI 发布最新一代开源模型:Mistral Large 2 1230亿参数

Mistral AI 发布最新一代开源模型:Mistral Large 2 1230亿参数

275 VIEWS
2024年7月25日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版