Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行

by 小互
2024年6月12日
in XiaoHu.AI日报
0 0
0
Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行
0
SHARES
484
VIEWS
Share on FacebookShare on Twitter

Stability AI 开源其Stable Diffusion 3 Medium 模型,该模型是其迄今为止最先进的文本到图像开放模型,包含 20 亿个参数。

Stable Diffusion 3 Medium 模型的尺寸较小,这使得它能够在消费级 PC 和笔记本电脑以及企业级 GPU 上良好运行。同时,它的这种尺寸特点也使其有潜力成为文本到图像模型的下一个标准。

X2Twitter.com_1800866335028879360(720p)

主要特性与功能:

  • 图像质量改进:该模型在图像质量上有显著提升,能够生成更高质量、更细腻的图像。
  • 复杂提示理解:改进了对复杂文本提示的理解能力,能够更准确地将文本描述转换为图像。
  • 资源效率:在资源使用方面进行了优化,能够在更少的计算资源下实现较高的性能。
SD3 Medium 的独特之处:
  • Photorealism:克服常见的手部和面部瑕疵,无需复杂工作流程即可提供高质量图像。
  • Prompt Adherence:理解涉及空间关系、构图元素、动作和风格的复杂提示。
  • Typography:在生成文本方面取得前所未有的成果,无人工痕迹和拼写错误。
  • Resource-efficient:适用于标准消费级 GPU,低 VRAM 占用。
  • Fine-Tuning:能够从小数据集吸收细微细节,适合定制。

模型介绍:

  • 模型名称:Stable Diffusion 3 Medium
  • 模型类型:多模态扩散变压器 (MMDiT) 文本到图像生成模型
  • 技术详情:使用三个固定的预训练文本编码器(OpenCLIP-ViT/G、CLIP-ViT/L 和 T5-xxl)

训练数据和方法:

  • 预训练数据:模型在 10 亿张图像上进行了预训练,这些图像包括合成数据和过滤的公开数据。
  • 精调数据:精调数据包括 3000 万高质量美学图像和 300 万偏好数据图像,重点关注特定视觉内容和风格。

要尝试 Stable Diffusion 3 模型,可以使用 Stability Platform 上的 API ,在 Stable Artisan 上注册免费的三天试用,并通过 Discord 尝试 Stable Artisan。

官方介绍:https://stability.ai/news/stable-diffusion-3-medium

模型下载:https://huggingface.co/stabilityai/stable-diffusion-3-medium

  • 技术报告:技术报告链接
  • GitHub 资源:
    • ComfyUI
    • StableSwarmUI

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
485
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
341
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
454
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
280
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
621
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
432

Recommendeds

Google NotebookLM 推出企业版和个性化控制 你可以自定义AI播客内容

Google NotebookLM 推出企业版和个性化控制 你可以自定义AI播客内容

177 VIEWS
2024年10月18日
Claude 推出针对开发者自动生成提示词 并测试提示效果的工具

Claude 推出针对开发者自动生成提示词 并测试提示效果的工具

678 VIEWS
2024年7月10日
BlenderAlchemy:集成GPT-4V 通过聊天形式来进行3D图形编辑

BlenderAlchemy:集成GPT-4V 通过聊天形式来进行3D图形编辑

81 VIEWS
2024年4月30日
特斯拉正在招聘人员来进行Optimus机器人训练工作 时薪48美金

特斯拉正在招聘人员来进行Optimus机器人训练工作 时薪48美金

247 VIEWS
2024年8月21日
Chameleon:能同时理解和生成文本与图像混合模态模型

Chameleon:能同时理解和生成文本与图像混合模态模型

200 VIEWS
2024年5月22日
Project Astra详细介绍:Google的全能AI助手 能听、能看并能实时回答任何问题

Project Astra详细介绍:Google的全能AI助手 能听、能看并能实时回答任何问题

165 VIEWS
2024年5月16日
Multi-LoRA:动态集成多个LoRAs 来精确控制图像的生成过程

Multi-LoRA:动态集成多个LoRAs 来精确控制图像的生成过程

126 VIEWS
2024年3月2日
PROTEUS:斯坦福大学开发的 通过单张图片让人物进行实时唱歌和说话的AI

PROTEUS:斯坦福大学开发的 通过单张图片让人物进行实时唱歌和说话的AI

580 VIEWS
2024年6月14日
Perplexity 接入 Yelp 的评论数据 融入到其聊天机器人服务中

Perplexity 接入 Yelp 的评论数据 融入到其聊天机器人服务中

21 VIEWS
2024年3月13日
Perplexity 推出全新 AI 驱动购物助手:Shop Like a Pro 支持搜索结果一键下单

Perplexity 推出全新 AI 驱动购物助手:Shop Like a Pro 支持搜索结果一键下单

260 VIEWS
2024年11月19日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版