Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Concept Sliders:通过拖到滑块来精确控制特定图像特征 如年龄、性别、眼睛大小等

by 小互
2024年9月10日
in XiaoHu.AI日报
0 0
0
Concept Sliders:通过拖到滑块来精确控制特定图像特征 如年龄、性别、眼睛大小等
0
SHARES
158
VIEWS
Share on FacebookShare on Twitter

Concept Sliders 是一种用于扩散模型(如 Stable Diffusion)的LoRA 适配器,允许用户在图像生成过程中对特定概念进行精细控制。与依赖提示词生成图像的传统方法不同,Concept Sliders 通过引入可调整的“滑块”,用户可以在保持图像整体结构不变的情况下,调节某些特定属性(如眼睛大小、光照强度、风格等)的强度,从而实现更高精度的图像生成和编辑,而无需反复修改提示词。

  • 概念滑动器: 为扩散模型中的特定概念创建滑动器,允许用户通过调整滑动器的数值来控制图像生成或编辑的特定特征,如年龄、性别、眼睛大小等。
  • 支持多种扩散模型: 支持 SD1.x 和 SD2.x 版本的扩散模型训练,还包括 SD-XL 版本的扩展。
  • 项目支持实验性的 FLUX-1 模型 滑动器训练,尽管该模型与 SDXL 架构不同,但可以用于尝试基于 FLUX 的滑动器。
  • 文本滑动器: 基于文本描述的滑动器,通过输入描述如“我想让人看起来更高兴”,来生成相应的滑动器。
  • 图像滑动器: 可以基于一组图像(如编辑前后的图片对)训练滑动器来实现图像编辑。
  • 项目集成了 ControlNet 功能,使得社区用户可以通过该技术进一步增强滑动器的控制效果,扩展其应用场景。

主要功能:

  1. 精确调整图像中的概念:
    • 通过 LoRA 适配器 对扩散模型进行微调,以创建用于精确控制特定图像特征的滑动器。例如,控制年龄、性别、表情等。
    • 用户可以通过简单的滑动调整参数来控制图像中的某些元素,来实现对生成或编辑图像中具体特征的控制。例如,你可以让人物的眼睛变大或变小,或者调整画面中的光照强度。这种控制是连续的,你可以根据需求微调,直到满意为止。
  2. 文本概念滑块:
    • 用户可以通过描述文本来生成滑动器。例如,输入 “我想让人看起来更高兴”,模型会生成一个用于调整“开心”程度的滑动器。
    • 提供 GPT-4 生成滑动器的集成功能,使得创建滑动器更加便捷。
    • 当你通过提示语生成图像时,通常会希望对某些属性进行更细致的调整,比如“年轻人”和“老年人”之间的过渡。文本概念滑块允许你通过输入简单的文字描述,训练模型记住这些概念,然后通过滑块来控制这个概念的强弱。例如,你可以让图像中的人物随着滑块移动逐渐变老,而不改变其他属性。
      By using a small set of textual descriptions of the attributes to control, Concept Sliders can be trained to allow finegrained control of generated images during inference. By scaling the slider factor, users can control the strength of the edit.
      通过使用一小组要控制的属性的文本描述,可以训练概念滑块以允许在推理过程中对生成的图像进行细粒度控制。通过缩放滑块系数,用户可以控制编辑的强度。
      We show how several attributes of an image can be controlled using different sliders. We note that due to the low-rank formulation, the parameters are light weight, easy to share, and plug.
      我们展示了如何使用不同的滑块控制图像的多个属性。我们注意到,由于低秩公式,参数重量轻,易于共享和插入。
      We demonstrate weather sliders for “delightful”, “dark”, “tropical”, and “winter”. For delightful, we notice that the model sometimes make the weather bright or adds festive decorations. For tropical, it adds tropical plants and trees. Finally, for winter, it adds snow.
      我们演示了“宜人”、“黑暗”、“热带”和“冬季”的天气滑块。为了令人愉快,我们注意到模型有时会使天气明亮或添加节日装饰。对于热带地区,它添加了热带植物和树木。最后,在冬天,它增加了雪。
      We demonstrate style sliders for “pixar”, “realistic details”, “clay”, and “sculpture”.
      我们演示了“皮克斯”、“现实细节”、“粘土”和“雕塑”的风格滑块。
  3. 视觉概念滑块:
    • 支持基于一组图像(例如:编辑前后的图像对)来训练滑动器,实现对特定视觉特征(如眼睛大小、面部特征等)的精确控制。
    • 可用于对图像的属性进行细致编辑,例如放大眼睛、改变面部表情等。
    • 有些视觉元素可能很难用文字描述,比如微小的面部表情变化或者不同的光影效果。对于这些难以用文字描述的概念,Concept Sliders 支持通过成对的图像训练滑块,你可以选择几张具有对比效果的图片,来训练模型识别这些细节,然后通过滑块来调节这些视觉元素。
      Sliders can be created for concepts that can not be described in words. These sliders are created by artists by using 6-8 pairs of images.
      可以为无法用语言描述的概念创建滑块。这些滑块由艺术家使用 6-8 对图像创建。

      Stylespace latents can be transferred from styleGAN to Stable Diffusion XL.
      Stylespace 潜伏可以从 styleGAN 转移到 Stable Diffusion XL。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

GPTEngineer:AI 开发工程师 几秒钟内创建一个网站 并可一键部署

GPTEngineer:AI 开发工程师 几秒钟内创建一个网站 并可一键部署

694 VIEWS
2024年8月29日
ElevenLabs 推出音乐生成模型 ElevenLabs Music 可直接通过文本提示生成完整音乐

ElevenLabs 推出音乐生成模型 ElevenLabs Music 可直接通过文本提示生成完整音乐

396 VIEWS
2024年5月10日
TurboEdit:基于文本的即时图像编辑 保持图像整体不变的情况下 实时修改特定区域

TurboEdit:基于文本的即时图像编辑 保持图像整体不变的情况下 实时修改特定区域

251 VIEWS
2024年8月19日
Xai 发布 Grok-2 模型新版本 速度提升3倍 多语言指令遵循能力更强

Xai 发布 Grok-2 模型新版本 速度提升3倍 多语言指令遵循能力更强

289 VIEWS
2024年12月15日
CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

121 VIEWS
2024年5月3日
Midjourney不同相机角度的使用教程 提高图像摄影技巧

Midjourney不同相机角度的使用教程 提高图像摄影技巧

169 VIEWS
2024年5月1日
Meta AI 公布了多项新的研究成果 包括4个可用的AI模型和2个额外的研究成果

Meta AI 公布了多项新的研究成果 包括4个可用的AI模型和2个额外的研究成果

236 VIEWS
2024年6月19日
Meta 发布开源模型 Llama 3,以及新版本Meta AI 助手

Meta 发布开源模型 Llama 3,以及新版本Meta AI 助手

258 VIEWS
2024年4月19日
IDM-VTON:虚拟试衣技术 能够生成高度真实的虚拟试衣图像

IDM-VTON:虚拟试衣技术 能够生成高度真实的虚拟试衣图像

344 VIEWS
2024年4月25日
成立两年首次亮相就放王炸 MiniMax发布三款模型  语音模型、音乐模型和类似Sora视频模型

成立两年首次亮相就放王炸 MiniMax发布三款模型 语音模型、音乐模型和类似Sora视频模型

639 VIEWS
2024年9月2日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版