Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Concept Sliders:通过拖到滑块来精确控制特定图像特征 如年龄、性别、眼睛大小等

by 小互
2024年9月10日
in XiaoHu.AI日报
0 0
0
Concept Sliders:通过拖到滑块来精确控制特定图像特征 如年龄、性别、眼睛大小等
0
SHARES
158
VIEWS
Share on FacebookShare on Twitter

Concept Sliders 是一种用于扩散模型(如 Stable Diffusion)的LoRA 适配器,允许用户在图像生成过程中对特定概念进行精细控制。与依赖提示词生成图像的传统方法不同,Concept Sliders 通过引入可调整的“滑块”,用户可以在保持图像整体结构不变的情况下,调节某些特定属性(如眼睛大小、光照强度、风格等)的强度,从而实现更高精度的图像生成和编辑,而无需反复修改提示词。

  • 概念滑动器: 为扩散模型中的特定概念创建滑动器,允许用户通过调整滑动器的数值来控制图像生成或编辑的特定特征,如年龄、性别、眼睛大小等。
  • 支持多种扩散模型: 支持 SD1.x 和 SD2.x 版本的扩散模型训练,还包括 SD-XL 版本的扩展。
  • 项目支持实验性的 FLUX-1 模型 滑动器训练,尽管该模型与 SDXL 架构不同,但可以用于尝试基于 FLUX 的滑动器。
  • 文本滑动器: 基于文本描述的滑动器,通过输入描述如“我想让人看起来更高兴”,来生成相应的滑动器。
  • 图像滑动器: 可以基于一组图像(如编辑前后的图片对)训练滑动器来实现图像编辑。
  • 项目集成了 ControlNet 功能,使得社区用户可以通过该技术进一步增强滑动器的控制效果,扩展其应用场景。

主要功能:

  1. 精确调整图像中的概念:
    • 通过 LoRA 适配器 对扩散模型进行微调,以创建用于精确控制特定图像特征的滑动器。例如,控制年龄、性别、表情等。
    • 用户可以通过简单的滑动调整参数来控制图像中的某些元素,来实现对生成或编辑图像中具体特征的控制。例如,你可以让人物的眼睛变大或变小,或者调整画面中的光照强度。这种控制是连续的,你可以根据需求微调,直到满意为止。
  2. 文本概念滑块:
    • 用户可以通过描述文本来生成滑动器。例如,输入 “我想让人看起来更高兴”,模型会生成一个用于调整“开心”程度的滑动器。
    • 提供 GPT-4 生成滑动器的集成功能,使得创建滑动器更加便捷。
    • 当你通过提示语生成图像时,通常会希望对某些属性进行更细致的调整,比如“年轻人”和“老年人”之间的过渡。文本概念滑块允许你通过输入简单的文字描述,训练模型记住这些概念,然后通过滑块来控制这个概念的强弱。例如,你可以让图像中的人物随着滑块移动逐渐变老,而不改变其他属性。
      By using a small set of textual descriptions of the attributes to control, Concept Sliders can be trained to allow finegrained control of generated images during inference. By scaling the slider factor, users can control the strength of the edit.
      通过使用一小组要控制的属性的文本描述,可以训练概念滑块以允许在推理过程中对生成的图像进行细粒度控制。通过缩放滑块系数,用户可以控制编辑的强度。
      We show how several attributes of an image can be controlled using different sliders. We note that due to the low-rank formulation, the parameters are light weight, easy to share, and plug.
      我们展示了如何使用不同的滑块控制图像的多个属性。我们注意到,由于低秩公式,参数重量轻,易于共享和插入。
      We demonstrate weather sliders for “delightful”, “dark”, “tropical”, and “winter”. For delightful, we notice that the model sometimes make the weather bright or adds festive decorations. For tropical, it adds tropical plants and trees. Finally, for winter, it adds snow.
      我们演示了“宜人”、“黑暗”、“热带”和“冬季”的天气滑块。为了令人愉快,我们注意到模型有时会使天气明亮或添加节日装饰。对于热带地区,它添加了热带植物和树木。最后,在冬天,它增加了雪。
      We demonstrate style sliders for “pixar”, “realistic details”, “clay”, and “sculpture”.
      我们演示了“皮克斯”、“现实细节”、“粘土”和“雕塑”的风格滑块。
  3. 视觉概念滑块:
    • 支持基于一组图像(例如:编辑前后的图像对)来训练滑动器,实现对特定视觉特征(如眼睛大小、面部特征等)的精确控制。
    • 可用于对图像的属性进行细致编辑,例如放大眼睛、改变面部表情等。
    • 有些视觉元素可能很难用文字描述,比如微小的面部表情变化或者不同的光影效果。对于这些难以用文字描述的概念,Concept Sliders 支持通过成对的图像训练滑块,你可以选择几张具有对比效果的图片,来训练模型识别这些细节,然后通过滑块来调节这些视觉元素。
      Sliders can be created for concepts that can not be described in words. These sliders are created by artists by using 6-8 pairs of images.
      可以为无法用语言描述的概念创建滑块。这些滑块由艺术家使用 6-8 对图像创建。

      Stylespace latents can be transferred from styleGAN to Stable Diffusion XL.
      Stylespace 潜伏可以从 styleGAN 转移到 Stable Diffusion XL。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

苹果发布Apple Intelligence 技术报告 证实其AI系统是在Google TPU 集群上训练的

苹果发布Apple Intelligence 技术报告 证实其AI系统是在Google TPU 集群上训练的

201 VIEWS
2024年7月30日
哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息

哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息

336 VIEWS
2024年10月4日
VSR:利用AI算法精确识别 一键去除视频中的字幕

VSR:利用AI算法精确识别 一键去除视频中的字幕

961 VIEWS
2024年4月20日
ChatGPT 记忆功能上线 能记住你和GPT互动的所有内容

ChatGPT 记忆功能上线 能记住你和GPT互动的所有内容

861 VIEWS
2024年4月30日
Reka Core:和GPT 4性能不相上下的多模态语言模型

Reka Core:和GPT 4性能不相上下的多模态语言模型

366 VIEWS
2024年4月17日
100 个 Midjourney 随机风格参考 Sref Codes库  以及Sref Codes教程

100 个 Midjourney 随机风格参考 Sref Codes库 以及Sref Codes教程

556 VIEWS
2024年6月3日
Optimizer AI:专为视频自动生成音效的AI工具 可为视频自动配音

Optimizer AI:专为视频自动生成音效的AI工具 可为视频自动配音

108 VIEWS
2024年3月11日
英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型

英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型

166 VIEWS
2024年5月2日
EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导

EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导

520 VIEWS
2024年7月16日
奥特曼:GPT-5的能力提升将超乎想象…许多公司将面临被碾压淘汰

奥特曼:GPT-5的能力提升将超乎想象…许多公司将面临被碾压淘汰

48 VIEWS
2024年3月18日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版