Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI 学院 AI 教程

教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

by 小互
2024年9月10日
in AI 教程
0 0
0
教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型
0
SHARES
288
VIEWS
Share on FacebookShare on Twitter

FLUX.1模型的发布迅速风靡全球,生成的图像质量超越了现有的开源模型,并且支持通过简单的操作进行微调,无需编程知识。Replicate 上已经发布了数百个公开的 Flux 微调,还有数千个私有的微调。

Flux 最令人兴奋的功能之一是它能够微调面部图像,而这一点在以前的开源图像生成模型(如 Stable Diffusion 或 SDXL)中是很难实现的。自 Dreambooth 以来,从仅几张训练图像中获得出色结果的微调方式再也没有如此简单。

本文详细介绍了如何在Replicate平台上使用自己的照片来微调FLUX.1图像训练一个自己的图像模型,可以使用你自己的照片生成各种风格的新的图像。如超级英雄、卡通角色或冒险者形象等。

关键步骤包括:
  1. 准备训练图片:至少10张高质量的、从不同角度和光线条件下拍摄的面部照片。
  2. 选择触发词:创建一个唯一的“触发词”,用于后续在提示文本中激活该模型。
  3. 创建并训练模型:在Replicate上上传图片和触发词,进行训练,过程大约需要20分钟。
  4. 生成图像:使用训练后的模型生成包含触发词的详细描述文本,即可生成与提示相关的图像。

步骤 0: 准备工作

在开始微调 FLUX.1 模型之前,你需要以下物品:

  • 一个 Replicate 账户
  • 几张自己的照片作为训练图片
  • 2-3 美元,用于支付模型训练费用

步骤 1: 收集训练图片

你需要收集几张自己的照片进行训练,最好使用不同角度、光线条件和背景的照片,推荐至少 10 张高质量面部照片,但最少也需要 2 张。

图片要求:

  • 支持格式:WebP、JPG、PNG
  • 分辨率:建议使用 1024×1024 或更高分辨率
  • 文件名:随意命名,文件名不影响训练
  • 纵横比:图片可以是方形、横向或纵向
  • 建议最少 10 张图片,图片越多,效果越好
  • 选择多样化的图片,例如不同背景、服装、灯光、角度等

准备步骤:

  1. 将图片存放在一个文件夹中,例如名为 data。
  2. 将该文件夹压缩成 .zip 文件,命名为 data.zip。


步骤 2: 选择唯一的触发词

在微调 FLUX.1 模型时,你需要选择一个唯一的触发词,后续会在图像生成提示文本中使用这个词。

photo of YOUR_TRIGGER_WORD_HERE looking super-cool, riding on a segway scooter

触发词要求:

  • 选择触发词时,请注意以下几点:
    • 它应该是独特的,比如 MY_UNIQ_TRGGR。想象“个性车牌”,但不限长度。
    • 它不应是任何语言中的现有词汇,如 dog 或 cyberpunk。
    • 不要使用 TOK,因为如果你想 将其与其他微调组合,它会发生冲突。
    • 大小写无关紧要,但大写字母可以帮助你在提示词中将触发词与其他文本区分开来。

    对于我的 zeke/ziki-flux 微调,我选择了 ZIKI 作为触发词。简短、独特且容易记住。

    确定好触发词了吗?记住它,你将在下一步中使用它。

例如,作者在示例中使用了 “ZIKI” 作为触发词,你可以根据自己的喜好选择类似的唯一字符组合。


步骤 3: 创建并训练模型

接下来,你将在 Replicate 平台上上传训练图片并开始训练模型。你可以选择使用网页形式进行训练,或者通过 API 来自动化处理。

网页训练步骤:

  1. 访问 Flux 微调表单。
  2. 选择模型发布位置:你可以选择将微调后的模型发布为公共或私有。
  3. 上传训练图片:在 input_images 字段中,上传之前创建的 data.zip 压缩包。
  4. 输入触发词:在 trigger_word 字段中,输入之前选择的唯一触发词。
  5. 选择训练步数:默认设置为 1000 步,少于此数量可能无法很好地学习图片中的概念,超过 1000 步则可能浪费时间和成本。
  6. 点击 Create training 开始训练。


步骤 4: 等待训练完成

训练过程非常快,但仍需几分钟。如果你使用十张图像和1000步,整个过程大约需要20分钟。利用这段时间起身离开电脑,伸展一下手脚,喝点水等。

回来后,你的模型应该就准备好了。


步骤 5: 使用网页生成图像

当训练完成后,你的微调模型已可以使用。通过网页表单输入提示语句,生成图像。

  1. 访问 Replicate 平台 的 web playground。
  2. 输入提示语:在提示中包含你之前设置的触发词。例如:
    arduino
    "photo of ZIKI looking super-cool, riding a segway scooter"

    FLUX 模型对于详细的提示语效果更好,所以尽可能提供更多的描述。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁

Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁

375 VIEWS
2024年10月12日
EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导

EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导

520 VIEWS
2024年7月16日
Omne:通过多智能体合作 解决AI长期记忆能力并提高AI推理能力

Omne:通过多智能体合作 解决AI长期记忆能力并提高AI推理能力

410 VIEWS
2024年10月25日
OpenAI 发布带有视觉能力的GPT-4-Turbo 128k上下文

OpenAI 发布带有视觉能力的GPT-4-Turbo 128k上下文

148 VIEWS
2024年4月10日
Livekit推出一个开源的精准语音轮次检测模型 可精准识别用户是否说完话

Livekit推出一个开源的精准语音轮次检测模型 可精准识别用户是否说完话

205 VIEWS
2024年12月21日
Cloudflare 推出对抗 AI 机器人的工具 可一键阻止所有 AI 机器人、抓取工具和爬虫

Cloudflare 推出对抗 AI 机器人的工具 可一键阻止所有 AI 机器人、抓取工具和爬虫

240 VIEWS
2024年7月29日
微软对Azure AI语音服务升级 发布9种更真实的AI语音

微软对Azure AI语音服务升级 发布9种更真实的AI语音

5.4k VIEWS
2024年4月1日
NVIDIA Broadcast:利用 AI 提升音频和视频质量 能够去除噪音、替换虚拟背景

NVIDIA Broadcast:利用 AI 提升音频和视频质量 能够去除噪音、替换虚拟背景

414 VIEWS
2024年6月29日
ElevenLabs 推出 Audio Native 自动将你的内容转换为播客

ElevenLabs 推出 Audio Native 自动将你的内容转换为播客

321 VIEWS
2024年5月18日
PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人

PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人

572 VIEWS
2024年10月6日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版