Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段

by 小互
2024年9月11日
in XiaoHu.AI日报
0 0
0
Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段
0
SHARES
383
VIEWS
Share on FacebookShare on Twitter

Vidu升级其 AI 视频模型,支持让任意主体保持一致

重点在于在生成图像时保持主体的一致性,尤其是针对角色和物体类输入的图像。主要功能包括:

  • 单一主体一致性:工具能够确保单一角色或物体在生成的图像中保持一致。
  • 角色控制:支持各种类型角色(如真人、动物、奇幻角色)的一致性
  • 同时支持不同的艺术风格(如写实、2D、3D等)的控制。
  • 身体控制:该功能还提供角色面容、半身和全身图像的一致性控制。
  • 支持商业广告场景的应用
oIPIgEgg9Y1QmAFfhwW4fRn5WHlDABFkDQzAHM
特点1:上传角色类的单一主体图片,均能保持主体一致
  • 支持单一主体的角色可控,暂不支持多主体
  • 支持多种类型的角色可控,如真人、动物、奇幻角色等
  • 支持多种画风的角色可控,如写实、2D、3D等
真人角色一致性

A woman with a delicate, elegant face, short brown hair, and bright red lips, dressed in a shimmering dress, smiles warmly at the camera

385656b3

 

A woman with a delicate, elegant face, short brown hair, and bright red lips, dressed in a shimmering qipao, smiles warmly at the camera. She waves gracefully with a joyful expression before turning and walking out of frame. The camera captures a close-up of her smile and hand as she waves, transitioning to a medium shot as she exits the frame. The visual style is realistic, with warm lighting to emphasize her charm and elegance

2f0dad02

 

动物角色一致性

This graceful cocker spaniel, adorned with long ears and a coat of warm, light-brown hues, gracefully ambles towards the lens, its every step filled with joy and poetic elegance

动物-1

 

2D角色一致性

The girl with black hair stood by the seashore, when suddenly she heard her name being called. She turned around, her eyes filled with confusion, scanning the horizon for the source of the voice

bce6da0d_chf3_prob4

3D角色一致性

The owl, adorned with verdant feathers, peered curiously around, its large, round eyes taking in every detail of its surroundings with avid interest

虚构角色-1
特点2:物体类单一主体图片,均能保持主体一致
  • 支持任意单一物体的一致可控
  • 支持单一物体的较高细节还原
  • 支持商业广告场景的应用

Nestled within a vibrant garden, a double bed sat invitingly, exuding an air of comfort and tranquility. The lush greenery and fragrant blooms surrounding it created a serene atmosphere, perfect for escaping the hustle and bustle of daily life

商品-1

A stylish handbag with a braided handle and a polka dot scarf is elegantly displayed on a luxury showcase. The scene is set in a chic boutique with soft, warm lighting that highlights the rich brown color of the bag and its shiny gold heart-shaped clasp. The atmosphere exudes sophistication and exclusivity, inviting admiration

recukUW65SWTwf_0

As the sun casts its golden glow over jagged rock formations, a lone figure emerges, their sneakers gripping the uneven terrain with unwavering confidence. These aren’t your ordinary sneakers; they’re built for the unforgiving landscape, where every step is a test of strength and endurance. The rugged tread digs into the rocky surface, providing traction that defies gravity, allowing the wearer to conquer peaks and traverse valleys with ease

 

A sleek drone, the Mavic Pro, is displayed prominently in a high-tech store, showcasing its modern design with gray and silver accents. The store is filled with futuristic gadgets and glowing screens, creating an immersive technological atmosphere. The drone’s camera glints under bright lights, emphasizing its advanced features. The camera uses a close-up shot to capture the intricate details of the drone, highlighting its propellers and lens

recumV60NzSION_0

特点3:支持角色的面容、半身、全身的一致可控

  • 支持单一角色的面容、半身、全身的一致可控
  • 如需重点保持主体面容一致,需仅截取单一主体的清晰面容图
  • 如需重点保持主体半身一致(面容+上半身服饰),仅需截取单一主体的清晰半身图
  • 如需重点保持主体全身一致(全身特征),仅需截取单一主体的清晰全身图

面容一致性

A young girl with large, expressive eyes and short black hair is dressed in a simple, elegant Chinese traditional robe. She sits quietly in an ancient palace, her delicate hands holding an open book as she reads with deep focus​

eb735ec1

 

半身一致性

An elegant woman dressed in traditional Chinese clothing with delicate floral patterns gave a speech on the podium, creating a fusion of ancient and modern aesthetics. The camera captured her expressions and movements during her speech, emphasizing the harmonious fusion of tradition and modernity

林黛玉-2

An elegant woman dressed in traditional Chinese clothing with delicate floral patterns gave a speech on the podium, creating a fusion of ancient and modern aesthetics. The camera captured her expressions and movements during her speech, emphasizing the harmonious fusion of tradition and modernity

人物-3 (1)

 

全身一致性

A cheerful cartoon snowman, wearing a crown and holding a Starbucks cup, with the Starbucks logo clearly visible, takes a sip of coffee. The cup features Starbucks’ iconic green and white logo, which blends seamlessly with the Yeti’s colorful and fun design. The background is still bright red, and the snowman’s happy expression indicates that he is enjoying his coffee. The visual style remains consistent with the original, maintaining a bright and whimsical atmosphere

雪王
参考一致性功能具体操作步骤
9月11日 (1)
为何我无法得到较优的生成结果?
  • 如上传黑白图片,有时可能会出现人物面容身体特征/衣物特征一致性较差的情况(建议多抽卡)
  • 如上传名人图片,有时可能会出现人物面容身体特征/衣物特征一致性较差的情况(建议多抽卡)
  • 请确保您有权使用所上传的名人图像,避免侵犯版权和肖像权

如您希望生成有强交互效果的视频,如所选主体是一只包,希望生成人物手持包包展示特定姿态的视频,当前此类强交互视频效果尚待提升。我们正不断优化此功能,未来将逐步改善,敬请期待

  • 您希望重点保持图片主体的哪部分尽量保持不变,则需框选对应区域:
  • 如您重点想保持面容特征的一致性,上传图片后却框选了半身图,则生成结果的角色面容特征有时会发生偏离
  • 如您重点想保持面容特征的一致性,同时修改角色的衣物特征,则需确保您上传图片后仅框选了角色的头部,用Prompt(提示词)描述您期望的角色衣物特征

在线体验:https://www.vidu.studio/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用

Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用

141 VIEWS
2024年9月11日
APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用

APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用

309 VIEWS
2024年7月11日
Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备

Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备

50 VIEWS
2024年3月11日
实时打字翻译工具 支持中英文等多种语言的文字和语音实时翻译

实时打字翻译工具 支持中英文等多种语言的文字和语音实时翻译

318 VIEWS
2024年7月29日
OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好  链式思维提示可能适得其反

OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反

607 VIEWS
2024年9月13日
MedSAM-2:基于SAM-2 的能够处理多种2D和3D医学图像的模型

MedSAM-2:基于SAM-2 的能够处理多种2D和3D医学图像的模型

327 VIEWS
2024年8月6日
吴恩达AI课程:AI Python 初学者课程 每节课5分钟 1小时学会AI Python编程

吴恩达AI课程:AI Python 初学者课程 每节课5分钟 1小时学会AI Python编程

2k VIEWS
2024年9月11日
ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音

ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音

233 VIEWS
2024年6月1日
SD变现宝:一键把 ComfyUI 工作流转换成各种小程序 并带有支付功能 可直接商业化

SD变现宝:一键把 ComfyUI 工作流转换成各种小程序 并带有支付功能 可直接商业化

1.2k VIEWS
2024年8月12日
AtomoVideo:高保真图像到视频生成 符合真实世界运动状态

AtomoVideo:高保真图像到视频生成 符合真实世界运动状态

58 VIEWS
2024年3月6日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版