Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段

by 小互
2024年9月11日
in XiaoHu.AI日报
0 0
0
Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段
0
SHARES
383
VIEWS
Share on FacebookShare on Twitter

Vidu升级其 AI 视频模型,支持让任意主体保持一致

重点在于在生成图像时保持主体的一致性,尤其是针对角色和物体类输入的图像。主要功能包括:

  • 单一主体一致性:工具能够确保单一角色或物体在生成的图像中保持一致。
  • 角色控制:支持各种类型角色(如真人、动物、奇幻角色)的一致性
  • 同时支持不同的艺术风格(如写实、2D、3D等)的控制。
  • 身体控制:该功能还提供角色面容、半身和全身图像的一致性控制。
  • 支持商业广告场景的应用
oIPIgEgg9Y1QmAFfhwW4fRn5WHlDABFkDQzAHM
特点1:上传角色类的单一主体图片,均能保持主体一致
  • 支持单一主体的角色可控,暂不支持多主体
  • 支持多种类型的角色可控,如真人、动物、奇幻角色等
  • 支持多种画风的角色可控,如写实、2D、3D等
真人角色一致性

A woman with a delicate, elegant face, short brown hair, and bright red lips, dressed in a shimmering dress, smiles warmly at the camera

385656b3

 

A woman with a delicate, elegant face, short brown hair, and bright red lips, dressed in a shimmering qipao, smiles warmly at the camera. She waves gracefully with a joyful expression before turning and walking out of frame. The camera captures a close-up of her smile and hand as she waves, transitioning to a medium shot as she exits the frame. The visual style is realistic, with warm lighting to emphasize her charm and elegance

2f0dad02

 

动物角色一致性

This graceful cocker spaniel, adorned with long ears and a coat of warm, light-brown hues, gracefully ambles towards the lens, its every step filled with joy and poetic elegance

动物-1

 

2D角色一致性

The girl with black hair stood by the seashore, when suddenly she heard her name being called. She turned around, her eyes filled with confusion, scanning the horizon for the source of the voice

bce6da0d_chf3_prob4

3D角色一致性

The owl, adorned with verdant feathers, peered curiously around, its large, round eyes taking in every detail of its surroundings with avid interest

虚构角色-1
特点2:物体类单一主体图片,均能保持主体一致
  • 支持任意单一物体的一致可控
  • 支持单一物体的较高细节还原
  • 支持商业广告场景的应用

Nestled within a vibrant garden, a double bed sat invitingly, exuding an air of comfort and tranquility. The lush greenery and fragrant blooms surrounding it created a serene atmosphere, perfect for escaping the hustle and bustle of daily life

商品-1

A stylish handbag with a braided handle and a polka dot scarf is elegantly displayed on a luxury showcase. The scene is set in a chic boutique with soft, warm lighting that highlights the rich brown color of the bag and its shiny gold heart-shaped clasp. The atmosphere exudes sophistication and exclusivity, inviting admiration

recukUW65SWTwf_0

As the sun casts its golden glow over jagged rock formations, a lone figure emerges, their sneakers gripping the uneven terrain with unwavering confidence. These aren’t your ordinary sneakers; they’re built for the unforgiving landscape, where every step is a test of strength and endurance. The rugged tread digs into the rocky surface, providing traction that defies gravity, allowing the wearer to conquer peaks and traverse valleys with ease

 

A sleek drone, the Mavic Pro, is displayed prominently in a high-tech store, showcasing its modern design with gray and silver accents. The store is filled with futuristic gadgets and glowing screens, creating an immersive technological atmosphere. The drone’s camera glints under bright lights, emphasizing its advanced features. The camera uses a close-up shot to capture the intricate details of the drone, highlighting its propellers and lens

recumV60NzSION_0

特点3:支持角色的面容、半身、全身的一致可控

  • 支持单一角色的面容、半身、全身的一致可控
  • 如需重点保持主体面容一致,需仅截取单一主体的清晰面容图
  • 如需重点保持主体半身一致(面容+上半身服饰),仅需截取单一主体的清晰半身图
  • 如需重点保持主体全身一致(全身特征),仅需截取单一主体的清晰全身图

面容一致性

A young girl with large, expressive eyes and short black hair is dressed in a simple, elegant Chinese traditional robe. She sits quietly in an ancient palace, her delicate hands holding an open book as she reads with deep focus​

eb735ec1

 

半身一致性

An elegant woman dressed in traditional Chinese clothing with delicate floral patterns gave a speech on the podium, creating a fusion of ancient and modern aesthetics. The camera captured her expressions and movements during her speech, emphasizing the harmonious fusion of tradition and modernity

林黛玉-2

An elegant woman dressed in traditional Chinese clothing with delicate floral patterns gave a speech on the podium, creating a fusion of ancient and modern aesthetics. The camera captured her expressions and movements during her speech, emphasizing the harmonious fusion of tradition and modernity

人物-3 (1)

 

全身一致性

A cheerful cartoon snowman, wearing a crown and holding a Starbucks cup, with the Starbucks logo clearly visible, takes a sip of coffee. The cup features Starbucks’ iconic green and white logo, which blends seamlessly with the Yeti’s colorful and fun design. The background is still bright red, and the snowman’s happy expression indicates that he is enjoying his coffee. The visual style remains consistent with the original, maintaining a bright and whimsical atmosphere

雪王
参考一致性功能具体操作步骤
9月11日 (1)
为何我无法得到较优的生成结果?
  • 如上传黑白图片,有时可能会出现人物面容身体特征/衣物特征一致性较差的情况(建议多抽卡)
  • 如上传名人图片,有时可能会出现人物面容身体特征/衣物特征一致性较差的情况(建议多抽卡)
  • 请确保您有权使用所上传的名人图像,避免侵犯版权和肖像权

如您希望生成有强交互效果的视频,如所选主体是一只包,希望生成人物手持包包展示特定姿态的视频,当前此类强交互视频效果尚待提升。我们正不断优化此功能,未来将逐步改善,敬请期待

  • 您希望重点保持图片主体的哪部分尽量保持不变,则需框选对应区域:
  • 如您重点想保持面容特征的一致性,上传图片后却框选了半身图,则生成结果的角色面容特征有时会发生偏离
  • 如您重点想保持面容特征的一致性,同时修改角色的衣物特征,则需确保您上传图片后仅框选了角色的头部,用Prompt(提示词)描述您期望的角色衣物特征

在线体验:https://www.vidu.studio/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

亚马逊推出了一款人工智能购物助手:Rufus 帮助用户进行购物决策

亚马逊推出了一款人工智能购物助手:Rufus 帮助用户进行购物决策

398 VIEWS
2024年7月14日
使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题

使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题

199 VIEWS
2024年9月14日
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

614 VIEWS
2024年12月23日
Flawless:利用AI创建 与原版电影一样沉浸和真实的唇形同步配音版本

Flawless:利用AI创建 与原版电影一样沉浸和真实的唇形同步配音版本

591 VIEWS
2024年5月26日
Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

322 VIEWS
2024年11月5日
NeuralGCM:Google开发的结合AI技术和传统大气环流模型的天气预测模拟系统

NeuralGCM:Google开发的结合AI技术和传统大气环流模型的天气预测模拟系统

136 VIEWS
2024年7月23日
SuperCraft:通过无限工作流画布 将草图直接转换成真实产品图像 并自动生成3D渲染

SuperCraft:通过无限工作流画布 将草图直接转换成真实产品图像 并自动生成3D渲染

1.3k VIEWS
2024年8月26日
Coconut:连续思维链 一种新的大语言模型推理方法 直接在内部思考

Coconut:连续思维链 一种新的大语言模型推理方法 直接在内部思考

359 VIEWS
2024年12月12日
Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages

Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages

450 VIEWS
2024年5月31日
Alter 3:利用 GPT-4驱动的人形机器人 将自然语言命令转换为机器人动作

Alter 3:利用 GPT-4驱动的人形机器人 将自然语言命令转换为机器人动作

208 VIEWS
2024年6月29日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版