Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

Alchemist:能够在真实图像中随意改变物体的材料属性(粗糙度、金属度、透明度)

by 小互
2024年7月29日
in AI 项目
0 0
0
Alchemist:能够在真实图像中随意改变物体的材料属性(粗糙度、金属度、透明度)
0
SHARES
232
VIEWS
Share on FacebookShare on Twitter

谷歌研究团队开发了一种名为“Alchemist”的方法,允许用户在保持照片真实感的同时,对图像中对象的材料属性(如颜色、光泽和透明度)进行参数化编辑。也就是能够在真实图像中线性改变材料属性(粗糙度、金属度、反照率、透明度)。

该方法通过使用合成数据集对文本到图像(T2I)生成模型进行微调,实现了对材料属性的精确控制。模型被训练成在保持对象几何形状不变的情况下,仅编辑特定的材料属性,并保持其他属性的一致性。

Alchemist的功能特点

  • 精确材料属性编辑:能够对图像中的物体进行细致的材料属性调整,如增加或减少物体的光滑度、改变物体的金属光泽、调整颜色和透明度等。

    视频播放器
    7月29日(4)

    Media error: Format(s) not supported or source(s) not found

    下载文件: https://img.xiaohu.ai/2024/07/7%E6%9C%8829%E6%97%A54.mp4
    00:00
    00:00
    00:00
    使用上/下箭头键来增高或降低音量。
  • 保持其他图像属性不变:在编辑材料属性的同时,保持图像中的其他属性(如物体的形状和背景)不变,确保编辑后的图像看起来自然且真实。

    视频播放器
    7月29日(5)

    Media error: Format(s) not supported or source(s) not found

    下载文件: https://img.xiaohu.ai/2024/07/7%E6%9C%8829%E6%97%A55.mp4
    00:00
    00:00
    00:00
    使用上/下箭头键来增高或降低音量。
  • 高度真实感:Alchemist 使用文本到图像(T2I)生成模型,并通过合成数据进行微调,确保编辑后的图像保持高度的真实感。即使是对透明度的调整,模型也能正确填充背景并生成逼真的光影效果。

  • 无需额外辅助信息:不同于传统方法,Alchemist不需要额外的3D几何数据、深度图或环境贴图,只需要输入图像和编辑指令即可进行材料属性的调整。

  • 合成数据训练与泛化:通过使用生成的合成数据进行训练,Alchemist能够将其学习到的材料属性编辑能力有效地应用于真实图像。

  • 多属性同时编辑:支持在单次操作中同时编辑多个材料属性,使用户能够更加灵活地对图像中的物体进行复杂的材料调整。

  • 用户友好:Alchemist 的编辑操作简单直观,无需专业的图像处理技能。用户只需输入所需的编辑指令和强度值,模型即可自动完成复杂的材料属性调整。

  • 应用于3D重建:Alchemist不仅适用于静态图像,还可以将其编辑能力扩展到3D重建技术(如NeRF),对3D场景中的材料属性进行控制。

    • 室内设计:用户可以轻松模拟不同颜色和材质的房间效果,帮助做出装修决策。
    • 产品设计:设计师可以快速生成不同材料和颜色的产品效果图,方便产品开发和市场测试。
    • 3D 渲染:通过与NeRF(神经辐射场)结合,Alchemist 能够生成一致的3D渲染图像,支持下游的3D任务。

材料编辑示例:

  • 粗糙度:改变各种物体的粗糙度,如鸡蛋、花瓶和陶器。
    视频播放器
    7月29日

    Media error: Format(s) not supported or source(s) not found

    下载文件: https://img.xiaohu.ai/2024/07/7%E6%9C%8829%E6%97%A5.mp4
    00:00
    00:00
    00:00
    使用上/下箭头键来增高或降低音量。
  • 透明度:调整物体的透明度,如尤达、南瓜和花瓶。
    视频播放器
    7月29日(1)

    Media error: Format(s) not supported or source(s) not found

    下载文件: https://img.xiaohu.ai/2024/07/7%E6%9C%8829%E6%97%A51.mp4
    00:00
    00:00
    00:00
    使用上/下箭头键来增高或降低音量。
  • 金属度:修改物品的金属属性,如茶壶、苹果和玩具。
    视频播放器
    7月29日(2)

    Media error: Format(s) not supported or source(s) not found

    下载文件: https://img.xiaohu.ai/2024/07/7%E6%9C%8829%E6%97%A52.mp4
    00:00
    00:00
    00:00
    使用上/下箭头键来增高或降低音量。
  • 反照率:改变物体的反照率,如苹果、鞋子和雕像。
    视频播放器
    7月29日(3)

    Media error: Format(s) not supported or source(s) not found

    下载文件: https://img.xiaohu.ai/2024/07/7%E6%9C%8829%E6%97%A53.mp4
    00:00
    00:00
    00:00
    使用上/下箭头键来增高或降低音量。
  • Support authors and subscribe to content

    This is premium stuff. Subscribe to read the entire article.

    Login if you have purchased

    加入会员

    加入会员查看更多会员内容和教程。
    超过1000+的会员内容,每天更新。
    开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
485
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
341
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
454
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
280
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
621
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
432

Recommendeds

OpenAI CTO Mira Murati 母校访谈实录 博士级别的人工智能有望在一年半的时间内发布

OpenAI CTO Mira Murati 母校访谈实录 博士级别的人工智能有望在一年半的时间内发布

97 VIEWS
2024年6月22日
Context Autopilot:全球首个上下文引擎驱动的 AI 办公助手

Context Autopilot:全球首个上下文引擎驱动的 AI 办公助手

365 VIEWS
2024年11月14日
Prompt 学习地图 09 |概念科普,什么是“温度值“?

Prompt 学习地图 09 |概念科普,什么是“温度值“?

146 VIEWS
2024年4月18日
英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频

英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频

210 VIEWS
2024年5月5日
TurboEdit:基于文本的即时图像编辑 保持图像整体不变的情况下 实时修改特定区域

TurboEdit:基于文本的即时图像编辑 保持图像整体不变的情况下 实时修改特定区域

251 VIEWS
2024年8月19日
Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐

Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐

571 VIEWS
2024年9月18日
微软 Azure 宣布了一系列更新 推出Phi-3无服务器微调 支持Llama 3.1 405B等1600个模型

微软 Azure 宣布了一系列更新 推出Phi-3无服务器微调 支持Llama 3.1 405B等1600个模型

148 VIEWS
2024年7月27日
AMT-APC:自动生成钢琴伴奏模型 将任意音乐转换成与原曲匹配钢琴伴奏

AMT-APC:自动生成钢琴伴奏模型 将任意音乐转换成与原曲匹配钢琴伴奏

364 VIEWS
2024年10月18日
CAT3D:1分钟从任意数量的图像生成一致的高质量3D新视图

CAT3D:1分钟从任意数量的图像生成一致的高质量3D新视图

201 VIEWS
2024年5月18日

2023-12-21 18:02:32 Twitter

5 VIEWS
2024年3月6日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

- Select Visibility -

    No Result
    View All Result
    • Home
    • AI 工具
    • XiaoHu.AI 学院
      • AI 教程
      • AI 课程
    • XiaoHu.AI日报
    • 开源项目案例库
      • AI 论文
      • AI 资源
      • AI 项目
    • 加入会员
    • →社群
    • Login

    © 2024 Xiaohu.AI

    Are you sure want to unlock this post?
    Unlock left : 0
    Are you sure want to cancel subscription?
    转到手机版