Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

Loopy:通过音频驱动静态照片生成动态视频 并能生成自然动作,表情变化、头部移动等

by 小互
2024年9月5日
in AI 项目
0 0
0
Loopy:通过音频驱动静态照片生成动态视频  并能生成自然动作,表情变化、头部移动等
0
SHARES
426
VIEWS
Share on FacebookShare on Twitter

传统的音频驱动肖像动画生成方法通常需要手动设定运动模板,这在生成动态肖像时可能限制其灵活性和自然性。Loopy 针对这一问题,提出了一种去除空间模板约束的生成方法,只需要音频输入就可以生成高质量的肖像动画,并且生成头部和面部的自然动作,如表情变化、头部移动等。

通过设计的跨片段和片段内的时间模块以及音频到潜变量的转换模块,Loopy 能够从音频中学习长时间的运动信息,生成自然的运动模式。该方法摒弃了现有技术中手动指定空间运动模板的需求,生成更具生命感和高质量的动态肖像。模型不仅支持各种音频和视觉风格,还能够生成诸如叹息、情感驱动的眉毛和眼睛动作以及自然的头部运动等细节。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

MoneyPrinterTurbo:利用大语言模型 一键生成1分钟长的短视频

MoneyPrinterTurbo:利用大语言模型 一键生成1分钟长的短视频

295 VIEWS
2024年3月27日
Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向

Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向

412 VIEWS
2024年10月17日
科学家研究出一种新方法 只需涂抹特殊溶液 就能使活体动物的组织变得透明

科学家研究出一种新方法 只需涂抹特殊溶液 就能使活体动物的组织变得透明

125 VIEWS
2024年9月6日
Florence-2:微软全新开源视觉模型 能够执行超过10种不同的视觉任务

Florence-2:微软全新开源视觉模型 能够执行超过10种不同的视觉任务

447 VIEWS
2024年6月21日
卡内基梅隆大学数学系的教授、美国IMO国家队的教练:人类需要进入高度戒备状态

卡内基梅隆大学数学系的教授、美国IMO国家队的教练:人类需要进入高度戒备状态

247 VIEWS
2024年7月27日
StockBot:由Llama3-70B驱动的实时股票数据和新闻的聊天机器人

StockBot:由Llama3-70B驱动的实时股票数据和新闻的聊天机器人

511 VIEWS
2024年7月21日
面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来

面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来

343 VIEWS
2024年9月6日
阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型

阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型

207 VIEWS
2024年9月20日
Command-R:高性能企业级语言模型 跨语言交互与自动化工具集成

Command-R:高性能企业级语言模型 跨语言交互与自动化工具集成

38 VIEWS
2024年3月14日
Libcimbar:无需联网、蓝牙、NFC  扫描二维码即可传输文件

Libcimbar:无需联网、蓝牙、NFC 扫描二维码即可传输文件

1.8k VIEWS
2024年9月20日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版