Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

Loopy:通过音频驱动静态照片生成动态视频 并能生成自然动作,表情变化、头部移动等

by 小互
2024年9月5日
in AI 项目
0 0
0
Loopy:通过音频驱动静态照片生成动态视频  并能生成自然动作,表情变化、头部移动等
0
SHARES
426
VIEWS
Share on FacebookShare on Twitter

传统的音频驱动肖像动画生成方法通常需要手动设定运动模板,这在生成动态肖像时可能限制其灵活性和自然性。Loopy 针对这一问题,提出了一种去除空间模板约束的生成方法,只需要音频输入就可以生成高质量的肖像动画,并且生成头部和面部的自然动作,如表情变化、头部移动等。

通过设计的跨片段和片段内的时间模块以及音频到潜变量的转换模块,Loopy 能够从音频中学习长时间的运动信息,生成自然的运动模式。该方法摒弃了现有技术中手动指定空间运动模板的需求,生成更具生命感和高质量的动态肖像。模型不仅支持各种音频和视觉风格,还能够生成诸如叹息、情感驱动的眉毛和眼睛动作以及自然的头部运动等细节。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
485
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
341
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
454
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
280
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
621
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
431

Recommendeds

Comflowyspace:开箱即用的 Comfy UI 整合包

Comflowyspace:开箱即用的 Comfy UI 整合包

109 VIEWS
2024年3月6日
苹果发布 Apple Intelligence 智能助手 深度个性化 支持跨应用交互操作

WWDC 2024 发布会Apple Intelligence中文介绍完整视频

335 VIEWS
2024年6月11日

Meta将在Ray-Ban眼镜中加入快速识别任何物体的AI功能

184 VIEWS
2024年4月1日
Stable AI 为 Stable Assistant 添加了两个新功能 搜索替换图像中的对象 生成3分钟音频

Stable AI 为 Stable Assistant 添加了两个新功能 搜索替换图像中的对象 生成3分钟音频

188 VIEWS
2024年7月10日
AutoBNN:利用组合贝叶斯神经网络进行时间序列概率预测

AutoBNN:利用组合贝叶斯神经网络进行时间序列概率预测

111 VIEWS
2024年4月3日
阿里巴巴发布语音模型:Qwen2-Audio 可与模型直接语音对话和分析转录各种声音

阿里巴巴发布语音模型:Qwen2-Audio 可与模型直接语音对话和分析转录各种声音

590 VIEWS
2024年8月10日
ReCap:能够自动分析2个小时长的视频,并生成准确描述

ReCap:能够自动分析2个小时长的视频,并生成准确描述

104 VIEWS
2024年2月27日
基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务

基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务

357 VIEWS
2024年5月6日
环球音乐与 AI音乐初创公司 SoundLabs合作 将为歌手定制自己语音克隆模型

环球音乐与 AI音乐初创公司 SoundLabs合作 将为歌手定制自己语音克隆模型

182 VIEWS
2024年7月28日
Generative OmniMatte:Google开发出像Photoshop一样 能将视频分解成多个图层的视频编辑技术

Generative OmniMatte:Google开发出像Photoshop一样 能将视频分解成多个图层的视频编辑技术

257 VIEWS
2024年11月27日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版