Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

AniPortrait:根据音频和图像输入 生成会说话、唱歌的动态视频

by 小互
2024年3月27日
in AI 项目
0 0
0
0
SHARES
336
VIEWS
Share on FacebookShare on Twitter

AniPortrait是一个由腾讯开发的创新的项目,它可以根据音频(比如说话声)和一张静态的人脸图片,自动生成逼真的人脸动画,并保持口型一种。简单来说,如果你给AniPortrait一个人说话的录音和一张照片,它就能创造出一个仿佛这个人正在说话的动画。这个过程涉及两个主要步骤:先从音频中捕捉说话的节奏和情感,然后根据这些信息制作出动画,让静态图片“活”起来。

AniPortrait的特点包括高度逼真的动画效果、能够捕捉细微的面部表情变化、以及生成动画的灵活性和多样性。

  • 基本概念:利用音频文件(例如人声)作为输入,AniPortrait能够分析这些音频数据,识别其中的语音模式、情感和节奏。
  • 动画生成:根据音频分析的结果,项目生成与声音匹配的肖像动画。如果音频中有说话的声音,动画将模拟人物的口型和表情变化,以匹配说话的节奏和情感。

主要功能

  1. 音频驱动的动画合成:AniPortrait能够利用音频文件驱动,生成逼真的肖像动画。这意味着用户可以提供一个音频文件和一张参考的肖像图片,AniPortrait将根据音频中的语音和声音的节奏来动态地生成说话或表情变化的肖像动画。

    316711495-6fd74024-ba19-4f6b-b37a-10df5cf2c934
  2. 面部再现:除了音频驱动动画之外,AniPortrait还支持面部再现功能,通过分析给定视频中的面部表情和动作,AniPortrait可以在另一张参考肖像上再现相同的表情和动作。例如用户可以提供一段视频,实现在新的肖像上复现视频中人物的面部表情和动作。这项技术可以用于创造逼真的虚拟角色动画,使其复现真人的表情和动作。
    316711351-d4e0add6-20a2-4f4b-808c-530a6f4d3331

    316711084-849fce22-0db1-4257-a75f-a5dc655e6b9e
  3. 头部姿势控制:用户可以指定头部姿势,或者选择预设的姿势配置,来控制生成动画中的头部动作,使动画效果更加自然和多样化。

    316711463-63171e5a-e4c1-4383-8f20-9764524928d0
  4. 支持自驱动和音频驱动的视频生成:项目不仅支持音频驱动的动画生成,还可以进行自驱动的视频生成,即不需要外部音频输入,而是根据预设或随机生成的动作来创建动画。

    316711426-51a502d9-1ce2-48d2-afbe-767a0b9b9166
  5. 高质量动画生成:niPortrait旨在生成高度逼真的肖像动画,无论是从视觉质量还是动作自然度方面,都力求接近真实人物的外观和表现。

    Related Posts

    Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
    XiaoHu.AI日报

    Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

    2024年12月25日
    483
    阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
    XiaoHu.AI日报

    阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

    2024年12月25日
    337
    Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
    AI 工具

    Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

    2024年12月24日
    449
    Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
    XiaoHu.AI日报

    Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

    2024年12月24日
    278
    Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
    AI 论文

    Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

    2024年12月23日
    616
    INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
    AI 项目

    INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

    2024年12月22日
    428

Recommendeds

StarCoder2:专为编程代码生成和分析而设计开源模型

StarCoder2:专为编程代码生成和分析而设计开源模型

45 VIEWS
2024年2月29日
Khoj:一个开源的个人化AI 助手 能连接你的在线和本地文档 充当你的第二大脑

Khoj:一个开源的个人化AI 助手 能连接你的在线和本地文档 充当你的第二大脑

913 VIEWS
2024年5月29日
PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人

PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人

572 VIEWS
2024年10月6日
只需要4个摄像头视角和3D骨骼姿势 实现全息角色传送

只需要4个摄像头视角和3D骨骼姿势 实现全息角色传送

238 VIEWS
2024年5月7日
教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

288 VIEWS
2024年9月10日
Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

322 VIEWS
2024年11月5日
StreamingT2V:根据文字提示生成连贯且可扩展的长达2分钟的视频

StreamingT2V:根据文字提示生成连贯且可扩展的长达2分钟的视频

129 VIEWS
2024年3月25日
Cloudflare推出了一个新的开发工具:Workflows 大幅简化多步骤应用的构建

Cloudflare推出了一个新的开发工具:Workflows 大幅简化多步骤应用的构建

252 VIEWS
2024年10月25日
AI 学术搜索引擎 Consensus 完成 1150 万美元 A 轮融资 年化收入达150万美元

AI 学术搜索引擎 Consensus 完成 1150 万美元 A 轮融资 年化收入达150万美元

313 VIEWS
2024年8月19日
ReadKidz:利用AI一键生成儿童绘本故事书和多媒体故事 可随心定制设定

ReadKidz:利用AI一键生成儿童绘本故事书和多媒体故事 可随心定制设定

1.5k VIEWS
2024年11月6日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版