Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Vchitect 2.0:上海人工智能实验室开发的视频生成模型 可生成5 到 20 秒的高清短视频

by 小互
2024年9月13日
in XiaoHu.AI日报
0 0
0
Vchitect 2.0:上海人工智能实验室开发的视频生成模型 可生成5 到 20 秒的高清短视频
0
SHARES
306
VIEWS
Share on FacebookShare on Twitter

Vchitect 2.0 是由上海人工智能实验室开发的视频生成模型,它支持通过文本和图像生成5 到 20 秒的高清短视频,用户可以灵活调整视频的宽高比。该模型集成了超分辨率和帧插入功能,支持内容修正,生成的视频更加流畅。

  • 文本到视频生成:用户可以通过文本提示生成 5-20 秒的视频
  • 图像到视频转换:允许将静态图像转换为 5-10 秒的视频
  • 灵活的宽高比:允许用户生成任意宽高比的视频。
  • 高清质量和集成的超分辨率和帧插入,具有用户可调节的内容校正功能。

模型功能特点

  1. 高质量视频生成:

    • Vchitect 2.0 是一个具备20 亿参数的视频生成模型,能够生成10-20 秒长度的高质量视频,分辨率最高支持 720×480。未来还计划推出拥有 50 亿参数的更大版本模型,进一步提升生成能力。
  2. 灵活的分辨率和时长:

    • 该模型支持多种视频宽高比的生成,用户可以灵活选择视频的分辨率和时长,使其更加适应不同应用场景的需求。
  3. 时空增强框架:

    • VEnhancer 是 Vchitect 2.0 的一个时空增强模块,能够对生成视频进行超分辨率处理和帧插入,使视频达到2K 分辨率和 24 FPS 的标准,进一步提升视频的视觉质量和流畅度。
  4. 文本到视频和图像到视频:

    • Vchitect 2.0 支持通过文本提示生成视频,也可以将静态图像转换为视频,为用户提供多种创作方式。

一些案例

sample_1
首屏-毛绒小人
首屏-湍急瀑布
3a7c1869-191b543151b
f41038ed48f1d1f4f5981751479d2c34_chf3_alq13
首屏-灵动小鸟
首屏-麻婆豆腐【定位第一个视频】
内容-小狗游泳
内容-海上明月
内容-雷神之怒

长视频剪辑

十二生肖
盘古开天辟地
国风混剪

 

官网:https://vchitect.intern-ai.org.cn/

GitHub:https://github.com/Vchitect

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
494
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
346
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
460
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
284
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
636
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
435

Recommendeds

APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用

APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用

309 VIEWS
2024年7月11日
PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度

PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度

490 VIEWS
2024年10月8日
Alchemist:能够在真实图像中随意改变物体的材料属性(粗糙度、金属度、透明度)

Alchemist:能够在真实图像中随意改变物体的材料属性(粗糙度、金属度、透明度)

232 VIEWS
2024年7月29日
麻省理工学院发布包含700多项与AI相关风险的数据库

麻省理工学院发布包含700多项与AI相关风险的数据库

155 VIEWS
2024年8月18日
Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频

Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频

107 VIEWS
2024年5月16日
DeepMind 发布新一代天气预测 AI 模型:GenCast 可精准预测15天内的天气情况

DeepMind 发布新一代天气预测 AI 模型:GenCast 可精准预测15天内的天气情况

349 VIEWS
2024年12月5日
Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备

Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备

50 VIEWS
2024年3月11日
DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

180 VIEWS
2024年8月29日
Character.AI 介绍其在 AI 推理方面的技术创新 让其服务成本减少了33倍

Character.AI 介绍其在 AI 推理方面的技术创新 让其服务成本减少了33倍

140 VIEWS
2024年6月24日
OminiControl:基于FLUX.1的通用的控制框架 通过参考图像来控制图像生成的结果

OminiControl:基于FLUX.1的通用的控制框架 通过参考图像来控制图像生成的结果

267 VIEWS
2024年11月26日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版