Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Vchitect 2.0:上海人工智能实验室开发的视频生成模型 可生成5 到 20 秒的高清短视频

by 小互
2024年9月13日
in XiaoHu.AI日报
0 0
0
Vchitect 2.0:上海人工智能实验室开发的视频生成模型 可生成5 到 20 秒的高清短视频
0
SHARES
306
VIEWS
Share on FacebookShare on Twitter

Vchitect 2.0 是由上海人工智能实验室开发的视频生成模型,它支持通过文本和图像生成5 到 20 秒的高清短视频,用户可以灵活调整视频的宽高比。该模型集成了超分辨率和帧插入功能,支持内容修正,生成的视频更加流畅。

  • 文本到视频生成:用户可以通过文本提示生成 5-20 秒的视频
  • 图像到视频转换:允许将静态图像转换为 5-10 秒的视频
  • 灵活的宽高比:允许用户生成任意宽高比的视频。
  • 高清质量和集成的超分辨率和帧插入,具有用户可调节的内容校正功能。

模型功能特点

  1. 高质量视频生成:

    • Vchitect 2.0 是一个具备20 亿参数的视频生成模型,能够生成10-20 秒长度的高质量视频,分辨率最高支持 720×480。未来还计划推出拥有 50 亿参数的更大版本模型,进一步提升生成能力。
  2. 灵活的分辨率和时长:

    • 该模型支持多种视频宽高比的生成,用户可以灵活选择视频的分辨率和时长,使其更加适应不同应用场景的需求。
  3. 时空增强框架:

    • VEnhancer 是 Vchitect 2.0 的一个时空增强模块,能够对生成视频进行超分辨率处理和帧插入,使视频达到2K 分辨率和 24 FPS 的标准,进一步提升视频的视觉质量和流畅度。
  4. 文本到视频和图像到视频:

    • Vchitect 2.0 支持通过文本提示生成视频,也可以将静态图像转换为视频,为用户提供多种创作方式。

一些案例

sample_1
首屏-毛绒小人
首屏-湍急瀑布
3a7c1869-191b543151b
f41038ed48f1d1f4f5981751479d2c34_chf3_alq13
首屏-灵动小鸟
首屏-麻婆豆腐【定位第一个视频】
内容-小狗游泳
内容-海上明月
内容-雷神之怒

长视频剪辑

十二生肖
盘古开天辟地
国风混剪

 

官网:https://vchitect.intern-ai.org.cn/

GitHub:https://github.com/Vchitect

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

283 VIEWS
2024年7月24日
OpenAI音乐生成模型Jukebox曝光 效果惊艳

OpenAI音乐生成模型Jukebox曝光 效果惊艳

105 VIEWS
2024年5月18日
Vchitect 2.0:上海人工智能实验室开发的视频生成模型 可生成5 到 20 秒的高清短视频

Vchitect 2.0:上海人工智能实验室开发的视频生成模型 可生成5 到 20 秒的高清短视频

306 VIEWS
2024年9月13日
𝕏/Twitter 算法解析 如何提高自己的粉丝和帖子的曝光量

𝕏/Twitter 算法解析 如何提高自己的粉丝和帖子的曝光量

138 VIEWS
2024年7月8日
MidJourney 推出个性化档案和情绪版新功能 记住你的风格喜好

MidJourney 推出个性化档案和情绪版新功能 记住你的风格喜好

316 VIEWS
2024年12月17日
InstanceDiffusion:允许用户以前所未有的精度控制图片中每个细节

InstanceDiffusion:允许用户以前所未有的精度控制图片中每个细节

67 VIEWS
2024年3月7日
Sonic:基于状态空间模型的低延迟实时推理语音生成模型

Sonic:基于状态空间模型的低延迟实时推理语音生成模型

128 VIEWS
2024年5月31日
OpenAI 首席科学家MIT演讲:揭示 o1模型训练核心 激励模型学习是培养 AGI 的最佳方式

OpenAI 首席科学家MIT演讲:揭示 o1模型训练核心 激励模型学习是培养 AGI 的最佳方式

446 VIEWS
2024年9月22日
一组由GPT-4组成的智能代理团队 自主破解零日安全漏洞 成功率达到53%

一组由GPT-4组成的智能代理团队 自主破解零日安全漏洞 成功率达到53%

89 VIEWS
2024年6月10日
微软开源下一代RAG技术:GraphRAG 利用知识图谱大幅增强语言模型能力

微软开源下一代RAG技术:GraphRAG 利用知识图谱大幅增强语言模型能力

1.1k VIEWS
2024年7月9日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版