Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制

by 小互
2024年6月17日
in XiaoHu.AI日报
0 0
0
Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制
0
SHARES
447
VIEWS
Share on FacebookShare on Twitter

Runway推出新一代视频生成模型 Gen-3 Alpha,具备更高的保真度和一致性,能够生成逼真的人类角色和动态场景。它支持多种视频生成和控制工具,并提供精细的时间控制和高质量的图像。

Runway还引入了新的安全措施,确保生成内容的安全和可靠性,并与多家顶级娱乐和媒体公司合作进行定制开发。

X2Twitter.com_1802687085247119361(720p)

功能与特点

  1. 多模态训练:
    • Gen-3 Alpha是在全新的大规模多模态训练基础设施上进行训练的,能够处理和融合不同类型的数据(如文本、图像和视频),以生成高质量的多模态输出。
    • 联合训练:该模型通过联合训练的方法,利用视频和图像数据进行学习。这种方法提高了模型在生成动态内容和静态内容时的表现能力,确保输出的连续性和一致性。
  2. 多种生成工具:
    • 支持从文本到视频(Text to Video)、从图像到视频(Image to Video)、从文本到图像(Text to Image)的工具。
  3. 精细时间控制:
    • 在训练过程中,使用了高度描述性和时间密集型的字幕,增强了模型对场景细节和时间变化的理解。这使得模型能够生成具有创意过渡和精确关键帧控制的内容。
    • 通过细粒度的时间控制,Gen-3 Alpha可以实现对生成内容的精确关键帧设置和场景过渡。这种精细控制使得生成的视频在运动和连贯性方面有显著提升。
    • 示例提示:一个蚂蚁从巢穴中出来的极近距离拍摄,镜头拉远,展示山丘之外的社区。
      .

      gen-3-alpha-output-001 (1)
  4. 高质量的图像和视频生成:
    • Gen-3 Alpha能生成表达丰富的、逼真的人类角色,提供广泛的动作、手势和情绪,开启了新的叙事机会。
    • 示例提示:在电视机光照下的一名男子的电影宽幅肖像。
      .
      gen-3-alpha-output-001 (2)
  5. 高级控制模式:
    • Gen-3 Alpha支持多种高级控制模式,包括运动画笔(Motion Brush)、先进摄像头控制(Advanced Camera Controls)和导演模式(Director Mode),这些模式提供了更大的创作自由和控制力度。
  6. 高效计算和存储架构:
    • 采用分布式计算和高效存储架构,确保在处理大规模数据时的性能和速度。这种架构设计支持模型的快速训练和生成,满足高效创作的需求。

一些案例:

细粒度的时间控制
Gen-3 Alpha 已经通过高度描述性、时间密集的字幕进行训练,从而实现了场景中元素的想象过渡和精确关键帧定位。
gen-3-alpha-output-002
gen-3-alpha-output-003
gen-3-alpha-output-009
gen-3-alpha-output-008
gen-3-alpha-output-007
gen-3-alpha-output-006
gen-3-alpha-output-004 (1)
Photorealistic Humans 逼真的人类

Gen-3 Alpha 擅长生成具有广泛动作、手势和情感表达的人物角色,开启了新的叙事机会。

gen-3-alpha-output-001

 

gen-3-alpha-output-003
gen-3-alpha-output-002 (1)
gen-3-alpha-output-003 (1)
艺术美化

培训 Gen-3 Alpha 是一支跨学科团队的协作努力,由研究科学家、工程师和艺术家组成。它旨在解释各种风格和电影术语。

gen-3-alpha-output-003 (2)

 

gen-3-alpha-output-002 (2)
gen-3-alpha-output-004
gen-3-alpha-output-009 (1)
gen-3-alpha-output-008 (1)
gen-3-alpha-output-007 (1)
gen-3-alpha-output-006 (1)

详细内容,更多案例:https://runwayml.com/blog/introducing-gen-3-alpha/

 

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
488
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
343
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
456
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
283
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
625
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
432

Recommendeds

阿里云发布 VideoLLaMA 2 视频语言模型 提升模型对视频、音频内容的理解能力

阿里云发布 VideoLLaMA 2 视频语言模型 提升模型对视频、音频内容的理解能力

400 VIEWS
2024年6月15日
YouTubeVeo 引入Google DeepMind 的 Veo 模型 创作者可使用Veo创作视频

YouTubeVeo 引入Google DeepMind 的 Veo 模型 创作者可使用Veo创作视频

176 VIEWS
2024年9月19日
微软Office全家桶大更新 Excel 中集成 Python 推出 Pages和Copilot Agents等众多功能

微软Office全家桶大更新 Excel 中集成 Python 推出 Pages和Copilot Agents等众多功能

392 VIEWS
2024年9月18日
TryOffDiff :“虚拟脱衣” 从照片中“摘取”衣服,把它变成标准化的服装图片

TryOffDiff :“虚拟脱衣” 从照片中“摘取”衣服,把它变成标准化的服装图片

410 VIEWS
2024年12月1日
WeWe-RSS:一种更优雅的微信公众号订阅方式

WeWe-RSS:一种更优雅的微信公众号订阅方式

311 VIEWS
2024年3月5日
ToucanTTS:支持语言种类最多的 TTS 模型 支持超过7000种语言的语音合成

ToucanTTS:支持语言种类最多的 TTS 模型 支持超过7000种语言的语音合成

545 VIEWS
2024年6月28日
微软正式推出 Microsoft Designer 与 Microsoft 产品无缝集成 随时随地进行图像设计

微软正式推出 Microsoft Designer 与 Microsoft 产品无缝集成 随时随地进行图像设计

396 VIEWS
2024年7月22日
Midjourney不同相机角度的使用教程 提高图像摄影技巧

Midjourney不同相机角度的使用教程 提高图像摄影技巧

169 VIEWS
2024年5月1日
Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型

Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型

55 VIEWS
2024年3月11日
Copilot 的 20 项功能,可帮助提高 10 倍的工作效率

Copilot 的 20 项功能,可帮助提高 10 倍的工作效率

151 VIEWS
2024年3月24日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版