Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制

by 小互
2024年6月17日
in XiaoHu.AI日报
0 0
0
Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制
0
SHARES
447
VIEWS
Share on FacebookShare on Twitter

Runway推出新一代视频生成模型 Gen-3 Alpha,具备更高的保真度和一致性,能够生成逼真的人类角色和动态场景。它支持多种视频生成和控制工具,并提供精细的时间控制和高质量的图像。

Runway还引入了新的安全措施,确保生成内容的安全和可靠性,并与多家顶级娱乐和媒体公司合作进行定制开发。

X2Twitter.com_1802687085247119361(720p)

功能与特点

  1. 多模态训练:
    • Gen-3 Alpha是在全新的大规模多模态训练基础设施上进行训练的,能够处理和融合不同类型的数据(如文本、图像和视频),以生成高质量的多模态输出。
    • 联合训练:该模型通过联合训练的方法,利用视频和图像数据进行学习。这种方法提高了模型在生成动态内容和静态内容时的表现能力,确保输出的连续性和一致性。
  2. 多种生成工具:
    • 支持从文本到视频(Text to Video)、从图像到视频(Image to Video)、从文本到图像(Text to Image)的工具。
  3. 精细时间控制:
    • 在训练过程中,使用了高度描述性和时间密集型的字幕,增强了模型对场景细节和时间变化的理解。这使得模型能够生成具有创意过渡和精确关键帧控制的内容。
    • 通过细粒度的时间控制,Gen-3 Alpha可以实现对生成内容的精确关键帧设置和场景过渡。这种精细控制使得生成的视频在运动和连贯性方面有显著提升。
    • 示例提示:一个蚂蚁从巢穴中出来的极近距离拍摄,镜头拉远,展示山丘之外的社区。
      .

      gen-3-alpha-output-001 (1)
  4. 高质量的图像和视频生成:
    • Gen-3 Alpha能生成表达丰富的、逼真的人类角色,提供广泛的动作、手势和情绪,开启了新的叙事机会。
    • 示例提示:在电视机光照下的一名男子的电影宽幅肖像。
      .
      gen-3-alpha-output-001 (2)
  5. 高级控制模式:
    • Gen-3 Alpha支持多种高级控制模式,包括运动画笔(Motion Brush)、先进摄像头控制(Advanced Camera Controls)和导演模式(Director Mode),这些模式提供了更大的创作自由和控制力度。
  6. 高效计算和存储架构:
    • 采用分布式计算和高效存储架构,确保在处理大规模数据时的性能和速度。这种架构设计支持模型的快速训练和生成,满足高效创作的需求。

一些案例:

细粒度的时间控制
Gen-3 Alpha 已经通过高度描述性、时间密集的字幕进行训练,从而实现了场景中元素的想象过渡和精确关键帧定位。
gen-3-alpha-output-002
gen-3-alpha-output-003
gen-3-alpha-output-009
gen-3-alpha-output-008
gen-3-alpha-output-007
gen-3-alpha-output-006
gen-3-alpha-output-004 (1)
Photorealistic Humans 逼真的人类

Gen-3 Alpha 擅长生成具有广泛动作、手势和情感表达的人物角色,开启了新的叙事机会。

gen-3-alpha-output-001

 

gen-3-alpha-output-003
gen-3-alpha-output-002 (1)
gen-3-alpha-output-003 (1)
艺术美化

培训 Gen-3 Alpha 是一支跨学科团队的协作努力,由研究科学家、工程师和艺术家组成。它旨在解释各种风格和电影术语。

gen-3-alpha-output-003 (2)

 

gen-3-alpha-output-002 (2)
gen-3-alpha-output-004
gen-3-alpha-output-009 (1)
gen-3-alpha-output-008 (1)
gen-3-alpha-output-007 (1)
gen-3-alpha-output-006 (1)

详细内容,更多案例:https://runwayml.com/blog/introducing-gen-3-alpha/

 

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
488
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
343
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
456
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
282
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
625
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
432

Recommendeds

OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧

OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧

575 VIEWS
2024年9月11日
Video2Game :将现实世界的视频自动转换成逼真且可交互的游戏环境

Video2Game :将现实世界的视频自动转换成逼真且可交互的游戏环境

194 VIEWS
2024年4月24日
Easy Scraper:只需点击一下即可抓取任何网站的内容

Easy Scraper:只需点击一下即可抓取任何网站的内容

101 VIEWS
2024年3月3日
DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

705 VIEWS
2024年5月7日
Prompt 学习地图 18 | 复杂任务 – 综合分析多个答案

Prompt 学习地图 18 | 复杂任务 – 综合分析多个答案

93 VIEWS
2024年4月18日
ReSyncer:一个多功能统一模型 可以实现音视频口型同步、说话风格迁移和换脸

ReSyncer:一个多功能统一模型 可以实现音视频口型同步、说话风格迁移和换脸

788 VIEWS
2024年8月10日
Relightful :自动调节人像光照条件,与任意背景的自然融合

Relightful :自动调节人像光照条件,与任意背景的自然融合

88 VIEWS
2024年3月5日
Google DeepMind 公布其NotebookLM背后的创新音频生成技术 使 AI 能够生成更加自然的对话

Google DeepMind 公布其NotebookLM背后的创新音频生成技术 使 AI 能够生成更加自然的对话

630 VIEWS
2024年10月30日
OpenAI CTO Mira Murati 母校访谈实录 博士级别的人工智能有望在一年半的时间内发布

OpenAI CTO Mira Murati 母校访谈实录 博士级别的人工智能有望在一年半的时间内发布

97 VIEWS
2024年6月22日
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

282 VIEWS
2024年12月24日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版