Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

OpenAI音乐生成模型Jukebox曝光 效果惊艳

by 小互
2024年5月18日
in AI 项目
0 0
0
0
SHARES
105
VIEWS
Share on FacebookShare on Twitter
兄弟们,你猜我发现了什么
 
原来OpenAI 3年前就开始搞AI音乐生成了
 
OpenAI在2019年8月份就推出了他们的一音乐生成模型:Jukebox
 
Jukebox能够根据提供的歌词、艺术家和流派信息生成多种流派和艺术家风格的完整音乐和人声歌曲。
 
还可以模拟特定艺术家的音乐风格,生成新的音乐作品。
 
而且据说Jukebox 2即将发布…
.
https://img.xiaohu.ai/2024/03/032Area.mp4

大规模音乐数据集训练

  • 基于120万首歌曲的大规模数据集进行训练,这些歌曲配备了相应的歌词和元数据。
  • 利用这些丰富的数据资源,Jukebox能够学习和模仿复杂的音乐结构和风格。

数据来源和规模

  • 数据收集:
    • 从网络上爬取了 120 万首歌曲(其中 60 万首为英文歌曲)。
    • 收集了对应的歌词和元数据,如艺术家、专辑、流派、年份和常见情绪或播放列表关键词。
  • 音频数据:
    • 训练数据为 32-bit、44.1 kHz 的原始音频。
    • 进行数据增强,通过随机混合左右声道生成单声

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
474
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
330
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
441
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
276
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
604
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
423

Recommendeds

Prompt 学习地图 20 | 概念误区 – 你和模型说的是一回事吗

Prompt 学习地图 20 | 概念误区 – 你和模型说的是一回事吗

258 VIEWS
2024年4月18日
Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用

Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用

183 VIEWS
2024年7月21日
LivePortrait:只需一张静态肖像图像就能生成动态视频 可精确控制眼睛和嘴唇的动作

LivePortrait:只需一张静态肖像图像就能生成动态视频 可精确控制眼睛和嘴唇的动作

989 VIEWS
2024年7月4日
OOTDiffusion:支持半身、全身的开源的高分辨率虚拟试穿模型

OOTDiffusion:支持半身、全身的开源的高分辨率虚拟试穿模型

297 VIEWS
2024年11月24日
Alter 3:利用 GPT-4驱动的人形机器人 将自然语言命令转换为机器人动作

Alter 3:利用 GPT-4驱动的人形机器人 将自然语言命令转换为机器人动作

206 VIEWS
2024年6月29日
阿里云发布Qwen 2开源模型 性能超越目前所有开源模型和国内闭源模型

阿里云发布Qwen 2开源模型 性能超越目前所有开源模型和国内闭源模型

605 VIEWS
2024年6月7日
Snap 发布第五代 Spectacles  AR 眼镜 内置AI 可通过语音提示直接生成 3D 动画

Snap 发布第五代 Spectacles AR 眼镜 内置AI 可通过语音提示直接生成 3D 动画

262 VIEWS
2024年9月18日
RayDINO :能够对胸部X光片进行全面分析并识别常见疾病的视觉模型

RayDINO :能够对胸部X光片进行全面分析并识别常见疾病的视觉模型

356 VIEWS
2024年5月11日
Rendora AI:你只需输入文字 就能在几秒钟内生成逼真的3D AI数字人视频

Rendora AI:你只需输入文字 就能在几秒钟内生成逼真的3D AI数字人视频

554 VIEWS
2024年8月17日
GOT-OCR2.0:端到端的 OCR 模型 可以处理各种复杂的光学字符任务

GOT-OCR2.0:端到端的 OCR 模型 可以处理各种复杂的光学字符任务

390 VIEWS
2024年9月15日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版