Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home AI 工具

Parler-TTS :一个完全开源的的高质量TTS模型

by 小互
2024年4月11日
in AI 工具
0 0
0
0
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现,两位作者分别来自 Stability AI 和爱丁堡大学。

与其他TTS模型不同,Parler-TTS 完全开源发布,包括数据集、预处理、训练代码和权重。

  • 高质量、自然 sounding 的语音输出:Parler-TTS 能够生成高质量且听起来非常自然的语音。它可以根据给定说话者的风格(如性别、音调、说话风格等)进行定制,以产生与特定人声非常相似的输出。
  • 灵活的使用和部署:提供了易于使用的安装和部署方法,只需一行代码即可安装。此外,它还提供了交互式演示和详细的训练指南,使用户能够快速上手并自定义模型。
  • Datasets数据集Parler-TTS 提供了开源的注释语音数据集,范围从1,000小时到即将到达的50,000小时。这为训练和改进TTS模型提供了丰富的资源。

GitHub:https://github.com/huggingface/parler-tts

模型下载:https://huggingface.co/parler-tts

在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
615
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Prompt 学习地图 17 | 复杂任务 – 通过“大声思考” 引导模型逐步解释

Prompt 学习地图 17 | 复杂任务 – 通过“大声思考” 引导模型逐步解释

101 VIEWS
2024年4月18日
装备AI瞄准步枪的机器狗 接受了美国海军陆战队特种作战评估

装备AI瞄准步枪的机器狗 接受了美国海军陆战队特种作战评估

226 VIEWS
2024年5月19日
一个用于认知行为疗法(CBT)的提示 帮你识别生活中令人困扰事情

一个用于认知行为疗法(CBT)的提示 帮你识别生活中令人困扰事情

412 VIEWS
2024年7月16日
Prompt 学习地图 02 | 编写清晰的说明 – 让GPT学会角色扮演

Prompt 学习地图 02 | 编写清晰的说明 – 让GPT学会角色扮演

139 VIEWS
2024年3月25日
Sketch 推出 Smart Animate 新功能 可在原型设计中加入流畅的动画效果

Sketch 推出 Smart Animate 新功能 可在原型设计中加入流畅的动画效果

212 VIEWS
2024年9月23日
教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

283 VIEWS
2024年7月24日
软宣布有史以来性能最优的逻辑量子比特 并将推出世界上最强大的量子计算机

软宣布有史以来性能最优的逻辑量子比特 并将推出世界上最强大的量子计算机

87 VIEWS
2024年9月11日
Mem0:为大语言模型提供永久记忆能力  实现跨应用程序的个性化AI体验

Mem0:为大语言模型提供永久记忆能力 实现跨应用程序的个性化AI体验

447 VIEWS
2024年7月22日
OminiControl:基于FLUX.1的通用的控制框架 通过参考图像来控制图像生成的结果

OminiControl:基于FLUX.1的通用的控制框架 通过参考图像来控制图像生成的结果

267 VIEWS
2024年11月26日
FLUX 1.1 Pro Ultra 发布 支持高达 4 兆像素的分辨率 每张图片仅需约 10 秒

FLUX 1.1 Pro Ultra 发布 支持高达 4 兆像素的分辨率 每张图片仅需约 10 秒

269 VIEWS
2024年11月7日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版