Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home AI 工具

Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动

by 小互
2024年3月13日
in AI 工具
0 0
0
0
SHARES
59
VIEWS
Share on FacebookShare on Twitter

Deepgram 推出了名为 Aura 的全新文本转语音(TTS)API,这是为实时对话 AI 代理和应用程序设计的首款文本转语音模型。Aura 包含十几种自然、类人的声音,其延迟低于任何可比较的语音 AI 替代品,并已经在几个客户的生产环境中得到使用。

Aura 为 AI 代理配备逼真的声音,并已开发出能够复制真实人类对话的能力。这包括迅速回复、自然的节奏(包括停顿、可听到的呼吸和犹豫声音如“呃”和“嗯”)以及根据对话内容调整音调和情感的动态调整。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Loopy:通过音频驱动静态照片生成动态视频  并能生成自然动作,表情变化、头部移动等

Loopy:通过音频驱动静态照片生成动态视频 并能生成自然动作,表情变化、头部移动等

426 VIEWS
2024年9月5日
Imagine Flash:加速Emu扩散模型 提高生成图像的速度和质量

Imagine Flash:加速Emu扩散模型 提高生成图像的速度和质量

158 VIEWS
2024年4月19日
Midjourney 推出 Personalization 功能 Midjourney会记住你的艺术喜好

Midjourney 推出 Personalization 功能 Midjourney会记住你的艺术喜好

460 VIEWS
2024年6月12日
Runway推出其视频生成模型的API 方便开发者集成到应用中 但是有一些特殊要求

Runway推出其视频生成模型的API 方便开发者集成到应用中 但是有一些特殊要求

199 VIEWS
2024年9月18日
MeloTTS:支持中英混合发音 的多语言文本到语音(TTS)库

MeloTTS:支持中英混合发音 的多语言文本到语音(TTS)库

333 VIEWS
2024年2月27日
微软发布Phi-3.5-vision 轻量级、多模态的开源模型 端侧运行 可进行复杂视觉推理

微软发布Phi-3.5-vision 轻量级、多模态的开源模型 端侧运行 可进行复杂视觉推理

527 VIEWS
2024年8月21日
ScreenAI:能读懂用户屏幕和信息图的视觉语言模型

ScreenAI:能读懂用户屏幕和信息图的视觉语言模型

597 VIEWS
2024年4月14日
GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的

GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的

989 VIEWS
2024年11月21日
OpenBioLLM-8B:基于 Llama-3-8B 微调训练的生物医学领域专门模型

OpenBioLLM-8B:基于 Llama-3-8B 微调训练的生物医学领域专门模型

150 VIEWS
2024年4月29日
H2O-Danube3:无需联网 可以直接在手机上运行的开源模型

H2O-Danube3:无需联网 可以直接在手机上运行的开源模型

436 VIEWS
2024年7月16日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版