Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

by 小互
2024年11月5日
in AI 项目
0 0
0
Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟
0
SHARES
322
VIEWS
Share on FacebookShare on Twitter

Hertz-dev 是由 Standard Intelligence 公司开发的首个会话音频开源模型。hertz-dev 是一个全双工、仅支持音频的 Transformer 基础模型。

它的主要功能是用于生成对话音频,也就是模拟人类对话的语音生成。支持全双工音频,它可以同时接收和生成音频,就像电话或实时对话一样,不需要等待说完一句话才能回复。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

将Llama-3 的上下文长度从8K扩展到超过100万

将Llama-3 的上下文长度从8K扩展到超过100万

298 VIEWS
2024年5月5日
GPT-4o官方演示的16个完整视频中文翻译

GPT-4o官方演示的16个完整视频中文翻译

675 VIEWS
2024年5月17日
Extropic 发布一种全新的热力学计算机  利用物质随机波动驱动计算

Extropic 发布一种全新的热力学计算机 利用物质随机波动驱动计算

340 VIEWS
2024年4月28日
环球音乐与 AI音乐初创公司 SoundLabs合作 将为歌手定制自己语音克隆模型

环球音乐与 AI音乐初创公司 SoundLabs合作 将为歌手定制自己语音克隆模型

182 VIEWS
2024年7月28日
Meta 发布开源模型 Llama 3,以及新版本Meta AI 助手

Meta 发布开源模型 Llama 3,以及新版本Meta AI 助手

258 VIEWS
2024年4月19日
谷歌开发出一种名为HeAR的生物声学模型 可通过咳嗽、说话、呼吸检测疾病

谷歌开发出一种名为HeAR的生物声学模型 可通过咳嗽、说话、呼吸检测疾病

146 VIEWS
2024年8月21日
Deepgram 推出了全新的AI语音代理API 能够进行实时自然的语音对话

Deepgram 推出了全新的AI语音代理API 能够进行实时自然的语音对话

281 VIEWS
2024年9月22日
MeloTTS:支持中英混合发音 的多语言文本到语音(TTS)库

MeloTTS:支持中英混合发音 的多语言文本到语音(TTS)库

333 VIEWS
2024年2月27日
教你如何使用 AI 在几秒钟内将 YouTube 视频转换为SEO博客文章。

教你如何使用 AI 在几秒钟内将 YouTube 视频转换为SEO博客文章。

603 VIEWS
2024年7月11日
Napkin AI :一键将任意文本转换成信息图、流程图、图表等视觉内容

Napkin AI :一键将任意文本转换成信息图、流程图、图表等视觉内容

1.2k VIEWS
2024年8月26日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版