Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

by 小互
2024年11月5日
in AI 项目
0 0
0
Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟
0
SHARES
322
VIEWS
Share on FacebookShare on Twitter

Hertz-dev 是由 Standard Intelligence 公司开发的首个会话音频开源模型。hertz-dev 是一个全双工、仅支持音频的 Transformer 基础模型。

它的主要功能是用于生成对话音频,也就是模拟人类对话的语音生成。支持全双工音频,它可以同时接收和生成音频,就像电话或实时对话一样,不需要等待说完一句话才能回复。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

GRM:只需少量图片 能在0.1秒内构建出物体的3D模型或整个场景

GRM:只需少量图片 能在0.1秒内构建出物体的3D模型或整个场景

975 VIEWS
2024年4月2日
微软CEO 纳德拉谈新款 Windows AI Copilot+ PC 如何击败苹果 Mac

微软CEO 纳德拉谈新款 Windows AI Copilot+ PC 如何击败苹果 Mac

91 VIEWS
2024年5月21日
SAMURAI:无需训练 能够在实时动态、复杂的视频场景中跟踪目标的模型

SAMURAI:无需训练 能够在实时动态、复杂的视频场景中跟踪目标的模型

246 VIEWS
2024年11月25日
迪斯尼公布 BD-X双足机器人的设计图纸和主要技术方法

迪斯尼公布 BD-X双足机器人的设计图纸和主要技术方法

403 VIEWS
2024年7月23日
谷歌开发出一个实时语音转换系统 在不改变语音内容和语调的情况下 改变说话者音色

谷歌开发出一个实时语音转换系统 在不改变语音内容和语调的情况下 改变说话者音色

601 VIEWS
2024年7月15日
OpenAI发布其语音生成模型:Voice Engine 15秒克隆你的声音

OpenAI发布其语音生成模型:Voice Engine 15秒克隆你的声音

160 VIEWS
2024年3月30日
智谱 AI 这次是真的国际领先了 发布AutoGLM 一句话手机自动帮你点外卖、订酒店买东西

智谱 AI 这次是真的国际领先了 发布AutoGLM 一句话手机自动帮你点外卖、订酒店买东西

1.3k VIEWS
2024年10月25日
WayveScenes101:一个用于自动驾驶应用的高分辨率图像数据集

WayveScenes101:一个用于自动驾驶应用的高分辨率图像数据集

52 VIEWS
2024年7月22日
Uizard 发布 Autodesigner 2.0 AI设计引擎 只需文字或截图几秒钟内完成网站设计

Uizard 发布 Autodesigner 2.0 AI设计引擎 只需文字或截图几秒钟内完成网站设计

380 VIEWS
2024年6月13日
Google推出 LearnLM 教育模型工具 专门用于提升教育和学习体验

Google推出 LearnLM 教育模型工具 专门用于提升教育和学习体验

153 VIEWS
2024年5月23日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版