Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home AI 工具

Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气

by 小互
2024年9月30日
in AI 工具
0 0
0
Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气
0
SHARES
748
VIEWS
Share on FacebookShare on Twitter

Open NotebookLM 是一个将 PDF 文件转化为播客的工具,依靠 Llama 3.1 和 meloTTS 等开源技术构建,可以实现 NotebookLM 的部分体验。用户可以上传文件或通过 URL 提供内容,并能对播客的语气和长度进行定制化。

由于采用了 meloTTS 理论上是支持中文的。

  • PDF 转播客:可以将任何 PDF 文档或者链接转换为播客形式。通过分析 PDF 内容,生成自然的对话,适合音频播客格式。
  • 对话生成:工具生成的对话设计为既信息丰富又具有娱乐性,使内容易于聆听和理解。
  • 用户友好界面:使用基于 Gradio 的简单交互界面,用户可以轻松上传 PDF 并生成播客内容,无需复杂的设置。
  • 文本转语音:利用开源的 LLM(大语言模型) 和 文本转语音模型,将文本转换为自然的语音对话,支持多种语言,并以 MP3 格式导出。
  • 使用了 Llama 3.1、meloTTS 和 Gradio 等开源 AI 工具构建。

GitHub:https://github.com/gabrielchua/open-notebooklm

在线演示:https://huggingface.co/spaces/gabrielchua/open-notebooklm

案例展示:

英文:

视频播放器
9月30日 1

Media error: Format(s) not supported or source(s) not found

下载文件: https://img.xiaohu.ai/2024/09/9%E6%9C%8830%E6%97%A5-1.mp4
00:00
00:00
00:00
使用上/下箭头键来增高或降低音量。

中文:

视频播放器
930Google Chrome

Media error: Format(s) not supported or source(s) not found

下载文件: https://img.xiaohu.ai/2024/09/930Google-Chrome.mp4
00:00
00:00
00:00
使用上/下箭头键来增高或降低音量。
视频播放器
Google Chrome30

Media error: Format(s) not supported or source(s) not found

下载文件: https://img.xiaohu.ai/2024/09/Google-Chrome30.mp4
00:00
00:00
00:00
使用上/下箭头键来增高或降低音量。

 

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
486
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
342
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
455
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
281
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
624
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
432

Recommendeds

Flawless:利用AI创建 与原版电影一样沉浸和真实的唇形同步配音版本

Flawless:利用AI创建 与原版电影一样沉浸和真实的唇形同步配音版本

593 VIEWS
2024年5月26日
Screenshot to Code:将网页屏幕截图直接转换为干净的代码

Screenshot to Code:将网页屏幕截图直接转换为干净的代码

80 VIEWS
2024年3月3日
Mem0:为大语言模型提供永久记忆能力  实现跨应用程序的个性化AI体验

Mem0:为大语言模型提供永久记忆能力 实现跨应用程序的个性化AI体验

447 VIEWS
2024年7月22日
RenderNet Al 推出视频换脸功能 可轻松通过照片更改视频人物面容

RenderNet Al 推出视频换脸功能 可轻松通过照片更改视频人物面容

1.2k VIEWS
2024年7月16日
Make-It-Vivid:通过文字描述即可为动漫人物更换衣服皮肤

Make-It-Vivid:通过文字描述即可为动漫人物更换衣服皮肤

116 VIEWS
2024年4月7日
投资者要求Open AI 两年内转变为营利性企业 否则其融资将转换为债务

投资者要求Open AI 两年内转变为营利性企业 否则其融资将转换为债务

126 VIEWS
2024年9月29日
将TI-84计算器改装连接到互联网 并接入ChatGPT 实现作弊功能

将TI-84计算器改装连接到互联网 并接入ChatGPT 实现作弊功能

160 VIEWS
2024年9月23日
2024年哈佛大学CS50x计算机科学课程详解

2024年哈佛大学CS50x计算机科学课程详解

167 VIEWS
2024年3月11日
Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文

Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文

168 VIEWS
2024年8月30日
YouTubeVeo 引入Google DeepMind 的 Veo 模型 创作者可使用Veo创作视频

YouTubeVeo 引入Google DeepMind 的 Veo 模型 创作者可使用Veo创作视频

176 VIEWS
2024年9月19日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

- Select Visibility -

    No Result
    View All Result
    • Home
    • AI 工具
    • XiaoHu.AI 学院
      • AI 教程
      • AI 课程
    • XiaoHu.AI日报
    • 开源项目案例库
      • AI 论文
      • AI 资源
      • AI 项目
    • 加入会员
    • →社群
    • Login

    © 2024 Xiaohu.AI

    Are you sure want to unlock this post?
    Unlock left : 0
    Are you sure want to cancel subscription?
    转到手机版