Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home AI 工具

Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气

by 小互
2024年9月30日
in AI 工具
0 0
0
Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气
0
SHARES
746
VIEWS
Share on FacebookShare on Twitter

Open NotebookLM 是一个将 PDF 文件转化为播客的工具,依靠 Llama 3.1 和 meloTTS 等开源技术构建,可以实现 NotebookLM 的部分体验。用户可以上传文件或通过 URL 提供内容,并能对播客的语气和长度进行定制化。

由于采用了 meloTTS 理论上是支持中文的。

  • PDF 转播客:可以将任何 PDF 文档或者链接转换为播客形式。通过分析 PDF 内容,生成自然的对话,适合音频播客格式。
  • 对话生成:工具生成的对话设计为既信息丰富又具有娱乐性,使内容易于聆听和理解。
  • 用户友好界面:使用基于 Gradio 的简单交互界面,用户可以轻松上传 PDF 并生成播客内容,无需复杂的设置。
  • 文本转语音:利用开源的 LLM(大语言模型) 和 文本转语音模型,将文本转换为自然的语音对话,支持多种语言,并以 MP3 格式导出。
  • 使用了 Llama 3.1、meloTTS 和 Gradio 等开源 AI 工具构建。

GitHub:https://github.com/gabrielchua/open-notebooklm

在线演示:https://huggingface.co/spaces/gabrielchua/open-notebooklm

案例展示:

英文:

9月30日 1

中文:

930Google Chrome
Google Chrome30

 

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
450
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
279
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

李飞飞的空间智能公司World Labs正式成立 获得 2.3 亿美元融资 估值10亿美金

李飞飞的空间智能公司World Labs正式成立 获得 2.3 亿美元融资 估值10亿美金

322 VIEWS
2024年9月15日
微软推出针对个人的 “AI伴侣” Copilot  会根据用户的行为模式、习惯自动进化

微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化

263 VIEWS
2024年10月1日
基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务

基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务

357 VIEWS
2024年5月6日

Prompt 学习地图 29 | 国产大模型及提示词适配

324 VIEWS
2024年5月20日
Photoshop 升级为 Adobe Firefly Image 3 模型 大幅升级

Photoshop 升级为 Adobe Firefly Image 3 模型 大幅升级

240 VIEWS
2024年4月24日
Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

322 VIEWS
2024年11月5日
LLaVA++ : 赋予Phi-3 和 Llama-3 视觉能力

LLaVA++ : 赋予Phi-3 和 Llama-3 视觉能力

232 VIEWS
2024年4月27日
Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用

Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用

141 VIEWS
2024年9月11日
X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供

X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供

33 VIEWS
2024年3月29日
MaskGCT:零样本文本到语音(TTS)模型 支持跨语言配音、语音转换、情感控制等

MaskGCT:零样本文本到语音(TTS)模型 支持跨语言配音、语音转换、情感控制等

633 VIEWS
2024年10月27日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版