Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home AI 工具

Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气

by 小互
2024年9月30日
in AI 工具
0 0
0
Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气
0
SHARES
750
VIEWS
Share on FacebookShare on Twitter

Open NotebookLM 是一个将 PDF 文件转化为播客的工具,依靠 Llama 3.1 和 meloTTS 等开源技术构建,可以实现 NotebookLM 的部分体验。用户可以上传文件或通过 URL 提供内容,并能对播客的语气和长度进行定制化。

由于采用了 meloTTS 理论上是支持中文的。

  • PDF 转播客:可以将任何 PDF 文档或者链接转换为播客形式。通过分析 PDF 内容,生成自然的对话,适合音频播客格式。
  • 对话生成:工具生成的对话设计为既信息丰富又具有娱乐性,使内容易于聆听和理解。
  • 用户友好界面:使用基于 Gradio 的简单交互界面,用户可以轻松上传 PDF 并生成播客内容,无需复杂的设置。
  • 文本转语音:利用开源的 LLM(大语言模型) 和 文本转语音模型,将文本转换为自然的语音对话,支持多种语言,并以 MP3 格式导出。
  • 使用了 Llama 3.1、meloTTS 和 Gradio 等开源 AI 工具构建。

GitHub:https://github.com/gabrielchua/open-notebooklm

在线演示:https://huggingface.co/spaces/gabrielchua/open-notebooklm

案例展示:

英文:

9月30日 1

中文:

930Google Chrome
Google Chrome30

 

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
494
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
346
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
460
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
284
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
636
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
435

Recommendeds

Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达

Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达

471 VIEWS
2024年9月23日
RenderNet Al 推出视频换脸功能 可轻松通过照片更改视频人物面容

RenderNet Al 推出视频换脸功能 可轻松通过照片更改视频人物面容

1.2k VIEWS
2024年7月16日
GPT-4o官方演示的16个完整视频中文翻译

GPT-4o官方演示的16个完整视频中文翻译

676 VIEWS
2024年5月17日
Command R 系列更新 编码、数学、推理和延迟方面进行了显著提升

Command R 系列更新 编码、数学、推理和延迟方面进行了显著提升

114 VIEWS
2024年9月3日
Cognition 的 AI工程师 Devin 正式推出 500美金一个月

Cognition 的 AI工程师 Devin 正式推出 500美金一个月

301 VIEWS
2024年12月11日
DBRX:  132B参数的 新开源大语言模型  细粒度混合专家架构

DBRX: 132B参数的 新开源大语言模型 细粒度混合专家架构

35 VIEWS
2024年3月28日
ChatGPT Mac客户端正式发布 可以通过屏幕截图上的任何内容进行聊天

ChatGPT Mac客户端正式发布 可以通过屏幕截图上的任何内容进行聊天

556 VIEWS
2024年6月26日
Clone Robotics:可以生产类似西部世界里面的仿生机器人的公司

Clone Robotics:可以生产类似西部世界里面的仿生机器人的公司

490 VIEWS
2024年7月4日
Twitter-Insight-LLM:抓取Twitter数据并可通过自然语言搜索图像

Twitter-Insight-LLM:抓取Twitter数据并可通过自然语言搜索图像

451 VIEWS
2024年4月19日
提高Transformer模型处理复杂算术任务的能力的方法

提高Transformer模型处理复杂算术任务的能力的方法

39 VIEWS
2024年6月1日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版