Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

Streamer-Sales:一个直播卖货大模型 能自动卖货 实时回答客户任何问题

by 小互
2024年6月25日
in AI 项目
0 0
0
0
SHARES
733
VIEWS
Share on FacebookShare on Twitter

Streamer-Sales 是一个直播卖货大模型,它能够帮助直播带货主播生成商品解说文案。能根据商品特点,自动生成吸引用户的介绍,提升销售效果。

它可以将语音转成文字和观众互动、也支持生成带情感的语音,以及生成数字人视频进行解说,甚至能实时查询快递信息。

主要功能

  1. 主播文案一键生成:根据商品特点自动生成吸引用户的解说文案,激发购买欲望。

  2. 推理加速:集成LMDeploy进行推理加速,显著提升推理效率,支持KV缓存和Turbomind。

  3. 检索增强生成 (RAG):结合商品说明书和相关文档,增强生成的文案内容,使其更加贴合实际。

  4. 语音转文字 (ASR):支持将语音输入转换为文字,便于主播在直播过程中与观众互动。

  5. 文字转语音 (TTS):生成带有情感的语音输出,使解说更加生动自然。

  6. 数字人生成:生成虚拟主播视频,用数字人进行商品解说,提升观众体验。

  7. 实时信息查询 (Agent):通过网络查询实时信息,如快递状态,提供给用户最新的数据。

Streamer-Sales 模型架构

模型用 xtuner 在 InternLM2 的基础上指令微调而来,部署集成了 LMDeploy 加速推理🚀,支持 ASR 语音生成文字 🎙️,支持 RAG 检索增强生成📚做到可以随时更新说明书指导主播生成文案,支持 Agent 通过网络查询快递信息 🌐,还加入带有感情的 TTS 文字转语音🔊生成,最后还会生成主播数字人视频🦸,让主播不止于文字介绍。

1. 总体架构

模型介绍

  1. streamer-sales-lelemiao-7b流媒体-销售-lelemiao-7b

    • 基座:internlm2-chat-7b
    • 数据量:大约40万 Token
    • 特点:这是一个基于 internlm2-chat-7b 微调的模型,专为直播带货生成解说文案。模型通过大量商品数据的训练,能够生成高质量的商品解说文案,精准激发用户购买欲望。
    • 适用场景:线上直播销售、线下门店推广、商品广告文案生成等。
    • 下载:https://modelscope.cn/models/HinGwenWoong/streamer-sales-lelemiao-7b
  2. streamer-sales-lelemiao-7b-4bit
    • 基座:internlm2-chat-7b
    • 数据量:大约40万 Token
    • 特点:这是 streamer-sales-lelemiao-7b 模型的 4bit 量化版本,进一步优化了推理速度和资源占用。量化后的模型在保持生成质量的同时,显著提升了推理效率,适合在计算资源有限的环境中使用。
    • 适用场景:需要高效推理和快速响应的直播带货场景,尤其是在资源受限的情况下。
    • 下载:https://modelscope.cn/models/HinGwenWoong/streamer-sales-lelemiao-7b-4bit

Streamer-Sales 项目通过多个模块和技术的集成,构建了一个全面的直播带货大模型系统。其主要架构包括以下几个部分:

  1. 数据生成与处理模块

    • 数据集生成:采用通义千问和文心一言生成数据集,包括商品文案和问答对话。
    • 数据清洗和合并:对生成的数据进行清洗,合并并转换为适合训练的格式。
    • RAG 数据库生成:创建向量数据库,以支持检索增强生成。
  2. 模型训练与微调

    • 基础模型:使用 InternLM2 作为基础模型。
    • 微调:使用 xtuner 对基础模型进行指令微调,以适应不同商品和用户需求。
    • 量化处理:使用 LMDeploy 进行4bit量化,提升推理效率。
  3. 推理与生成模块

    • 推理加速:集成 LMDeploy 和 Turbomind,支持 KV cache,显著提升推理速度。
    • 检索增强生成 (RAG):结合商品说明书和相关文档,增强生成的文案内容。
  4. 语音处理模块

    • ASR (语音转文字):支持语音输入转换为文字。
    • TTS (文字转语音):生成带有情感的语音输出,增强用户体验。
  5. 数字人生成模块

    • 使用 ComfyUI workflow 生成虚拟主播视频,提供生动的商品解说。
  6. 实时信息查询模块

    • Agent 集成:通过网络查询实时信息,如快递状态和天气信息,提供即时反馈。

GitHub:https://github.com/PeterH0323/Streamer-Sales

在线体验:https://openxlab.org.cn/apps/detail/HinGwenWong/Streamer-Sales

 

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

OpenAI CTO Mira Murati 母校访谈实录 博士级别的人工智能有望在一年半的时间内发布

OpenAI CTO Mira Murati 母校访谈实录 博士级别的人工智能有望在一年半的时间内发布

97 VIEWS
2024年6月22日
李飞飞:借助空间智能,人工智能将了解真实世界

李飞飞:借助空间智能,人工智能将了解真实世界

380 VIEWS
2024年5月17日
CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

121 VIEWS
2024年5月3日
Apten:AI 驱动的短信助手 让AI通过短信和你的客户进行交流

Apten:AI 驱动的短信助手 让AI通过短信和你的客户进行交流

247 VIEWS
2024年5月29日
Glyph-ByT5:提高图像生成中文本渲染的准确性 提升近90%

Glyph-ByT5:提高图像生成中文本渲染的准确性 提升近90%

128 VIEWS
2024年6月18日
Google 宣布 Gemini 1.5 Pro 开放 API 新增对原生语音理解能力

Google 宣布 Gemini 1.5 Pro 开放 API 新增对原生语音理解能力

293 VIEWS
2024年4月10日
DeepMind 发布 AlphaFold 3 能够预测所有生命分子结构和相互作用的 AI 模型

DeepMind 发布 AlphaFold 3 能够预测所有生命分子结构和相互作用的 AI 模型

396 VIEWS
2024年5月9日
Screenshot to Code:将网页屏幕截图直接转换为干净的代码

Screenshot to Code:将网页屏幕截图直接转换为干净的代码

80 VIEWS
2024年3月3日
Jina AI发布 Jina ColBERT v2: 一个多语言的晚期交互信息检索模型

Jina AI发布 Jina ColBERT v2: 一个多语言的晚期交互信息检索模型

300 VIEWS
2024年9月3日
Sanctuary AI发布其第七代机器人 更接近人类 24小时之内就能学会新任务

Sanctuary AI发布其第七代机器人 更接近人类 24小时之内就能学会新任务

220 VIEWS
2024年4月27日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版