Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

Streamer-Sales:一个直播卖货大模型 能自动卖货 实时回答客户任何问题

by 小互
2024年6月25日
in AI 项目
0 0
0
0
SHARES
733
VIEWS
Share on FacebookShare on Twitter

Streamer-Sales 是一个直播卖货大模型,它能够帮助直播带货主播生成商品解说文案。能根据商品特点,自动生成吸引用户的介绍,提升销售效果。

它可以将语音转成文字和观众互动、也支持生成带情感的语音,以及生成数字人视频进行解说,甚至能实时查询快递信息。

主要功能

  1. 主播文案一键生成:根据商品特点自动生成吸引用户的解说文案,激发购买欲望。

  2. 推理加速:集成LMDeploy进行推理加速,显著提升推理效率,支持KV缓存和Turbomind。

  3. 检索增强生成 (RAG):结合商品说明书和相关文档,增强生成的文案内容,使其更加贴合实际。

  4. 语音转文字 (ASR):支持将语音输入转换为文字,便于主播在直播过程中与观众互动。

  5. 文字转语音 (TTS):生成带有情感的语音输出,使解说更加生动自然。

  6. 数字人生成:生成虚拟主播视频,用数字人进行商品解说,提升观众体验。

  7. 实时信息查询 (Agent):通过网络查询实时信息,如快递状态,提供给用户最新的数据。

Streamer-Sales 模型架构

模型用 xtuner 在 InternLM2 的基础上指令微调而来,部署集成了 LMDeploy 加速推理🚀,支持 ASR 语音生成文字 🎙️,支持 RAG 检索增强生成📚做到可以随时更新说明书指导主播生成文案,支持 Agent 通过网络查询快递信息 🌐,还加入带有感情的 TTS 文字转语音🔊生成,最后还会生成主播数字人视频🦸,让主播不止于文字介绍。

1. 总体架构

模型介绍

  1. streamer-sales-lelemiao-7b流媒体-销售-lelemiao-7b

    • 基座:internlm2-chat-7b
    • 数据量:大约40万 Token
    • 特点:这是一个基于 internlm2-chat-7b 微调的模型,专为直播带货生成解说文案。模型通过大量商品数据的训练,能够生成高质量的商品解说文案,精准激发用户购买欲望。
    • 适用场景:线上直播销售、线下门店推广、商品广告文案生成等。
    • 下载:https://modelscope.cn/models/HinGwenWoong/streamer-sales-lelemiao-7b
  2. streamer-sales-lelemiao-7b-4bit
    • 基座:internlm2-chat-7b
    • 数据量:大约40万 Token
    • 特点:这是 streamer-sales-lelemiao-7b 模型的 4bit 量化版本,进一步优化了推理速度和资源占用。量化后的模型在保持生成质量的同时,显著提升了推理效率,适合在计算资源有限的环境中使用。
    • 适用场景:需要高效推理和快速响应的直播带货场景,尤其是在资源受限的情况下。
    • 下载:https://modelscope.cn/models/HinGwenWoong/streamer-sales-lelemiao-7b-4bit

Streamer-Sales 项目通过多个模块和技术的集成,构建了一个全面的直播带货大模型系统。其主要架构包括以下几个部分:

  1. 数据生成与处理模块

    • 数据集生成:采用通义千问和文心一言生成数据集,包括商品文案和问答对话。
    • 数据清洗和合并:对生成的数据进行清洗,合并并转换为适合训练的格式。
    • RAG 数据库生成:创建向量数据库,以支持检索增强生成。
  2. 模型训练与微调

    • 基础模型:使用 InternLM2 作为基础模型。
    • 微调:使用 xtuner 对基础模型进行指令微调,以适应不同商品和用户需求。
    • 量化处理:使用 LMDeploy 进行4bit量化,提升推理效率。
  3. 推理与生成模块

    • 推理加速:集成 LMDeploy 和 Turbomind,支持 KV cache,显著提升推理速度。
    • 检索增强生成 (RAG):结合商品说明书和相关文档,增强生成的文案内容。
  4. 语音处理模块

    • ASR (语音转文字):支持语音输入转换为文字。
    • TTS (文字转语音):生成带有情感的语音输出,增强用户体验。
  5. 数字人生成模块

    • 使用 ComfyUI workflow 生成虚拟主播视频,提供生动的商品解说。
  6. 实时信息查询模块

    • Agent 集成:通过网络查询实时信息,如快递状态和天气信息,提供即时反馈。

GitHub:https://github.com/PeterH0323/Streamer-Sales

在线体验:https://openxlab.org.cn/apps/detail/HinGwenWong/Streamer-Sales

 

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
338
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
450
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
279
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
617
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
429

Recommendeds

Stability AI发布Stable Audio 2.0 可生成长达三分钟的立体声音乐

Stability AI发布Stable Audio 2.0 可生成长达三分钟的立体声音乐

652 VIEWS
2024年4月3日
Perplexity 推出全新 AI 驱动购物助手:Shop Like a Pro 支持搜索结果一键下单

Perplexity 推出全新 AI 驱动购物助手:Shop Like a Pro 支持搜索结果一键下单

260 VIEWS
2024年11月19日
Runway Act-One 使用教程 :仅通过单个视频和任意角色图像生成生动的表演动画

Runway Act-One 使用教程 :仅通过单个视频和任意角色图像生成生动的表演动画

316 VIEWS
2024年11月4日
CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

121 VIEWS
2024年5月3日
Fashion-VDM:通过给定的服装图像和人物视频 生成一段虚拟试穿视频

Fashion-VDM:通过给定的服装图像和人物视频 生成一段虚拟试穿视频

427 VIEWS
2024年11月13日
百川智能发布 Baichuan 4模型及首款AI智能助手“百小应” 可联网搜索

百川智能发布 Baichuan 4模型及首款AI智能助手“百小应” 可联网搜索

335 VIEWS
2024年5月22日
DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

180 VIEWS
2024年8月29日
GameGen-O:可以生成开放世界游戏的模型  自动生成角色、场景、动作和事件

GameGen-O:可以生成开放世界游戏的模型 自动生成角色、场景、动作和事件

331 VIEWS
2024年9月14日
OpenAI 首席科学家MIT演讲:揭示 o1模型训练核心 激励模型学习是培养 AGI 的最佳方式

OpenAI 首席科学家MIT演讲:揭示 o1模型训练核心 激励模型学习是培养 AGI 的最佳方式

446 VIEWS
2024年9月22日
V-Express:根据单张个人照片生成视频 并能通过多种信号控制视频内容

V-Express:根据单张个人照片生成视频 并能通过多种信号控制视频内容

417 VIEWS
2024年5月30日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版