Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来

by 小互
2024年9月6日
in XiaoHu.AI日报
0 0
0
面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来
0
SHARES
343
VIEWS
Share on FacebookShare on Twitter

MiniCPM3-4B 是 MiniCPM 开发的最新一代边缘端语言模型,其整体性能优于 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,并可与许多近期发布的7B~9B模型相媲美。与 MiniCPM1.0 和 MiniCPM2.0 相比,MiniCPM3-4B 功能更强大,应用范围更广泛,支持功能调用和代码解释功能。

此外,MiniCPM3-4B 配备了 32k 上下文窗口,并通过 LLMxMapReduce 技术,能够理论上处理无限上下文,而无需占用大量内存。

仅4B 参数,MiniCPM 3.0 在自然语言理解、知识、代码、数学等多项能力上对GPT-3.5 实现赶超,并越过 Qwen2-7B,Phi-3.5,GLM4-9B,LLaMa3-8B 等一众中外知名模型的表现脱颖而出。

MiniCPM3-4B 的主要优势

  • 轻量级、性能强大:4B参数量模型的推理速度快,资源占用小,但性能不逊色于更大参数的模型。
  • 多领域适应性强:在中英文任务、数学推理、代码生成和长文本处理等领域均表现出色。
  • 丰富的功能扩展:支持工具调用、代码解释和检索增强生成,能够适应广泛的应用场景。
主要功能特点
  1. 参数量与性能对比MiniCPM3-4B 具有 40 亿参数,尽管模型参数量相对较小,但在多个任务上表现超越了更大规模的模型。具体对比如下:
    • 超过 GPT-3.5-Turbo:在通用语言处理任务、数学推理、代码理解等方面,MiniCPM3-4B 在同等条件下性能优于 GPT-3.5-Turbo。
    • 与 Llama3.1-8B-Instruct、Qwen2-7B-Instruct 相比:在中英文任务、长文本处理及工具调用能力等多个方面,MiniCPM3-4B 均表现不俗。

    2. 工具调用与代码解释器

    • 工具调用功能:MiniCPM3-4B 支持函数调用功能,并在 Berkeley Function Calling Leaderboard (BFCL) 上以 76.03% 的准确率取得 SOTA 成绩,超越了 Llama3.1-8B-Instruct、Qwen2-7B-Instruct 等模型。
    • 代码解释器功能:支持代码解释器,能够执行 Python 等语言的代码,并生成实际的输出,如二维码生成等任务。

    3. 推理与语言能力

    MiniCPM3-4B 在推理和语言能力上表现尤为突出:

    • 数学能力:在 MathBench 任务中表现优异,超过了多个更大参数的模型如 GPT-3.5-Turbo 和 Llama3.1-8B。
    • 中英文指令跟随能力:在英文任务 IFEval 中达到 68.4% 的准确率,中文任务 FollowBench-zh 中达到 66.8%,均超越 GLM-4-9B-Chat 和 Qwen2-7B-Instruct。

    4. 长文本处理能力

    • 32k 上下文支持:MiniCPM3-4B 原生支持 32k 的上下文长度,能够处理长篇文本并在大海捞针测试中表现出色。
    • LLM x MapReduce 框架:提出了 LLM 与 MapReduce 的结合,理论上能够处理无限长度的上下文。

    5. RAG(检索增强生成)能力

    MiniCPM3-4B 还具有出色的检索增强生成(RAG)能力,能够在跨语言检索、开放域问答等任务中表现优异。发布的 RAG 套件包括 MiniCPM-Embedding 和 MiniCPM-Reranker,均在中文与跨语言的检索测试中取得了 SOTA 表现。

    6. 模型微调

    MiniCPM3-4B 支持通过 LoRA(低秩适配)进行模型微调,并可结合 LLaMA-Factory 进行进一步优化,以适应用户的具体需求。

➤  MiniCPM 3.0 开源地址:

🔗 https://github.com/OpenBMB/MiniCPM

🔗 https://huggingface.co/openbmb/MiniCPM3-4B
官方博客介绍:https://mp.weixin.qq.com/s/axYQOKjYUZKbQnO7UTkjSQ

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

YOLO v10:毫秒级实时的端到端目标检测开源模型

YOLO v10:毫秒级实时的端到端目标检测开源模型

690 VIEWS
2024年5月25日
微软文本转语音虚拟数字人功能上线 可以创建实时互动的数字人

微软文本转语音虚拟数字人功能上线 可以创建实时互动的数字人

1.1k VIEWS
2024年6月29日
FreeAskInternet:无需GPU 完全免费、私密且本地运行的搜索答案生成器

FreeAskInternet:无需GPU 完全免费、私密且本地运行的搜索答案生成器

300 VIEWS
2024年4月11日
轻量级冠军:英伟达发布最精确的小语言模型 可在移动设备上运行

轻量级冠军:英伟达发布最精确的小语言模型 可在移动设备上运行

267 VIEWS
2024年8月23日
IDM-VTON:虚拟试衣技术 能够生成高度真实的虚拟试衣图像

IDM-VTON:虚拟试衣技术 能够生成高度真实的虚拟试衣图像

344 VIEWS
2024年4月25日
MidJourney 推出个性化档案和情绪版新功能 记住你的风格喜好

MidJourney 推出个性化档案和情绪版新功能 记住你的风格喜好

316 VIEWS
2024年12月17日
教程:如何在 Midjourney 中通过混合 srefs 创建双重色彩图像效果

教程:如何在 Midjourney 中通过混合 srefs 创建双重色彩图像效果

102 VIEWS
2024年8月29日
Libcimbar:无需联网、蓝牙、NFC  扫描二维码即可传输文件

Libcimbar:无需联网、蓝牙、NFC 扫描二维码即可传输文件

1.8k VIEWS
2024年9月20日
如何使用Midjourney v6 创建自己的服装品牌

如何使用Midjourney v6 创建自己的服装品牌

114 VIEWS
2024年3月7日
Marker :快速准确地将各种文件转换为 Markdown 格式

Marker :快速准确地将各种文件转换为 Markdown 格式

135 VIEWS
2024年3月7日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版