Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来

by 小互
2024年9月6日
in XiaoHu.AI日报
0 0
0
面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来
0
SHARES
343
VIEWS
Share on FacebookShare on Twitter

MiniCPM3-4B 是 MiniCPM 开发的最新一代边缘端语言模型,其整体性能优于 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,并可与许多近期发布的7B~9B模型相媲美。与 MiniCPM1.0 和 MiniCPM2.0 相比,MiniCPM3-4B 功能更强大,应用范围更广泛,支持功能调用和代码解释功能。

此外,MiniCPM3-4B 配备了 32k 上下文窗口,并通过 LLMxMapReduce 技术,能够理论上处理无限上下文,而无需占用大量内存。

仅4B 参数,MiniCPM 3.0 在自然语言理解、知识、代码、数学等多项能力上对GPT-3.5 实现赶超,并越过 Qwen2-7B,Phi-3.5,GLM4-9B,LLaMa3-8B 等一众中外知名模型的表现脱颖而出。

MiniCPM3-4B 的主要优势

  • 轻量级、性能强大:4B参数量模型的推理速度快,资源占用小,但性能不逊色于更大参数的模型。
  • 多领域适应性强:在中英文任务、数学推理、代码生成和长文本处理等领域均表现出色。
  • 丰富的功能扩展:支持工具调用、代码解释和检索增强生成,能够适应广泛的应用场景。
主要功能特点
  1. 参数量与性能对比MiniCPM3-4B 具有 40 亿参数,尽管模型参数量相对较小,但在多个任务上表现超越了更大规模的模型。具体对比如下:
    • 超过 GPT-3.5-Turbo:在通用语言处理任务、数学推理、代码理解等方面,MiniCPM3-4B 在同等条件下性能优于 GPT-3.5-Turbo。
    • 与 Llama3.1-8B-Instruct、Qwen2-7B-Instruct 相比:在中英文任务、长文本处理及工具调用能力等多个方面,MiniCPM3-4B 均表现不俗。

    2. 工具调用与代码解释器

    • 工具调用功能:MiniCPM3-4B 支持函数调用功能,并在 Berkeley Function Calling Leaderboard (BFCL) 上以 76.03% 的准确率取得 SOTA 成绩,超越了 Llama3.1-8B-Instruct、Qwen2-7B-Instruct 等模型。
    • 代码解释器功能:支持代码解释器,能够执行 Python 等语言的代码,并生成实际的输出,如二维码生成等任务。

    3. 推理与语言能力

    MiniCPM3-4B 在推理和语言能力上表现尤为突出:

    • 数学能力:在 MathBench 任务中表现优异,超过了多个更大参数的模型如 GPT-3.5-Turbo 和 Llama3.1-8B。
    • 中英文指令跟随能力:在英文任务 IFEval 中达到 68.4% 的准确率,中文任务 FollowBench-zh 中达到 66.8%,均超越 GLM-4-9B-Chat 和 Qwen2-7B-Instruct。

    4. 长文本处理能力

    • 32k 上下文支持:MiniCPM3-4B 原生支持 32k 的上下文长度,能够处理长篇文本并在大海捞针测试中表现出色。
    • LLM x MapReduce 框架:提出了 LLM 与 MapReduce 的结合,理论上能够处理无限长度的上下文。

    5. RAG(检索增强生成)能力

    MiniCPM3-4B 还具有出色的检索增强生成(RAG)能力,能够在跨语言检索、开放域问答等任务中表现优异。发布的 RAG 套件包括 MiniCPM-Embedding 和 MiniCPM-Reranker,均在中文与跨语言的检索测试中取得了 SOTA 表现。

    6. 模型微调

    MiniCPM3-4B 支持通过 LoRA(低秩适配)进行模型微调,并可结合 LLaMA-Factory 进行进一步优化,以适应用户的具体需求。

➤  MiniCPM 3.0 开源地址:

🔗 https://github.com/OpenBMB/MiniCPM

🔗 https://huggingface.co/openbmb/MiniCPM3-4B
官方博客介绍:https://mp.weixin.qq.com/s/axYQOKjYUZKbQnO7UTkjSQ

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Prompt 学习地图 05 | 编写清晰地说明 – 指定任务所需的步骤

Prompt 学习地图 05 | 编写清晰地说明 – 指定任务所需的步骤

88 VIEWS
2024年3月25日
教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

283 VIEWS
2024年7月24日
Transformer Debugger:OpenAI开源专门研究模型工作原理的工具

Transformer Debugger:OpenAI开源专门研究模型工作原理的工具

18 VIEWS
2024年3月13日
提高Transformer模型处理复杂算术任务的能力的方法

提高Transformer模型处理复杂算术任务的能力的方法

39 VIEWS
2024年6月1日
LLocalSearch:完全本地运行的搜索聚合器 无需 OpenAI 或 Google API

LLocalSearch:完全本地运行的搜索聚合器 无需 OpenAI 或 Google API

187 VIEWS
2024年4月11日
奥特曼:GPT-5的能力提升将超乎想象…许多公司将面临被碾压淘汰

奥特曼:GPT-5的能力提升将超乎想象…许多公司将面临被碾压淘汰

48 VIEWS
2024年3月18日
ZeST:将一种材质从一个图像迁移到另一个图像的对象上

ZeST:将一种材质从一个图像迁移到另一个图像的对象上

188 VIEWS
2024年4月17日
英国作家协会调查显示,1/3的翻译者和1/4的插画师已经因AI失去了工作

英国作家协会调查显示,1/3的翻译者和1/4的插画师已经因AI失去了工作

577 VIEWS
2024年4月28日
Reor:一个基于AI的开源桌面笔记应用 构建你的“第二大脑”。

Reor:一个基于AI的开源桌面笔记应用 构建你的“第二大脑”。

129 VIEWS
2024年3月14日
Stability AI 推出了Stable Artisan 可以在Discord上进行图像生成与编辑

Stability AI 推出了Stable Artisan 可以在Discord上进行图像生成与编辑

250 VIEWS
2024年5月10日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版