Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用

by 小互
2024年7月21日
in XiaoHu.AI日报
0 0
0
Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用
0
SHARES
183
VIEWS
Share on FacebookShare on Twitter

Mistral AI 宣布发布 Mistral NeMo,这是一个由 NVIDIA 协作开发的 12B 参数模型,具备高达 128k 令牌的上下文窗口。该模型旨在支持企业应用,包括聊天机器人、多语言任务、编码和摘要。在其尺寸类别中,Mistral NeMo 在推理、世界知识和代码准确性方面均处于领先地位。使用标准架构,Mistral NeMo 易于使用,可作为任何使用 Mistral 7B 系统的直接替代品。

主要特点

  • 广泛的上下文窗口:支持高达 128k 令牌的上下文窗口,使其在处理长文本时具有明显优势。
  • 多语言支持:针对全球多语言应用进行了优化,特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语方面表现出色。
  • 量化感知训练:支持 FP8 推理,减少内存占用并加快部署速度,同时不降低准确性。

性能表现

  • 高性能和灵活性:Mistral NeMo模型在多轮对话、数学、常识推理、世界知识和编码方面表现出色,提供精确可靠的性能。
  • 128K上下文长度:能够更连贯和准确地处理复杂信息,确保输出具有上下文相关性。
  • 企业级支持和安全:模型作为NVIDIA NIM推理微服务提供,性能优化,支持灵活部署。
  • 与其他模型的比较:在与 Gemma 2 9B 和 Llama 3 8B 的对比中,Mistral NeMo 基础模型在多项基准测试中表现优异。
  • 高效的分词器:Mistral NeMo 使用新型 Tekken 分词器,比之前的 SentencePiece 分词器在压缩源代码、中文、意大利语、法语、德语、西班牙语和俄语方面更高效,压缩效率提高约 30%。对于韩语和阿拉伯语,其压缩效率分别提高了 2 倍和 3 倍。这意味着它能以更少的存储空间表示相同数量的文本。

指令微调

  • 精细调优:Mistral NeMo 经过高级微调和对齐,与 Mistral 7B 相比,能够更好地遵循精确指令、推理、处理多轮对话和生成代码。官方介绍:https://mistral.ai/news/mistral-nemo
    模型下载: base and  instruct

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

DesignEdit:实现统一与精确的图像编辑 操控图像中的各个元素

DesignEdit:实现统一与精确的图像编辑 操控图像中的各个元素

119 VIEWS
2024年4月10日
Comflowyspace:开箱即用的 Comfy UI 整合包

Comflowyspace:开箱即用的 Comfy UI 整合包

109 VIEWS
2024年3月6日
v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码

v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码

605 VIEWS
2024年8月21日
微软推出针对个人的 “AI伴侣” Copilot  会根据用户的行为模式、习惯自动进化

微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化

263 VIEWS
2024年10月1日
GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的

GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的

989 VIEWS
2024年11月21日
HivisionIDPhotos :轻量级且高效的AI证件照制作工具 可以生成各种标准证件照

HivisionIDPhotos :轻量级且高效的AI证件照制作工具 可以生成各种标准证件照

784 VIEWS
2024年8月31日
AI和脑机接口帮助失语症患者恢复双语交流

AI和脑机接口帮助失语症患者恢复双语交流

110 VIEWS
2024年6月1日
Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频

Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频

107 VIEWS
2024年5月16日
Nothing CEO  我们将进入一个后应用时代 在未来将不再有应用程序

Nothing CEO 我们将进入一个后应用时代 在未来将不再有应用程序

137 VIEWS
2024年6月7日
Prompt 学习地图 21 | 认知误区 – 许愿式提示词

Prompt 学习地图 21 | 认知误区 – 许愿式提示词

110 VIEWS
2024年5月3日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版