Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用

by 小互
2024年7月21日
in XiaoHu.AI日报
0 0
0
Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用
0
SHARES
183
VIEWS
Share on FacebookShare on Twitter

Mistral AI 宣布发布 Mistral NeMo,这是一个由 NVIDIA 协作开发的 12B 参数模型,具备高达 128k 令牌的上下文窗口。该模型旨在支持企业应用,包括聊天机器人、多语言任务、编码和摘要。在其尺寸类别中,Mistral NeMo 在推理、世界知识和代码准确性方面均处于领先地位。使用标准架构,Mistral NeMo 易于使用,可作为任何使用 Mistral 7B 系统的直接替代品。

主要特点

  • 广泛的上下文窗口:支持高达 128k 令牌的上下文窗口,使其在处理长文本时具有明显优势。
  • 多语言支持:针对全球多语言应用进行了优化,特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语方面表现出色。
  • 量化感知训练:支持 FP8 推理,减少内存占用并加快部署速度,同时不降低准确性。

性能表现

  • 高性能和灵活性:Mistral NeMo模型在多轮对话、数学、常识推理、世界知识和编码方面表现出色,提供精确可靠的性能。
  • 128K上下文长度:能够更连贯和准确地处理复杂信息,确保输出具有上下文相关性。
  • 企业级支持和安全:模型作为NVIDIA NIM推理微服务提供,性能优化,支持灵活部署。
  • 与其他模型的比较:在与 Gemma 2 9B 和 Llama 3 8B 的对比中,Mistral NeMo 基础模型在多项基准测试中表现优异。
  • 高效的分词器:Mistral NeMo 使用新型 Tekken 分词器,比之前的 SentencePiece 分词器在压缩源代码、中文、意大利语、法语、德语、西班牙语和俄语方面更高效,压缩效率提高约 30%。对于韩语和阿拉伯语,其压缩效率分别提高了 2 倍和 3 倍。这意味着它能以更少的存储空间表示相同数量的文本。

指令微调

  • 精细调优:Mistral NeMo 经过高级微调和对齐,与 Mistral 7B 相比,能够更好地遵循精确指令、推理、处理多轮对话和生成代码。官方介绍:https://mistral.ai/news/mistral-nemo
    模型下载: base and  instruct

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
615
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Transfusion:一种可生成文本和图像的统一多模态模型

Transfusion:一种可生成文本和图像的统一多模态模型

150 VIEWS
2024年8月24日
Follow-Your-Emoji:通过表情感知 精细控制和生成动态表情丰富的肖像动画

Follow-Your-Emoji:通过表情感知 精细控制和生成动态表情丰富的肖像动画

268 VIEWS
2024年6月8日
LoG:百万平方米大场景的3D实时视图合成

LoG:百万平方米大场景的3D实时视图合成

225 VIEWS
2024年5月1日
只需要4个摄像头视角和3D骨骼姿势 实现全息角色传送

只需要4个摄像头视角和3D骨骼姿势 实现全息角色传送

238 VIEWS
2024年5月7日
英伟达发布全新Blackwell GPU计算平台 开启新工业革命

英伟达发布全新Blackwell GPU计算平台 开启新工业革命

22 VIEWS
2024年3月19日
苹果发布一种新的图像和视频生成方法:“套娃扩散模型” 可同时处理不同分辨率的图像

苹果发布一种新的图像和视频生成方法:“套娃扩散模型” 可同时处理不同分辨率的图像

82 VIEWS
2024年8月9日
Gemini Teacher:基于 Gemini 2.0的英语口语练习助手 实时发音纠正和建议

Gemini Teacher:基于 Gemini 2.0的英语口语练习助手 实时发音纠正和建议

595 VIEWS
2024年12月22日
苹果对 Siri 进行全面改造 具有屏幕感知能力以及跨应用执行各种任务

苹果对 Siri 进行全面改造 具有屏幕感知能力以及跨应用执行各种任务

609 VIEWS
2024年6月11日
FireCrawl:能够抓取任何网站的所有可访问子页面,无需站点地图

FireCrawl:能够抓取任何网站的所有可访问子页面,无需站点地图

1.5k VIEWS
2024年10月6日
乌克兰外交部引入人工智能新闻发言人 即时更新战争信息

乌克兰外交部引入人工智能新闻发言人 即时更新战争信息

137 VIEWS
2024年5月2日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版