Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用

by 小互
2024年7月21日
in XiaoHu.AI日报
0 0
0
Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型 该模型旨在支持企业应用
0
SHARES
183
VIEWS
Share on FacebookShare on Twitter

Mistral AI 宣布发布 Mistral NeMo,这是一个由 NVIDIA 协作开发的 12B 参数模型,具备高达 128k 令牌的上下文窗口。该模型旨在支持企业应用,包括聊天机器人、多语言任务、编码和摘要。在其尺寸类别中,Mistral NeMo 在推理、世界知识和代码准确性方面均处于领先地位。使用标准架构,Mistral NeMo 易于使用,可作为任何使用 Mistral 7B 系统的直接替代品。

主要特点

  • 广泛的上下文窗口:支持高达 128k 令牌的上下文窗口,使其在处理长文本时具有明显优势。
  • 多语言支持:针对全球多语言应用进行了优化,特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语方面表现出色。
  • 量化感知训练:支持 FP8 推理,减少内存占用并加快部署速度,同时不降低准确性。

性能表现

  • 高性能和灵活性:Mistral NeMo模型在多轮对话、数学、常识推理、世界知识和编码方面表现出色,提供精确可靠的性能。
  • 128K上下文长度:能够更连贯和准确地处理复杂信息,确保输出具有上下文相关性。
  • 企业级支持和安全:模型作为NVIDIA NIM推理微服务提供,性能优化,支持灵活部署。
  • 与其他模型的比较:在与 Gemma 2 9B 和 Llama 3 8B 的对比中,Mistral NeMo 基础模型在多项基准测试中表现优异。
  • 高效的分词器:Mistral NeMo 使用新型 Tekken 分词器,比之前的 SentencePiece 分词器在压缩源代码、中文、意大利语、法语、德语、西班牙语和俄语方面更高效,压缩效率提高约 30%。对于韩语和阿拉伯语,其压缩效率分别提高了 2 倍和 3 倍。这意味着它能以更少的存储空间表示相同数量的文本。

指令微调

  • 精细调优:Mistral NeMo 经过高级微调和对齐,与 Mistral 7B 相比,能够更好地遵循精确指令、推理、处理多轮对话和生成代码。官方介绍:https://mistral.ai/news/mistral-nemo
    模型下载: base and  instruct

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Google DeepMind 发布一套可视化工具 可以让你了解语言模型的内部工作原理

Google DeepMind 发布一套可视化工具 可以让你了解语言模型的内部工作原理

493 VIEWS
2024年8月1日
Meta AI最新研究:通过同时预测多个未来标记 提升模型推理速度和性能

Meta AI最新研究:通过同时预测多个未来标记 提升模型推理速度和性能

46 VIEWS
2024年5月11日
Interactive3D:用户可以直接通过交互操作指导3D模型生成

Interactive3D:用户可以直接通过交互操作指导3D模型生成

105 VIEWS
2024年4月26日
iPhone 16 的相机控制按钮:是如何工作的 苹果通过它可以随时将Touch ID带回iPhone

iPhone 16 的相机控制按钮:是如何工作的 苹果通过它可以随时将Touch ID带回iPhone

226 VIEWS
2024年9月10日
NotebookLlama:Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程

NotebookLlama:Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程

266 VIEWS
2024年10月28日
Claude 3全系支持函数调用工具Tool use  可与外部系统进行交互

Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互

239 VIEWS
2024年6月1日
Hume AI发布其情感智能的语音接口 EVI API 可集成到任何应用中

Hume AI发布其情感智能的语音接口 EVI API 可集成到任何应用中

227 VIEWS
2024年4月24日
DataDreamer:简化大语言模型工作流程

DataDreamer:简化大语言模型工作流程

32 VIEWS
2024年3月3日
对标NotebookLM Play AI推出了PlayDialog:可生成自然对话播客、旁白以及自然交互

对标NotebookLM Play AI推出了PlayDialog:可生成自然对话播客、旁白以及自然交互

434 VIEWS
2024年11月13日
Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

413 VIEWS
2024年9月6日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版