Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mistral AI 发布了全新的 Pixtral Large 开源模型 超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet

by 小互
2024年11月19日
in XiaoHu.AI日报
0 0
0
Mistral AI 发布了全新的 Pixtral Large 开源模型 超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet
0
SHARES
232
VIEWS
Share on FacebookShare on Twitter

Mistral AI 发布了全新的 Pixtral Large 模型,这是一款具备多模态能力的开源模型,基于 Mistral Large 2 构建,参数量达到 1240 亿,并进一步扩展了图像与文本理解能力。

  • 多模态能力:配备 123B 参数解码器 和 1B 参数视觉编码器,在文本处理能力基础上显著提升了视觉处理性能。
  • 超大上下文窗口:支持 128K Token,可同时处理多达 30 张高分辨率图像或复杂长文档。
  • 文档解析、图像理解、图表分析。
  • 能够处理 OCR(光学字符识别)、表格、公式和图形等多种输入格式。

主要性能表现

  1. MathVista(数学推理任务):
    • 该模型在视觉数据的数学推理方面取得 69.4% 准确率,领先于目前市面上所有同类模型。
  2. 文档与图表问答能力(DocVQA 和 ChartQA):
    • 在复杂文档和图表推理中,Pixtral Large 凭借强大的视觉理解能力超越 GPT-4o 和 Gemini-1.5 Pro。
  3. MM-MT-Bench(多模态综合评估):
    • 这是一个开放源代码的评估框架,模拟真实世界应用场景,Pixtral Large 在其中全面领先 Claude-3.5 Sonnet、GPT-4o 等最新模型。

      • 在图表、文档和图像处理能力上超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet。
      • 更大的上下文窗口(128K Token)和强大的视觉编码器,使其能够处理更复杂的多模态任务。

      综合能力

      • 文本处理与视觉处理能力均达行业顶级。
      • 适合复杂场景的语义推理、多模态问答和自动化任务。

应用示例

  1. 多语言 OCR 与推理:
    • 提示:我买了咖啡和香肠,加上 18% 的小费后我需要支付多少?
    • 输出:模型能够清晰计算物品费用、小费金额和最终支付总额。

      Prompt: :

      I bought the coffee and the sausage. How much do I owe? Add a 18% tip.
      我买了咖啡和香肠。我得付多少钱?添加 18% 的小费。

      Response: 回复:

      To calculate the total amount you owe, including the 18% tip, follow these steps:
      要计算您所欠的总金额(包括 18% 小费),请按照以下步骤操作:

      1. Calculate the cost of the coffee and the sausage:
        计算咖啡和香肠的成本:

        • 2x Latte Macchiato: 2 * 4.50 CHF = 9.00 CHF
          2 杯拿铁玛奇朵:2 * 4.50 瑞士法郎 = 9.00 瑞士法郎
        • 1x Schweinschnitzel: 22.00 CHF
          1x 炸猪排:22.00 瑞士法郎
        • Total cost for coffee and sausage: 9.00 CHF + 22.00 CHF = 31.00 CHF
          咖啡和香肠的总成本:9.00 瑞士法郎 + 22.00 瑞士法郎 = 31.00 瑞士法郎
      2. Calculate the 18% tip: 计算 18% 小费:

        • Tip: 31.00 CHF * 0.18 = 5.58 CHF
          小费:31.00 瑞士法郎 * 0.18 = 5.58 瑞士法郎
      3. Add the tip to the total cost:
        将小费添加到总成本中:

        • Total amount owed: 31.00 CHF + 5.58 CHF = 36.58 CHF
          欠款总额:31.00 瑞士法郎 + 5.58 瑞士法郎 = 36.58 瑞士法郎

      So, you owe a total of 36.58 CHF.
      因此,您总共欠 36.58 瑞士法郎。

  2. 图表分析:
    • 提示:Dark Dragon 模型在什么时候开始表现不稳定?
    • 输出:分析模型训练时损失值的波动,准确指出模型问题发生的步骤。

      Prompt: :

      When did things start to go wrong for dark dragon?
      黑龙什么时候开始出问题的?

      Response: 回复:

      The training loss for the “dark-dragon-50” model starts to exhibit significant instability around the 10,000 steps mark. There is a noticeable spike in the loss value at this point, and the instability continues with another major spike around the 20,000 steps mark. These spikes indicate that the training process for the “dark-dragon-50” model began to encounter issues starting around the 10,000 steps mark.
      “dark-dragon-50”模型的训练损失在 10,000 步标记附近开始表现出明显的不稳定。此时损失值出现明显的峰值,并且不稳定状态仍在继续,在 20,000 步大关附近出现另一个峰值。这些峰值表明“dark-dragon-50”模型的训练过程从 10,000 步大关开始就开始遇到问题。

  3. 企业支持场景:
    • 在知识探索与共享、文档语义理解、任务自动化以及改善客户体验等企业级场景中,Pixtral Large 展现了显著能力。

      Prompt: :

      Which companies use models made by Mistral AI?
      哪些公司使用 Mistral AI 制作的模型?

      Response: 回复:

      The companies that use models made by Mistral AI, as shown in the image, are:
      如图所示,使用 Mistral AI 制作的模型的公司是:

      1. BNP Paribas 法国巴黎银行
      2. Brave 勇敢的
      3. Cloudflare 云耀
      4. CMA CGM 达飞轮船
      5. Front 正面

使用方式:

  • 模型以 Pixtral-large-latest 的形式在 API 中提供,支持即时调用。
  • 也可通过 Mistral AI 官网下载,依据 Mistral 研究许可证(MRL)或商业许可证用于研究或商业用途。

同时 Mistral AI推出了更新版的 Le Chat

支持在聊天中进行搜索、上传 PDF、编程、图像生成等

图像生成功能采用了黑森林实验室的 FLUX1.1 pro 模型,可以免费生成图像。

同时推出类似ChatGPT的 Canvas 画布功能

支持用户在画布中与AI协作,创建文档、代码、设计、演示文稿等内容。

允许实时修改内容,预览版本并导出。

Mistral AI推出了更新版的Le Chat 支持在聊天中进行搜索、上传 PDF、编程、图像生成等

技术报告:https://arxiv.org/abs/2410.07073

API:https://docs.mistral.ai/api/

下载:https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411

在线体验:https://chat.mistral.ai/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
615
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

CAT3D:1分钟从任意数量的图像生成一致的高质量3D新视图

CAT3D:1分钟从任意数量的图像生成一致的高质量3D新视图

201 VIEWS
2024年5月18日
Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气

Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气

746 VIEWS
2024年9月30日
Playground v3 技术报告 :完全整合了大语言模型的图像生成模型 精细的图像生成与控制能力

Playground v3 技术报告 :完全整合了大语言模型的图像生成模型 精细的图像生成与控制能力

395 VIEWS
2024年9月23日
全球首款集成GPT-4o 的智能眼镜发布 支持视觉能力和实时问答

全球首款集成GPT-4o 的智能眼镜发布 支持视觉能力和实时问答

1.3k VIEWS
2024年6月30日
18 节课教授你开始构建人工智能应用程序所需的一切知识

18 节课教授你开始构建人工智能应用程序所需的一切知识

277 VIEWS
2024年4月3日
Prompt 学习地图 26 | 理论&实践 – Emotional Prompt 情感刺激

Prompt 学习地图 26 | 理论&实践 – Emotional Prompt 情感刺激

346 VIEWS
2024年5月3日
教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

教程:如何使用 FreePik 和 Luma 制作出令人惊叹的产品动画展示图像

283 VIEWS
2024年7月24日
Florence-2:微软全新开源视觉模型 能够执行超过10种不同的视觉任务

Florence-2:微软全新开源视觉模型 能够执行超过10种不同的视觉任务

447 VIEWS
2024年6月21日
RAGApp:无需编写代码,轻松构建企业级RAG聊天机器人

RAGApp:无需编写代码,轻松构建企业级RAG聊天机器人

289 VIEWS
2024年5月25日
Sailor:是一套为东南亚国家量身定制的语言模型

Sailor:是一套为东南亚国家量身定制的语言模型

101 VIEWS
2024年3月2日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版