Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mistral AI 发布了全新的 Pixtral Large 开源模型 超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet

by 小互
2024年11月19日
in XiaoHu.AI日报
0 0
0
Mistral AI 发布了全新的 Pixtral Large 开源模型 超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet
0
SHARES
232
VIEWS
Share on FacebookShare on Twitter

Mistral AI 发布了全新的 Pixtral Large 模型,这是一款具备多模态能力的开源模型,基于 Mistral Large 2 构建,参数量达到 1240 亿,并进一步扩展了图像与文本理解能力。

  • 多模态能力:配备 123B 参数解码器 和 1B 参数视觉编码器,在文本处理能力基础上显著提升了视觉处理性能。
  • 超大上下文窗口:支持 128K Token,可同时处理多达 30 张高分辨率图像或复杂长文档。
  • 文档解析、图像理解、图表分析。
  • 能够处理 OCR(光学字符识别)、表格、公式和图形等多种输入格式。

主要性能表现

  1. MathVista(数学推理任务):
    • 该模型在视觉数据的数学推理方面取得 69.4% 准确率,领先于目前市面上所有同类模型。
  2. 文档与图表问答能力(DocVQA 和 ChartQA):
    • 在复杂文档和图表推理中,Pixtral Large 凭借强大的视觉理解能力超越 GPT-4o 和 Gemini-1.5 Pro。
  3. MM-MT-Bench(多模态综合评估):
    • 这是一个开放源代码的评估框架,模拟真实世界应用场景,Pixtral Large 在其中全面领先 Claude-3.5 Sonnet、GPT-4o 等最新模型。

      • 在图表、文档和图像处理能力上超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet。
      • 更大的上下文窗口(128K Token)和强大的视觉编码器,使其能够处理更复杂的多模态任务。

      综合能力

      • 文本处理与视觉处理能力均达行业顶级。
      • 适合复杂场景的语义推理、多模态问答和自动化任务。

应用示例

  1. 多语言 OCR 与推理:
    • 提示:我买了咖啡和香肠,加上 18% 的小费后我需要支付多少?
    • 输出:模型能够清晰计算物品费用、小费金额和最终支付总额。

      Prompt: :

      I bought the coffee and the sausage. How much do I owe? Add a 18% tip.
      我买了咖啡和香肠。我得付多少钱?添加 18% 的小费。

      Response: 回复:

      To calculate the total amount you owe, including the 18% tip, follow these steps:
      要计算您所欠的总金额(包括 18% 小费),请按照以下步骤操作:

      1. Calculate the cost of the coffee and the sausage:
        计算咖啡和香肠的成本:

        • 2x Latte Macchiato: 2 * 4.50 CHF = 9.00 CHF
          2 杯拿铁玛奇朵:2 * 4.50 瑞士法郎 = 9.00 瑞士法郎
        • 1x Schweinschnitzel: 22.00 CHF
          1x 炸猪排:22.00 瑞士法郎
        • Total cost for coffee and sausage: 9.00 CHF + 22.00 CHF = 31.00 CHF
          咖啡和香肠的总成本:9.00 瑞士法郎 + 22.00 瑞士法郎 = 31.00 瑞士法郎
      2. Calculate the 18% tip: 计算 18% 小费:

        • Tip: 31.00 CHF * 0.18 = 5.58 CHF
          小费:31.00 瑞士法郎 * 0.18 = 5.58 瑞士法郎
      3. Add the tip to the total cost:
        将小费添加到总成本中:

        • Total amount owed: 31.00 CHF + 5.58 CHF = 36.58 CHF
          欠款总额:31.00 瑞士法郎 + 5.58 瑞士法郎 = 36.58 瑞士法郎

      So, you owe a total of 36.58 CHF.
      因此,您总共欠 36.58 瑞士法郎。

  2. 图表分析:
    • 提示:Dark Dragon 模型在什么时候开始表现不稳定?
    • 输出:分析模型训练时损失值的波动,准确指出模型问题发生的步骤。

      Prompt: :

      When did things start to go wrong for dark dragon?
      黑龙什么时候开始出问题的?

      Response: 回复:

      The training loss for the “dark-dragon-50” model starts to exhibit significant instability around the 10,000 steps mark. There is a noticeable spike in the loss value at this point, and the instability continues with another major spike around the 20,000 steps mark. These spikes indicate that the training process for the “dark-dragon-50” model began to encounter issues starting around the 10,000 steps mark.
      “dark-dragon-50”模型的训练损失在 10,000 步标记附近开始表现出明显的不稳定。此时损失值出现明显的峰值,并且不稳定状态仍在继续,在 20,000 步大关附近出现另一个峰值。这些峰值表明“dark-dragon-50”模型的训练过程从 10,000 步大关开始就开始遇到问题。

  3. 企业支持场景:
    • 在知识探索与共享、文档语义理解、任务自动化以及改善客户体验等企业级场景中,Pixtral Large 展现了显著能力。

      Prompt: :

      Which companies use models made by Mistral AI?
      哪些公司使用 Mistral AI 制作的模型?

      Response: 回复:

      The companies that use models made by Mistral AI, as shown in the image, are:
      如图所示,使用 Mistral AI 制作的模型的公司是:

      1. BNP Paribas 法国巴黎银行
      2. Brave 勇敢的
      3. Cloudflare 云耀
      4. CMA CGM 达飞轮船
      5. Front 正面

使用方式:

  • 模型以 Pixtral-large-latest 的形式在 API 中提供,支持即时调用。
  • 也可通过 Mistral AI 官网下载,依据 Mistral 研究许可证(MRL)或商业许可证用于研究或商业用途。

同时 Mistral AI推出了更新版的 Le Chat

支持在聊天中进行搜索、上传 PDF、编程、图像生成等

图像生成功能采用了黑森林实验室的 FLUX1.1 pro 模型,可以免费生成图像。

同时推出类似ChatGPT的 Canvas 画布功能

支持用户在画布中与AI协作,创建文档、代码、设计、演示文稿等内容。

允许实时修改内容,预览版本并导出。

Mistral AI推出了更新版的Le Chat 支持在聊天中进行搜索、上传 PDF、编程、图像生成等

技术报告:https://arxiv.org/abs/2410.07073

API:https://docs.mistral.ai/api/

下载:https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411

在线体验:https://chat.mistral.ai/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
478
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
332
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
444
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
277
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
608
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
423

Recommendeds

清华大学设计出用于通用人工智能光子芯片:太极芯片

清华大学设计出用于通用人工智能光子芯片:太极芯片

282 VIEWS
2024年4月15日
一站式AI最新研究更新、面试资源、免费课程等综合库

一站式AI最新研究更新、面试资源、免费课程等综合库

165 VIEWS
2024年3月28日
Imagine Flash:加速Emu扩散模型 提高生成图像的速度和质量

Imagine Flash:加速Emu扩散模型 提高生成图像的速度和质量

158 VIEWS
2024年4月19日
RAGApp:无需编写代码,轻松构建企业级RAG聊天机器人

RAGApp:无需编写代码,轻松构建企业级RAG聊天机器人

289 VIEWS
2024年5月25日
苹果发布 Ferret-UI 2 专门理解和与移动用户界面交互的模型 让手机成为通用UI助手

苹果发布 Ferret-UI 2 专门理解和与移动用户界面交互的模型 让手机成为通用UI助手

309 VIEWS
2024年11月4日
Nvidia 的下一代 DLSS 技术 利用人工智能直接生成游戏中角色、物体甚至是NPC

Nvidia 的下一代 DLSS 技术 利用人工智能直接生成游戏中角色、物体甚至是NPC

112 VIEWS
2024年6月24日
字节跳动 Seed-ASR:自动语音识别模型 可识别不同语言、方言、口音

字节跳动 Seed-ASR:自动语音识别模型 可识别不同语言、方言、口音

523 VIEWS
2024年8月20日
01.AI发布新一代开源模型:Yi-9B 专为中英双语场景优化

01.AI发布新一代开源模型:Yi-9B 专为中英双语场景优化

31 VIEWS
2024年3月6日
Magic Insert:将一个图像中的人或物体拖放到另一个风格图像中 并实现风格融合

Magic Insert:将一个图像中的人或物体拖放到另一个风格图像中 并实现风格融合

210 VIEWS
2024年7月15日
将 Gemma 2B 的上下文窗口扩展到 1000万的技术方法

将 Gemma 2B 的上下文窗口扩展到 1000万的技术方法

132 VIEWS
2024年5月10日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版