Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务

by 小互
2024年9月12日
in XiaoHu.AI日报
0 0
0
Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务
0
SHARES
55
VIEWS
Share on FacebookShare on Twitter

法国 AI 初创公司 Mistral 推出了其首个多模态模型 Pixtral 12B,该模型具有120 亿参数,可以处理图像和文本任务,适用于图像标注、物体计数等任务。与其他多模态模型(如 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o)类似。

Pixtral 12B 基于 Mistral 的文本模型 Nemo 12B 开发,能够通过 URL 或 base64 编码的图像回答与图像相关的问题。理论上可以执行图像字幕生成、物体计数等任务。

  • 图像标注:模型能够根据图片生成简洁而准确的描述。
  • 物体计数:用户可以通过模型快速获得图像中物体的数量。
  • 生成任务:适用于需要图像和文本结合的复杂 AI 任务,如视觉问答、图像生成等。

Pixtral 12B 可以通过 GitHub 和 Hugging Face 下载,支持在 Apache 2.0 许可下进行微调和使用。

Mistral 开发者关系负责人 Sophia Yang 表示,Pixtral 12B 将很快在 Mistral 的聊天机器人和 API 服务平台 Le Chat 和 Le Plateforme 上提供测试。

Mistral 并没有公布Pixtral 12B的更多信息。Mistral 邀请了一些人员参加了一个峰会会议,其中展示了 Pixtral 12B 的一些基准测试结果。

 

模型下载:

magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%http://2Ftracker.opentrackr.org%3A1337%2Fannounce&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.ipv6tracker.org%3A80%2Fannounce

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

266 VIEWS
2024年9月16日
教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

288 VIEWS
2024年9月10日
Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

124 VIEWS
2024年7月25日
Pipedream:快速连接和集成超过2000多个应用程序

Pipedream:快速连接和集成超过2000多个应用程序

125 VIEWS
2024年3月31日
电影配音工种集体失业 全球第一部由 AI 完全翻译配音的电影即将上映

电影配音工种集体失业 全球第一部由 AI 完全翻译配音的电影即将上映

347 VIEWS
2024年7月18日
苹果 Apple Intelligence 为用户提供详细的隐私报告 供用户查看AI调用情况

苹果 Apple Intelligence 为用户提供详细的隐私报告 供用户查看AI调用情况

144 VIEWS
2024年7月30日
APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用

APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用

309 VIEWS
2024年7月11日
微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

683 VIEWS
2024年12月20日
微软发布 AutoGen Studio:一个无需编写代码即快速构建和设计多代理的系统

微软发布 AutoGen Studio:一个无需编写代码即快速构建和设计多代理的系统

870 VIEWS
2024年9月2日
Video-MME: 首个多模态大模型视频分析综合评估基准

Video-MME: 首个多模态大模型视频分析综合评估基准

849 VIEWS
2024年6月3日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版