Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务

by 小互
2024年9月12日
in XiaoHu.AI日报
0 0
0
Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务
0
SHARES
55
VIEWS
Share on FacebookShare on Twitter

法国 AI 初创公司 Mistral 推出了其首个多模态模型 Pixtral 12B,该模型具有120 亿参数,可以处理图像和文本任务,适用于图像标注、物体计数等任务。与其他多模态模型(如 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o)类似。

Pixtral 12B 基于 Mistral 的文本模型 Nemo 12B 开发,能够通过 URL 或 base64 编码的图像回答与图像相关的问题。理论上可以执行图像字幕生成、物体计数等任务。

  • 图像标注:模型能够根据图片生成简洁而准确的描述。
  • 物体计数:用户可以通过模型快速获得图像中物体的数量。
  • 生成任务:适用于需要图像和文本结合的复杂 AI 任务,如视觉问答、图像生成等。

Pixtral 12B 可以通过 GitHub 和 Hugging Face 下载,支持在 Apache 2.0 许可下进行微调和使用。

Mistral 开发者关系负责人 Sophia Yang 表示,Pixtral 12B 将很快在 Mistral 的聊天机器人和 API 服务平台 Le Chat 和 Le Plateforme 上提供测试。

Mistral 并没有公布Pixtral 12B的更多信息。Mistral 邀请了一些人员参加了一个峰会会议,其中展示了 Pixtral 12B 的一些基准测试结果。

 

模型下载:

magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%http://2Ftracker.opentrackr.org%3A1337%2Fannounce&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.ipv6tracker.org%3A80%2Fannounce

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

使用AI工具创建完整漫画教程 包括保持角色一致和文字添加

使用AI工具创建完整漫画教程 包括保持角色一致和文字添加

424 VIEWS
2024年5月21日
无需开颅手术 Synchron 将 ChatGPT 整合到其脑机系统中

无需开颅手术 Synchron 将 ChatGPT 整合到其脑机系统中

142 VIEWS
2024年7月31日
Google视频和图像生成模型更新 包括Veo 2、Imagen 3和一个新工具Whisk

Google视频和图像生成模型更新 包括Veo 2、Imagen 3和一个新工具Whisk

363 VIEWS
2024年12月17日
Google推出开源视觉语言模型:PaliGemma 支持图像视频等多种视觉语言任务

Google推出开源视觉语言模型:PaliGemma 支持图像视频等多种视觉语言任务

313 VIEWS
2024年5月16日
AutoBNN:利用组合贝叶斯神经网络进行时间序列概率预测

AutoBNN:利用组合贝叶斯神经网络进行时间序列概率预测

111 VIEWS
2024年4月3日
Midjourney 推出 Personalization 功能 Midjourney会记住你的艺术喜好

Midjourney 推出 Personalization 功能 Midjourney会记住你的艺术喜好

460 VIEWS
2024年6月12日
如何在Midjourney中使用角色权重来掌握角色一致性

如何在Midjourney中使用角色权重来掌握角色一致性

65 VIEWS
2024年3月19日
Comfyui_Object_Migration:一致性换衣模型和工作流 实物衣服 一键穿上

Comfyui_Object_Migration:一致性换衣模型和工作流 实物衣服 一键穿上

775 VIEWS
2024年11月21日
微软宣布将Azure AI 与 GitHub 进行深度整合 大幅简化AI应用开发流程

微软宣布将Azure AI 与 GitHub 进行深度整合 大幅简化AI应用开发流程

222 VIEWS
2024年8月2日
OpenAI 与Harvey合作 为法律专业人士定制训练了一个案例法模型

OpenAI 与Harvey合作 为法律专业人士定制训练了一个案例法模型

398 VIEWS
2024年4月3日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版