Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快更便宜

by 小互
2024年7月19日
in XiaoHu.AI日报
0 0
0
OpenAI 推出 GPT-4o mini 取代GPT 3.5   性能超越GPT 4  而且更快更便宜
0
SHARES
385
VIEWS
Share on FacebookShare on Twitter

OpenAI推出了GPT-4o mini模型,用来取代GPT-3.5,这是目前市场上最具成本效益的小模型。

该模型在MMLU上得分为82%,在LMSYS排行榜上的聊天偏好测试中表现优于GPT-4。GPT-4o mini的定价为每百万输入标记15美分和每百万输出标记60美分,比之前的前沿模型便宜了一个数量级,比GPT-3.5 Turbo便宜了60%以上。

GPT-4o mini支持文本和视觉输入,未来还将支持图像、视频和音频输入输出。该模型拥有128K标记的上下文窗口,支持每次请求最多16K的输出标记,并且知识覆盖到2023年10月。改进的标记器使处理非英语文本更具成本效益。

GPT-4o mini在文本智能和多模态推理方面超越了GPT-3.5 Turbo和其他小模型,支持多种语言,并在函数调用、数学推理和编码任务上表现出色。

从今天开始,免费用户、Plus 用户和 Team 用户将能够访问 GPT-4o mini,取代 GPT-3.5。企业用户也将在下周开始访问。

GPT-4o mini 评估结果

GPT-4o mini在多个关键基准上进行了评估,显示出在文本智能、多模态推理、数学和编码任务上的强大性能。以下是具体的评估结果:

  1. 文本智能和推理任务:
    • MMLU(文本智能和推理基准):GPT-4o mini得分82.0%,优于Gemini Flash的77.9%和Claude Haiku的73.8%。
  2. 数学和编码任务:
    • MGSM(数学推理):GPT-4o mini得分87.0%,高于Gemini Flash的75.5%和Claude Haiku的71.7%。
    • HumanEval(编码性能):GPT-4o mini得分87.2%,超过Gemini Flash的71.5%和Claude Haiku的75.9%。
  3. 多模态推理任务:
    • MMMU(多模态推理评估):GPT-4o mini得分59.4%,比Gemini Flash的56.1%和Claude Haiku的50.2%更高。

具体评估数据

任务/模型 GPT-4o mini Gemini Flash Claude Haiku GPT-3.5 Turbo
MMLU 82.0% 77.9% 73.8% 69.8%
MGSM 87.0% 75.5% 71.7% 56.3%
HumanEval 87.2% 71.5% 75.9% 68.0%
MMMU 59.4% 56.1% 50.2% –

  • 整体表现:GPT-4o mini在多个评估基准上表现优异,尤其是在文本智能、多模态推理、数学推理和编码任务上,显著优于同类小模型。
  • 性价比:相比之前的模型,GPT-4o mini以更低的成本提供了更强的性能,适合大规模应用。
  • 多模态能力:支持多模态输入(文本和视觉),并计划扩展到更多输入输出形式(图像、视频和音频),使其在广泛应用中具有更高的灵活性。

GPT-4o mini 成本情况

GPT-4o mini以其显著的成本效益为特色,价格大幅低于之前的模型,使得开发和运行AI应用变得更加经济高效。以下是详细的成本情况:

  1. 输入标记成本:
    • 每百万输入标记(tokens)15美分(大约相当于标准书籍中的 2500 页)。
    • 这是之前前沿模型成本的一个数量级的降低。
  2. 输出标记成本:
    • 每百万输出标记60美分。
    • 相比GPT-3.5 Turbo,成本降低了60%以上。
  3. 性价比优势
    • 大幅降价:GPT-4o mini的价格相比以前的模型,尤其是GPT-3.5 Turbo,具有显著的成本优势,使得AI应用的开发和运行更加负担得起。
    • 适用于大规模应用:低成本使得在大规模应用中,特别是需要大量上下文输入和快速实时响应的应用,如客户支持聊天机器人等,更具吸引力。
    • 高效能:尽管成本降低,GPT-4o mini仍然在多个评估基准上表现优异,提供了高性能的AI解决方案。

原文:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
615
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Hebbia获得近1亿美元B轮融资  利用AI一次可以处理多达数百万份文档

Hebbia获得近1亿美元B轮融资 利用AI一次可以处理多达数百万份文档

294 VIEWS
2024年7月28日
Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文

Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文

168 VIEWS
2024年8月30日
ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

461 VIEWS
2024年10月23日
Hume AI发布情感感知对话AI:EVI 能理解用户的情感状态和意图

Hume AI发布情感感知对话AI:EVI 能理解用户的情感状态和意图

95 VIEWS
2024年3月28日
Sanctuary AI发布其第七代机器人 更接近人类 24小时之内就能学会新任务

Sanctuary AI发布其第七代机器人 更接近人类 24小时之内就能学会新任务

220 VIEWS
2024年4月27日
PhysDreamer:够识别和理解3D对象的物理材质属性并生成真实物理动态

PhysDreamer:够识别和理解3D对象的物理材质属性并生成真实物理动态

123 VIEWS
2024年4月28日
Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具

Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具

594 VIEWS
2024年8月16日
加拿大国防部和加拿大武装部队发布人工智能战略 加速AI战斗部署

加拿大国防部和加拿大武装部队发布人工智能战略 加速AI战斗部署

18 VIEWS
2024年3月11日
Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达

Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达

471 VIEWS
2024年9月23日
Perplexity 联合创始人兼产品主管 揭秘该公司借助AI形成的独特产品开发方法

Perplexity 联合创始人兼产品主管 揭秘该公司借助AI形成的独特产品开发方法

448 VIEWS
2024年7月27日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版