Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快更便宜

by 小互
2024年7月19日
in XiaoHu.AI日报
0 0
0
OpenAI 推出 GPT-4o mini 取代GPT 3.5   性能超越GPT 4  而且更快更便宜
0
SHARES
385
VIEWS
Share on FacebookShare on Twitter

OpenAI推出了GPT-4o mini模型,用来取代GPT-3.5,这是目前市场上最具成本效益的小模型。

该模型在MMLU上得分为82%,在LMSYS排行榜上的聊天偏好测试中表现优于GPT-4。GPT-4o mini的定价为每百万输入标记15美分和每百万输出标记60美分,比之前的前沿模型便宜了一个数量级,比GPT-3.5 Turbo便宜了60%以上。

GPT-4o mini支持文本和视觉输入,未来还将支持图像、视频和音频输入输出。该模型拥有128K标记的上下文窗口,支持每次请求最多16K的输出标记,并且知识覆盖到2023年10月。改进的标记器使处理非英语文本更具成本效益。

GPT-4o mini在文本智能和多模态推理方面超越了GPT-3.5 Turbo和其他小模型,支持多种语言,并在函数调用、数学推理和编码任务上表现出色。

从今天开始,免费用户、Plus 用户和 Team 用户将能够访问 GPT-4o mini,取代 GPT-3.5。企业用户也将在下周开始访问。

GPT-4o mini 评估结果

GPT-4o mini在多个关键基准上进行了评估,显示出在文本智能、多模态推理、数学和编码任务上的强大性能。以下是具体的评估结果:

  1. 文本智能和推理任务:
    • MMLU(文本智能和推理基准):GPT-4o mini得分82.0%,优于Gemini Flash的77.9%和Claude Haiku的73.8%。
  2. 数学和编码任务:
    • MGSM(数学推理):GPT-4o mini得分87.0%,高于Gemini Flash的75.5%和Claude Haiku的71.7%。
    • HumanEval(编码性能):GPT-4o mini得分87.2%,超过Gemini Flash的71.5%和Claude Haiku的75.9%。
  3. 多模态推理任务:
    • MMMU(多模态推理评估):GPT-4o mini得分59.4%,比Gemini Flash的56.1%和Claude Haiku的50.2%更高。

具体评估数据

任务/模型 GPT-4o mini Gemini Flash Claude Haiku GPT-3.5 Turbo
MMLU 82.0% 77.9% 73.8% 69.8%
MGSM 87.0% 75.5% 71.7% 56.3%
HumanEval 87.2% 71.5% 75.9% 68.0%
MMMU 59.4% 56.1% 50.2% –

  • 整体表现:GPT-4o mini在多个评估基准上表现优异,尤其是在文本智能、多模态推理、数学推理和编码任务上,显著优于同类小模型。
  • 性价比:相比之前的模型,GPT-4o mini以更低的成本提供了更强的性能,适合大规模应用。
  • 多模态能力:支持多模态输入(文本和视觉),并计划扩展到更多输入输出形式(图像、视频和音频),使其在广泛应用中具有更高的灵活性。

GPT-4o mini 成本情况

GPT-4o mini以其显著的成本效益为特色,价格大幅低于之前的模型,使得开发和运行AI应用变得更加经济高效。以下是详细的成本情况:

  1. 输入标记成本:
    • 每百万输入标记(tokens)15美分(大约相当于标准书籍中的 2500 页)。
    • 这是之前前沿模型成本的一个数量级的降低。
  2. 输出标记成本:
    • 每百万输出标记60美分。
    • 相比GPT-3.5 Turbo,成本降低了60%以上。
  3. 性价比优势
    • 大幅降价:GPT-4o mini的价格相比以前的模型,尤其是GPT-3.5 Turbo,具有显著的成本优势,使得AI应用的开发和运行更加负担得起。
    • 适用于大规模应用:低成本使得在大规模应用中,特别是需要大量上下文输入和快速实时响应的应用,如客户支持聊天机器人等,更具吸引力。
    • 高效能:尽管成本降低,GPT-4o mini仍然在多个评估基准上表现优异,提供了高性能的AI解决方案。

原文:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Amazon Q:为企业和开发人员提供支持的生成式 AI 助手

Amazon Q:为企业和开发人员提供支持的生成式 AI 助手

140 VIEWS
2024年5月2日
Nvidia 的下一代 DLSS 技术 利用人工智能直接生成游戏中角色、物体甚至是NPC

Nvidia 的下一代 DLSS 技术 利用人工智能直接生成游戏中角色、物体甚至是NPC

112 VIEWS
2024年6月24日
OpenAI 分享了内部员工如何使用 ChatGPT 企业版高效分析数据和发现洞察的实际案例

OpenAI 分享了内部员工如何使用 ChatGPT 企业版高效分析数据和发现洞察的实际案例

309 VIEWS
2024年8月12日
OpenAI 发布 GPT-4o全能模型 实时语音和视觉能力 再次刷新业界

OpenAI 发布 GPT-4o全能模型 实时语音和视觉能力 再次刷新业界

2.7k VIEWS
2024年5月14日
德克萨斯大学开发出可拉伸的电子皮肤 可以赋予机器人人类级触感灵敏度

德克萨斯大学开发出可拉伸的电子皮肤 可以赋予机器人人类级触感灵敏度

145 VIEWS
2024年5月8日
MathGPTPro:数学问题 AI 解决工具 提供实时互动学习体验

MathGPTPro:数学问题 AI 解决工具 提供实时互动学习体验

1k VIEWS
2024年7月31日
Krea AI推出一款结合关键帧和文本提示的视频生成工具 Krea Video

Krea AI推出一款结合关键帧和文本提示的视频生成工具 Krea Video

663 VIEWS
2024年5月9日
NotebookLlama:Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程

NotebookLlama:Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程

266 VIEWS
2024年10月28日
TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

271 VIEWS
2024年10月8日
Puter:一个高级的开源浏览器内桌面环境

Puter:一个高级的开源浏览器内桌面环境

41 VIEWS
2024年3月5日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版