Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供

by 小互
2024年3月29日
in XiaoHu.AI日报
0 0
0
X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供
0
SHARES
33
VIEWS
Share on FacebookShare on Twitter
X.AI 宣布推出了:Grok-1.5 模型,具备长文本理解和高级推理能力。它将在未来几天内向早期测试者和现有Grok用户开放。Grok-1.5相较于之前版本在编程和数学相关任务上表现出显著的进步,其在MATH基准测试中得分为50.6%,在GSM8K基准测试中得分为90%,这两个测试覆盖了从小学到高中竞赛问题的广泛范围。此外,它在HumanEval基准测试中得分为74.1%,后者评估代码生成和问题解决能力。
 
128k 上下文长度
 
即将在𝕏上进行提供
  • Grok-1.5在MATH基准测试中取得了50.6%的成绩,比上一代提高一倍,逼近GPT 4等模型。
  • HumanEval基准测试:得分74.1%,由于除Claude 3 Opus的所有模型。
  • 在GSM8K基准测试中取得了90%的成绩,优于 Mistral Large、Claude 2。
  • MMLU测试中:取得了81.3%的成绩,这表明模型在理解广泛的语言任务方面能力增强。
  • Grok-1.5展现了强大的文本内嵌检索能力,能够在高达128K标记长度的文本中实现完美检索。
Grok-1.5建立在一个基于JAX、Rust和Kubernetes的自定义分布式训练框架之上,提供了强大的灵活性和可扩展性。
  • 自定义分布式训练框架:Grok-1.5使用了一套特别设计的系统,允许模型在多个计算节点上同时训练,这有助于处理更大的数据集,提高训练速度和效率。

  • 灵活性和可扩展性:使用这些技术的组合,Grok-1.5的训练框架能够适应不同的训练需求和规模,能够随着需要轻松地增加或减少资源。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
494
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
346
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
460
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
284
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
636
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
435

Recommendeds

Rewind推出可穿戴AI设备:Limitless吊坠 续航100小时 记录你整天内容

Rewind推出可穿戴AI设备:Limitless吊坠 续航100小时 记录你整天内容

433 VIEWS
2024年4月16日
Anthropic 的研究人员发现了打开AI模型“黑盒子”的方法

Anthropic 的研究人员发现了打开AI模型“黑盒子”的方法

337 VIEWS
2024年5月22日
Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备

Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备

50 VIEWS
2024年3月11日
Musashi:东京大学开发并训练了一款可以自己开车的机器人

Musashi:东京大学开发并训练了一款可以自己开车的机器人

154 VIEWS
2024年6月13日
斯坦福大学人工智能研究院发布《2024 年人工智能指数报告》

斯坦福大学人工智能研究院发布《2024 年人工智能指数报告》

547 VIEWS
2024年4月16日
Alchemist:能够在真实图像中随意改变物体的材料属性(粗糙度、金属度、透明度)

Alchemist:能够在真实图像中随意改变物体的材料属性(粗糙度、金属度、透明度)

232 VIEWS
2024年7月29日
Mistral 发布了2个7B小模型: Codestral Mamba 7B 和 Mathstral 7B 

Mistral 发布了2个7B小模型: Codestral Mamba 7B 和 Mathstral 7B 

347 VIEWS
2024年7月17日
StreamingT2V:根据文字提示生成连贯且可扩展的长达2分钟的视频

StreamingT2V:根据文字提示生成连贯且可扩展的长达2分钟的视频

130 VIEWS
2024年3月25日
Meta AI 发布 Llama 3.2 多模态AI模型 性能与GPT4o-mini 相当 能够在边缘设备上高效运行

Meta AI 发布 Llama 3.2 多模态AI模型 性能与GPT4o-mini 相当 能够在边缘设备上高效运行

340 VIEWS
2024年9月26日
BinaryVectorDB: 二进制向量数据库 速度提高20倍 成本降低100倍

BinaryVectorDB: 二进制向量数据库 速度提高20倍 成本降低100倍

47 VIEWS
2024年3月30日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版