Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供

by 小互
2024年3月29日
in XiaoHu.AI日报
0 0
0
X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供
0
SHARES
33
VIEWS
Share on FacebookShare on Twitter
X.AI 宣布推出了:Grok-1.5 模型,具备长文本理解和高级推理能力。它将在未来几天内向早期测试者和现有Grok用户开放。Grok-1.5相较于之前版本在编程和数学相关任务上表现出显著的进步,其在MATH基准测试中得分为50.6%,在GSM8K基准测试中得分为90%,这两个测试覆盖了从小学到高中竞赛问题的广泛范围。此外,它在HumanEval基准测试中得分为74.1%,后者评估代码生成和问题解决能力。
 
128k 上下文长度
 
即将在𝕏上进行提供
  • Grok-1.5在MATH基准测试中取得了50.6%的成绩,比上一代提高一倍,逼近GPT 4等模型。
  • HumanEval基准测试:得分74.1%,由于除Claude 3 Opus的所有模型。
  • 在GSM8K基准测试中取得了90%的成绩,优于 Mistral Large、Claude 2。
  • MMLU测试中:取得了81.3%的成绩,这表明模型在理解广泛的语言任务方面能力增强。
  • Grok-1.5展现了强大的文本内嵌检索能力,能够在高达128K标记长度的文本中实现完美检索。
Grok-1.5建立在一个基于JAX、Rust和Kubernetes的自定义分布式训练框架之上,提供了强大的灵活性和可扩展性。
  • 自定义分布式训练框架:Grok-1.5使用了一套特别设计的系统,允许模型在多个计算节点上同时训练,这有助于处理更大的数据集,提高训练速度和效率。

  • 灵活性和可扩展性:使用这些技术的组合,Grok-1.5的训练框架能够适应不同的训练需求和规模,能够随着需要轻松地增加或减少资源。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Humanify: 一个Blender插件 一键生成高度逼真的人类模型

Humanify: 一个Blender插件 一键生成高度逼真的人类模型

333 VIEWS
2024年4月25日
X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术

X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术

612 VIEWS
2024年11月7日
Mem0:为大语言模型提供永久记忆能力  实现跨应用程序的个性化AI体验

Mem0:为大语言模型提供永久记忆能力 实现跨应用程序的个性化AI体验

447 VIEWS
2024年7月22日
LLaVA++ : 赋予Phi-3 和 Llama-3 视觉能力

LLaVA++ : 赋予Phi-3 和 Llama-3 视觉能力

232 VIEWS
2024年4月27日
PIXART-Σ:利用Diffusion Transformer(DiT)直接生成4K分辨率图像

PIXART-Σ:利用Diffusion Transformer(DiT)直接生成4K分辨率图像

24 VIEWS
2024年3月11日
教程:借助伪代码让 ChatGPT 一次生成一套绘本图像

教程:借助伪代码让 ChatGPT 一次生成一套绘本图像

776 VIEWS
2024年6月16日
ElevenLabs 推出音乐生成模型 ElevenLabs Music 可直接通过文本提示生成完整音乐

ElevenLabs 推出音乐生成模型 ElevenLabs Music 可直接通过文本提示生成完整音乐

396 VIEWS
2024年5月10日
v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码

v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码

605 VIEWS
2024年8月21日
Gemini 推出了专门提升学生的学习体验新功能 5 种帮助学生更聪明地学习的方法

Gemini 推出了专门提升学生的学习体验新功能 5 种帮助学生更聪明地学习的方法

233 VIEWS
2024年8月30日
𝕏/Twitter 算法解析 如何提高自己的粉丝和帖子的曝光量

𝕏/Twitter 算法解析 如何提高自己的粉丝和帖子的曝光量

138 VIEWS
2024年7月8日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版