Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

通义千问发布Qwen1.5-110B 首款超1000亿参数模型

by 小互
2024年4月27日
in XiaoHu.AI日报
0 0
0
通义千问发布Qwen1.5-110B 首款超1000亿参数模型
0
SHARES
183
VIEWS
Share on FacebookShare on Twitter

通义千问发布Qwen1.5-110B 首款超1000亿参数模型, Qwen1.5-110B是Qwen1.5系列中的新成员,也是该系列首个拥有超过1000亿参数的模型。

该模型在基础模型评估中表现出色,与Meta-Llama3-70B相媲美,并在聊天模型评估(包括MT-Bench和AlpacaEval 2.0)中表现出色。 模型支持多语言,包括英语、中文、法语、西班牙语等,上下文长度可达32K令牌。

模型特性

  • 架构:与其他 Qwen1.5 模型相似,采用 Transformer 解码器架构。
  • 独特技术:引入了分组查询注意力(GQA),提高模型服务效率。
  • 支持语言:模型仍是多语言的,支持包括英语、中文、法语、西班牙语、德语、俄语、韩语、日语、越南语、阿拉伯语等多种语言。
  • 上下文长度:支持32K 令牌的上下文长度。

模型质量 Qwen1.5-110B 在基础语言模型的一系列评估中表现突出,与 Meta-Llama3-70B 和其他 SOTA 语言模型(如 Mixtral-8x22B)相比,展现了至少具有竞争力的基础能力。此外,模型的尺寸增加是相对于72B模型性能提升的主要原因。

聊天模型评估 在 MT-Bench 和 AlpacaEval 2.0 的聊天模型基准测试中,110B 模型相较于先前发布的 72B 模型有显著改进,持续的评估提升表明,更强大、更大的基础语言模型可以在不过多改变训练后配方的情况下,带来更好的聊天模型。

Qwen1.5是Qwen2的测试版,是一个基于Transformer架构的仅解码器语言模型,预训练在大量数据上。与之前的Qwen模型相比,改进包括:

  • 9种模型大小:0.5B、1.8B、4B、7B、14B、32B、72B和110B密集型模型,以及一个14B的MoE模型,激活了2.7B参数;
  • 聊天模型的显著性能提升;
  • 基础模型和聊天模型都支持多语言;
  • 所有大小的模型均稳定支持32K的上下文长度;
  • 无需信任远程代码。

详细介绍:https://qwenlm.github.io/zh/blog/qwen1.5-110b/

模型下载:https://huggingface.co/Qwen/Qwen1.5-110B

在线体验:https://huggingface.co/spaces/Qwen/Qwen1.5-110B-Chat-demo

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
485
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
341
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
454
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
280
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
621
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
431

Recommendeds

乌克兰外交部引入人工智能新闻发言人 即时更新战争信息

乌克兰外交部引入人工智能新闻发言人 即时更新战争信息

137 VIEWS
2024年5月2日
英伟达推出生成式AI专家认证 费用135美元

英伟达推出生成式AI专家认证 费用135美元

57 VIEWS
2024年3月12日
UltraMedical:一个大规模、高质量的生物医学指令数据集

UltraMedical:一个大规模、高质量的生物医学指令数据集

427 VIEWS
2024年6月10日
PicCopilot:产品摄影师的时代结束了 免费创建专业的产品图片

PicCopilot:产品摄影师的时代结束了 免费创建专业的产品图片

323 VIEWS
2024年7月30日
人工智能能否读取你的思想?

人工智能能否读取你的思想?

173 VIEWS
2024年10月7日
Google发布 2024年值得关注的Chrome扩展程序

Google发布 2024年值得关注的Chrome扩展程序

536 VIEWS
2024年12月16日
Concordia :让AI代理能够以更接近人类的方式行动和交流

Concordia :让AI代理能够以更接近人类的方式行动和交流

84 VIEWS
2024年3月1日
g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

266 VIEWS
2024年9月16日
特斯拉正在招聘人员来进行Optimus机器人训练工作 时薪48美金

特斯拉正在招聘人员来进行Optimus机器人训练工作 时薪48美金

247 VIEWS
2024年8月21日
Prompt 学习地图 20 | 概念误区 – 你和模型说的是一回事吗

Prompt 学习地图 20 | 概念误区 – 你和模型说的是一回事吗

259 VIEWS
2024年4月18日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版