Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

通义千问发布Qwen1.5-110B 首款超1000亿参数模型

by 小互
2024年4月27日
in XiaoHu.AI日报
0 0
0
通义千问发布Qwen1.5-110B 首款超1000亿参数模型
0
SHARES
183
VIEWS
Share on FacebookShare on Twitter

通义千问发布Qwen1.5-110B 首款超1000亿参数模型, Qwen1.5-110B是Qwen1.5系列中的新成员,也是该系列首个拥有超过1000亿参数的模型。

该模型在基础模型评估中表现出色,与Meta-Llama3-70B相媲美,并在聊天模型评估(包括MT-Bench和AlpacaEval 2.0)中表现出色。 模型支持多语言,包括英语、中文、法语、西班牙语等,上下文长度可达32K令牌。

模型特性

  • 架构:与其他 Qwen1.5 模型相似,采用 Transformer 解码器架构。
  • 独特技术:引入了分组查询注意力(GQA),提高模型服务效率。
  • 支持语言:模型仍是多语言的,支持包括英语、中文、法语、西班牙语、德语、俄语、韩语、日语、越南语、阿拉伯语等多种语言。
  • 上下文长度:支持32K 令牌的上下文长度。

模型质量 Qwen1.5-110B 在基础语言模型的一系列评估中表现突出,与 Meta-Llama3-70B 和其他 SOTA 语言模型(如 Mixtral-8x22B)相比,展现了至少具有竞争力的基础能力。此外,模型的尺寸增加是相对于72B模型性能提升的主要原因。

聊天模型评估 在 MT-Bench 和 AlpacaEval 2.0 的聊天模型基准测试中,110B 模型相较于先前发布的 72B 模型有显著改进,持续的评估提升表明,更强大、更大的基础语言模型可以在不过多改变训练后配方的情况下,带来更好的聊天模型。

Qwen1.5是Qwen2的测试版,是一个基于Transformer架构的仅解码器语言模型,预训练在大量数据上。与之前的Qwen模型相比,改进包括:

  • 9种模型大小:0.5B、1.8B、4B、7B、14B、32B、72B和110B密集型模型,以及一个14B的MoE模型,激活了2.7B参数;
  • 聊天模型的显著性能提升;
  • 基础模型和聊天模型都支持多语言;
  • 所有大小的模型均稳定支持32K的上下文长度;
  • 无需信任远程代码。

详细介绍:https://qwenlm.github.io/zh/blog/qwen1.5-110b/

模型下载:https://huggingface.co/Qwen/Qwen1.5-110B

在线体验:https://huggingface.co/spaces/Qwen/Qwen1.5-110B-Chat-demo

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Cursor Directory:各种编程语言的Cursor 配置文件和提示词库

Cursor Directory:各种编程语言的Cursor 配置文件和提示词库

892 VIEWS
2024年8月26日
Molmo 一个完全开源的多模态模型 支持2D指向交互 性能仅次于GPT-4o

Molmo 一个完全开源的多模态模型 支持2D指向交互 性能仅次于GPT-4o

341 VIEWS
2024年9月26日
OpenAI 发布带有视觉能力的GPT-4-Turbo 128k上下文

OpenAI 发布带有视觉能力的GPT-4-Turbo 128k上下文

148 VIEWS
2024年4月10日
使用AI工具创建完整漫画教程 包括保持角色一致和文字添加

使用AI工具创建完整漫画教程 包括保持角色一致和文字添加

424 VIEWS
2024年5月21日
Midjourney 角色人物一致性功能上线 复杂文本理解能力提升

Midjourney 角色人物一致性功能上线 复杂文本理解能力提升

33 VIEWS
2024年3月12日
一种革命性的开源系统 现在你可以在家训练一个70B的大语言模型了

一种革命性的开源系统 现在你可以在家训练一个70B的大语言模型了

42 VIEWS
2024年3月11日
Reimagine AI:实时滚动生成无限个结果的图像生成工具

Reimagine AI:实时滚动生成无限个结果的图像生成工具

78 VIEWS
2024年3月22日
VLOGGER:基于文本和音频驱动,从单张照片生成会说话的人类视频

VLOGGER:基于文本和音频驱动,从单张照片生成会说话的人类视频

119 VIEWS
2024年3月14日
2024年哈佛大学CS50x计算机科学课程详解

2024年哈佛大学CS50x计算机科学课程详解

167 VIEWS
2024年3月11日
OpenAI官方提示指南 获得更好结果的六种策略

OpenAI官方提示指南 获得更好结果的六种策略

218 VIEWS
2024年3月19日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版