Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Mixtral 8X22B:更便宜、更好、更快 更强的数学和编码能力

by 小互
2024年4月19日
in XiaoHu.AI日报
0 0
0
Mixtral 8X22B:更便宜、更好、更快 更强的数学和编码能力
0
SHARES
146
VIEWS
Share on FacebookShare on Twitter

Mixtral 发布了 Mixtral 8X22B,它采用了稀疏混合专家(Sparse Mixture-of-Experts, SMoE)的架构。这种架构允许模型在运行时只激活部分参数,从而在维持高性能的同时大幅度提升了成本效率。具体来说,Mixtral 8x22B 的总参数量为141B,但实际运行时仅激活39B参数。

这种架构的主要优势:

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
338
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
450
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
279
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
617
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
429

Recommendeds

DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

180 VIEWS
2024年8月29日
Google:为特定领域专门化大语言模型的三步设计模式

Google:为特定领域专门化大语言模型的三步设计模式

307 VIEWS
2024年4月1日
PDF Guru Anki:一款以PDF为中心的多功能办公学习工具箱 十分强大

PDF Guru Anki:一款以PDF为中心的多功能办公学习工具箱 十分强大

370 VIEWS
2024年8月6日
快手发布“可灵”视频大模型  类似Sora技术路线 能生成超过120秒 1080P视频

快手发布“可灵”视频大模型 类似Sora技术路线 能生成超过120秒 1080P视频

1.4k VIEWS
2024年6月8日
HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

408 VIEWS
2024年11月13日
MagicQuill:AI 驱动的图像编辑系统 只需在图像上画几笔即可轻松编辑图像

MagicQuill:AI 驱动的图像编辑系统 只需在图像上画几笔即可轻松编辑图像

189 VIEWS
2024年11月23日
阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型

阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型

207 VIEWS
2024年9月20日
18 节课教授你开始构建人工智能应用程序所需的一切知识

18 节课教授你开始构建人工智能应用程序所需的一切知识

277 VIEWS
2024年4月3日
Gemini Teacher:基于 Gemini 2.0的英语口语练习助手 实时发音纠正和建议

Gemini Teacher:基于 Gemini 2.0的英语口语练习助手 实时发音纠正和建议

601 VIEWS
2024年12月22日
OpenAI发布了全新的 o1 推理模型 工作原理及技术报告详解

OpenAI发布了全新的 o1 推理模型 工作原理及技术报告详解

2.3k VIEWS
2024年9月13日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版