Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

一种革命性的开源系统 现在你可以在家训练一个70B的大语言模型了

by 小互
2024年3月11日
in AI 项目
0 0
0
一种革命性的开源系统 现在你可以在家训练一个70B的大语言模型了
0
SHARES
42
VIEWS
Share on FacebookShare on Twitter

Answer.AI发布了一个基于FSDP(Fully Sharded Data Parallel,完全分片数据并行)和QLoRA的开源系统,这个系统首次能够在普通的桌面电脑上高效训练出一个70B(700亿参数)的大语言模型。

这是一种革命性的开源系统,你只需要两个普通游戏显卡(比如RTX 3090或4090)就能训练一个70亿参数的大型语言模型。该项目结合了 Tim Dettmers 的 QLoRA(一种模型训练技术) 和 Meta 的 FSDP(完全分片数据并行技术) 技术,通过量化让模型减小约4倍大小,并通过多GPU分片处理大型模型。这种结合让原本需要大量内存和昂贵硬件支持的巨型模型训练,变得在普通桌面电脑上就可以完成。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
338
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
450
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
279
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
617
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
429

Recommendeds

环球音乐与 AI音乐初创公司 SoundLabs合作 将为歌手定制自己语音克隆模型

环球音乐与 AI音乐初创公司 SoundLabs合作 将为歌手定制自己语音克隆模型

182 VIEWS
2024年7月28日
Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

124 VIEWS
2024年7月25日
Recraft发布其最新图像生成模型:Recraft V3 可精确处理复杂长文本和手指等解剖学细节

Recraft发布其最新图像生成模型:Recraft V3 可精确处理复杂长文本和手指等解剖学细节

211 VIEWS
2024年11月4日
DisTrO:用你的家用电脑完成的去中心化人工智能训练

DisTrO:用你的家用电脑完成的去中心化人工智能训练

119 VIEWS
2024年9月3日
OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好  链式思维提示可能适得其反

OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反

607 VIEWS
2024年9月13日
Adobe 将推出新的生成式 AI 视频模型  Firefly Video Model 集成到其视频工具中

Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中

180 VIEWS
2024年9月12日
MagicClothing:根据文本提示定制生成穿着特定服装的人物图像

MagicClothing:根据文本提示定制生成穿着特定服装的人物图像

294 VIEWS
2024年4月17日
Stripe 推出 Stripe Agent Toolkit:让 AI 代理能自动进行支付 帮你购物、订机票等

Stripe 推出 Stripe Agent Toolkit:让 AI 代理能自动进行支付 帮你购物、订机票等

225 VIEWS
2024年11月20日
STORM:利用LLMs自动化生成像维基百科一样的深度长篇内容

STORM:利用LLMs自动化生成像维基百科一样的深度长篇内容

396 VIEWS
2024年4月29日
ReadKidz:利用AI一键生成儿童绘本故事书和多媒体故事 可随心定制设定

ReadKidz:利用AI一键生成儿童绘本故事书和多媒体故事 可随心定制设定

1.5k VIEWS
2024年11月6日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版