Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 资源

Llama3 中文综合资源库 集合了与Llama3 模型相关的各种中文资料

by 小互
2024年5月11日
in AI 资源
0 0
0
Llama3 中文综合资源库 集合了与Llama3 模型相关的各种中文资料
0
SHARES
755
VIEWS
Share on FacebookShare on Twitter

Llama3 中文聊天项目综合资源库,集合了与Llama3 模型相关的各种中文资料,包括微调版本、有趣的权重、训练、推理、评测和部署的教程视频与文档。

  1. 多版本支持与创新:该仓库提供了多个版本的Llama3 模型,包括基于不同技术和偏好的微调版本,如直接中文SFT版、Instruct偏好强化学习版、趣味版等。此外,还有Phi3模型中文资料仓库的链接,和性能超越了8b版本的Llama3。

  2. 部署与使用:项目提供了网页部署的代码和教程,使用户可以轻松地在网页上使用这些模型。部署教程包括如何在Streamlit上部署这些模型进行在线体验。

  3. 训练与推理资源:除了已经提供的模型,仓库还包括多种训练和推理的资源,如训练教程、推理脚本、优质训练数据集的整理等。

  4. 扩展和增强:项目还在计划中包括增加更多的扩展如角色扮演增强模型、长上下文支持等,旨在提升模型的功能和适应更多复杂场景的能力。

可用Chat版模型整理

llama3相关对话版本优质权重整理:(欢迎issue补充)

  • shareAI系列:

    • base预训练 + 直接中文SFT版:

      • 训练数据:https://modelscope.cn/datasets/baicai003/Llama3-Chinese-dataset/summary
      • V1版
        • OpenCSG满速下载:https://opencsg.com/models/shareAI/llama3-Chinese-chat-8b
        • WiseModel满速下载:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b
      • V2版
        • modelscope:https://modelscope.cn/models/baicai003/Llama3-Chinese_v2/summary
    • Instruct + 继续中文SFT版:

      • modelscope模型下载:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary
      • 云服务器镜像在线体验(点击即用,免费 4 小时):https://www.suanyun.cn/console/share?uuid=b1ba51908f8a4bd1af37148765c293ee
    • Instruct + 强化学习中文版:

      • DPO 表情趣味版 (10分钟左右可训练好,对原多语言instruct版最小化性能损伤,实测超过大多中文大量训练版)
        • modelscope下载:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary
        • 偏好学习数据集:DPO-zh-en-emoji
    • Base预训练 + 海量中文优质数据增量预训练:正在进行中

    • 70b 中文版:计划中

  • 下面几个版本因对话模版格式不同暂时不支持网页部署推理,需要用fastchat体验:

    • Base + 中文SFT:https://modelscope.cn/models/zhuangxialie/Llama3_Chinese_Sft/files
    • Base + ORPO:https://modelscope.cn/models/zhuangxialie/Llama3-Chinese-ORPO/summary 偏爱长对话
    • Instruct + DPO:https://www.modelscope.cn/models/zhuangxialie/Llama3-Chinese-DPO/summary 偏爱长对话
  • llama3 Pro(加block版,推荐网友积极在该方案上做更多尝试、探索):

    • linjh1118网友(第一个ORPO偏好对齐 + 扩展2*blocks):https://github.com/linjh1118/Llama3-Chinese-ORPO
  • llama3 Moe增强版:

    • cooper12121-llama3-8x8b-MoE:https://github.com/cooper12121/llama3-8x8b-MoE
  • 长上下文版本:

    • 联通微调版v2 (中文,28k上下文):https://huggingface.co/UnicomLLM/Unichat-llama3-Chinese-8B-28K
    • 262k上下文(英文):https://huggingface.co/gradientai/Llama-3-8B-Instruct-262k
    • 262k上下文(中文):计划中
    • 无限上下文版本:计划中,参考:https://medium.com/neoxia/llm-infini-attention-with-linear-complexity-3209b87a77c3
  • 其他普通中文微调版本:

    • 联通微调版(SFT,网友尝试反馈幻觉多):https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summary
    • Openbuddy微调版(SFT,据说不错):https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary
    • zhichen微调版(ORPO方法,应该是第一个orpo):https://github.com/seanzhang-zhichen/llama3-chinese
    • shenzhi-wang微调版(ORPO方法,说是第一个orpo):https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat
    • Rookie微调版(SFT):https://github.com/Rookie1019/Llama-3-8B-Instruct-Chinese
    • hit-sz klc lab 微调版本:https://github.com/zyg18181818/Llama-3-Chinese
  • 破解安全限制系列(暂时只支持英文):

    • Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B
    • neural-chat:https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b
    • dolphin:https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b
  • v-llama3 多模态图文版:(英文,支持视觉问答)

    • Bunny-Llama-3-8B-V:https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V
    • llava-llama-3-8b:https://huggingface.co/xtuner/llava-llama-3-8b-v1_1
  • agent工具能力增强版:

    • ModelScope Chinese Agent版V1(中文,可根据要求帮你选择工具):https://modelscope.cn/models/swift/Llama3-Chinese-8B-Instruct-Agent-v1/summary
  • 基于EmoLLM心理数据微调的Llama3-8B-Instruct 模型

    • EmoLLM 3.0 在线体验链接
      • EmoLLM Llama3心理咨询室V3.0 https://st-app-center-006861-9746-jlroxvg.openxlab.space/
      • 或者前往OpenXLab EmoLLM3.0-Llama3启动 https://openxlab.org.cn/apps/detail/chg0901/EmoLLM-Llama3-8B-Instruct3.0
    • 模型链接
      • ** OpenXLab ** https://openxlab.org.cn/models/detail/chg0901/EmoLLM-Llama3-8B-Instruct3.0
      • ModelScope https://modelscope.cn/models/chg0901/EmoLLM-Llama3-8B-Instruct3.0/summary
  • 小说、网文、故事撰写任务增强版:计划中

  • 音乐生成任务版:计划中

  • 猫娘扮演版:计划中

  • 涩涩版:计划中

新增Phi3模型中文资料仓库(性能超越llama3 8b,以小搏大),正在适配中https://github.com/CrazyBoyM/phi3-Chinese
新增网页部署:点此查看
新增趣味版,数据集已开源:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary

模型评测

可用训练工具整理

 

下面的库都是相当好用的,代码封装简洁又清晰,如果你也想微调个自己的llama3 中文定制版,不要错过~

  • Firefly – https://github.com/yangjianxin1/Firefly
    萤火虫 – https://github.com/yangjianxin1/Firefly
  • LLaMA-Factory – https://github.com/hiyouga/LLaMA-Factory
  • unsloth – https://github.com/unslothai/unsloth
  • Xtuner – https://github.com/SmartFlowAI/Llama3-XTuner-CN
  • SWIFT – https://github.com/modelscope/swift

Llama3 相关教程推荐

 

  • Self-LLM  自LLM
    • 后端API部署
    • langchain教程文档
    • streamlit部署
    • 极简LoRA训练

GitHub仓库地址:https://github.com/CrazyBoyM/llama3-Chinese-chat

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Nvidia 的下一代 DLSS 技术 利用人工智能直接生成游戏中角色、物体甚至是NPC

Nvidia 的下一代 DLSS 技术 利用人工智能直接生成游戏中角色、物体甚至是NPC

112 VIEWS
2024年6月24日
OpenAI 分享了内部员工如何使用 ChatGPT 企业版高效分析数据和发现洞察的实际案例

OpenAI 分享了内部员工如何使用 ChatGPT 企业版高效分析数据和发现洞察的实际案例

309 VIEWS
2024年8月12日
PuLID:通过一张参考照片 使用文本描述快速更改图像中人物的外貌和身份特征

PuLID:通过一张参考照片 使用文本描述快速更改图像中人物的外貌和身份特征

149 VIEWS
2024年9月15日
微软推出Phi-3 mini系列小型开源语言模型 可运行在手机上 性能超越Llama 3

微软推出Phi-3 mini系列小型开源语言模型 可运行在手机上 性能超越Llama 3

181 VIEWS
2024年4月24日
Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段

Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段

383 VIEWS
2024年9月11日
Newton AI 模型:通过输入传感器数据 模型可以分析数据自行发现物理规律

Newton AI 模型:通过输入传感器数据 模型可以分析数据自行发现物理规律

551 VIEWS
2024年10月19日
微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

683 VIEWS
2024年12月20日
阿里云发布其第一个MoE模型:Qwen1.5-MoE-A2.7B 匹敌7B性能

阿里云发布其第一个MoE模型:Qwen1.5-MoE-A2.7B 匹敌7B性能

80 VIEWS
2024年3月29日
苹果对 Siri 进行全面改造 具有屏幕感知能力以及跨应用执行各种任务

『iOS 18.0 超详细体验报告』 52 项改进详细介绍以及BUG和升级方法

1k VIEWS
2024年6月12日
Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型

Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型

54 VIEWS
2024年3月11日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版