Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 资源

Llama3 中文综合资源库 集合了与Llama3 模型相关的各种中文资料

by 小互
2024年5月11日
in AI 资源
0 0
0
Llama3 中文综合资源库 集合了与Llama3 模型相关的各种中文资料
0
SHARES
755
VIEWS
Share on FacebookShare on Twitter

Llama3 中文聊天项目综合资源库,集合了与Llama3 模型相关的各种中文资料,包括微调版本、有趣的权重、训练、推理、评测和部署的教程视频与文档。

  1. 多版本支持与创新:该仓库提供了多个版本的Llama3 模型,包括基于不同技术和偏好的微调版本,如直接中文SFT版、Instruct偏好强化学习版、趣味版等。此外,还有Phi3模型中文资料仓库的链接,和性能超越了8b版本的Llama3。

  2. 部署与使用:项目提供了网页部署的代码和教程,使用户可以轻松地在网页上使用这些模型。部署教程包括如何在Streamlit上部署这些模型进行在线体验。

  3. 训练与推理资源:除了已经提供的模型,仓库还包括多种训练和推理的资源,如训练教程、推理脚本、优质训练数据集的整理等。

  4. 扩展和增强:项目还在计划中包括增加更多的扩展如角色扮演增强模型、长上下文支持等,旨在提升模型的功能和适应更多复杂场景的能力。

可用Chat版模型整理

llama3相关对话版本优质权重整理:(欢迎issue补充)

  • shareAI系列:

    • base预训练 + 直接中文SFT版:

      • 训练数据:https://modelscope.cn/datasets/baicai003/Llama3-Chinese-dataset/summary
      • V1版
        • OpenCSG满速下载:https://opencsg.com/models/shareAI/llama3-Chinese-chat-8b
        • WiseModel满速下载:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b
      • V2版
        • modelscope:https://modelscope.cn/models/baicai003/Llama3-Chinese_v2/summary
    • Instruct + 继续中文SFT版:

      • modelscope模型下载:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary
      • 云服务器镜像在线体验(点击即用,免费 4 小时):https://www.suanyun.cn/console/share?uuid=b1ba51908f8a4bd1af37148765c293ee
    • Instruct + 强化学习中文版:

      • DPO 表情趣味版 (10分钟左右可训练好,对原多语言instruct版最小化性能损伤,实测超过大多中文大量训练版)
        • modelscope下载:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary
        • 偏好学习数据集:DPO-zh-en-emoji
    • Base预训练 + 海量中文优质数据增量预训练:正在进行中

    • 70b 中文版:计划中

  • 下面几个版本因对话模版格式不同暂时不支持网页部署推理,需要用fastchat体验:

    • Base + 中文SFT:https://modelscope.cn/models/zhuangxialie/Llama3_Chinese_Sft/files
    • Base + ORPO:https://modelscope.cn/models/zhuangxialie/Llama3-Chinese-ORPO/summary 偏爱长对话
    • Instruct + DPO:https://www.modelscope.cn/models/zhuangxialie/Llama3-Chinese-DPO/summary 偏爱长对话
  • llama3 Pro(加block版,推荐网友积极在该方案上做更多尝试、探索):

    • linjh1118网友(第一个ORPO偏好对齐 + 扩展2*blocks):https://github.com/linjh1118/Llama3-Chinese-ORPO
  • llama3 Moe增强版:

    • cooper12121-llama3-8x8b-MoE:https://github.com/cooper12121/llama3-8x8b-MoE
  • 长上下文版本:

    • 联通微调版v2 (中文,28k上下文):https://huggingface.co/UnicomLLM/Unichat-llama3-Chinese-8B-28K
    • 262k上下文(英文):https://huggingface.co/gradientai/Llama-3-8B-Instruct-262k
    • 262k上下文(中文):计划中
    • 无限上下文版本:计划中,参考:https://medium.com/neoxia/llm-infini-attention-with-linear-complexity-3209b87a77c3
  • 其他普通中文微调版本:

    • 联通微调版(SFT,网友尝试反馈幻觉多):https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summary
    • Openbuddy微调版(SFT,据说不错):https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary
    • zhichen微调版(ORPO方法,应该是第一个orpo):https://github.com/seanzhang-zhichen/llama3-chinese
    • shenzhi-wang微调版(ORPO方法,说是第一个orpo):https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat
    • Rookie微调版(SFT):https://github.com/Rookie1019/Llama-3-8B-Instruct-Chinese
    • hit-sz klc lab 微调版本:https://github.com/zyg18181818/Llama-3-Chinese
  • 破解安全限制系列(暂时只支持英文):

    • Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B
    • neural-chat:https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b
    • dolphin:https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b
  • v-llama3 多模态图文版:(英文,支持视觉问答)

    • Bunny-Llama-3-8B-V:https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V
    • llava-llama-3-8b:https://huggingface.co/xtuner/llava-llama-3-8b-v1_1
  • agent工具能力增强版:

    • ModelScope Chinese Agent版V1(中文,可根据要求帮你选择工具):https://modelscope.cn/models/swift/Llama3-Chinese-8B-Instruct-Agent-v1/summary
  • 基于EmoLLM心理数据微调的Llama3-8B-Instruct 模型

    • EmoLLM 3.0 在线体验链接
      • EmoLLM Llama3心理咨询室V3.0 https://st-app-center-006861-9746-jlroxvg.openxlab.space/
      • 或者前往OpenXLab EmoLLM3.0-Llama3启动 https://openxlab.org.cn/apps/detail/chg0901/EmoLLM-Llama3-8B-Instruct3.0
    • 模型链接
      • ** OpenXLab ** https://openxlab.org.cn/models/detail/chg0901/EmoLLM-Llama3-8B-Instruct3.0
      • ModelScope https://modelscope.cn/models/chg0901/EmoLLM-Llama3-8B-Instruct3.0/summary
  • 小说、网文、故事撰写任务增强版:计划中

  • 音乐生成任务版:计划中

  • 猫娘扮演版:计划中

  • 涩涩版:计划中

新增Phi3模型中文资料仓库(性能超越llama3 8b,以小搏大),正在适配中https://github.com/CrazyBoyM/phi3-Chinese
新增网页部署:点此查看
新增趣味版,数据集已开源:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary

模型评测

可用训练工具整理

 

下面的库都是相当好用的,代码封装简洁又清晰,如果你也想微调个自己的llama3 中文定制版,不要错过~

  • Firefly – https://github.com/yangjianxin1/Firefly
    萤火虫 – https://github.com/yangjianxin1/Firefly
  • LLaMA-Factory – https://github.com/hiyouga/LLaMA-Factory
  • unsloth – https://github.com/unslothai/unsloth
  • Xtuner – https://github.com/SmartFlowAI/Llama3-XTuner-CN
  • SWIFT – https://github.com/modelscope/swift

Llama3 相关教程推荐

 

  • Self-LLM  自LLM
    • 后端API部署
    • langchain教程文档
    • streamlit部署
    • 极简LoRA训练

GitHub仓库地址:https://github.com/CrazyBoyM/llama3-Chinese-chat

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

ZeST:将一个图像中物体材料提取并转移到另一个图像的目标对象上

ZeST:将一个图像中物体材料提取并转移到另一个图像的目标对象上

272 VIEWS
2024年5月17日
Google推出Gemma 2 2B模型 能够在手机、笔记本电脑、台式机等边缘设备上运行

Google推出Gemma 2 2B模型 能够在手机、笔记本电脑、台式机等边缘设备上运行

461 VIEWS
2024年8月1日
使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题

使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题

199 VIEWS
2024年9月14日
Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音

Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音

1.2k VIEWS
2024年5月6日
Hume AI发布情感感知对话AI:EVI 能理解用户的情感状态和意图

Hume AI发布情感感知对话AI:EVI 能理解用户的情感状态和意图

95 VIEWS
2024年3月28日
Prompt 学习地图 16 | 复杂任务 – 结构化的有效性

Prompt 学习地图 16 | 复杂任务 – 结构化的有效性

148 VIEWS
2024年4月18日
Melodisco:AI 版的网易云音乐 一个开源的 AI 播放器 收录了 30 万首 AI 歌曲

Melodisco:AI 版的网易云音乐 一个开源的 AI 播放器 收录了 30 万首 AI 歌曲

324 VIEWS
2024年8月17日
CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型

CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型

187 VIEWS
2024年5月7日
接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布

接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布

612 VIEWS
2024年6月1日
Truecaller 与微软合作 允许用户克隆自己的声音 来让AI接听电话

Truecaller 与微软合作 允许用户克隆自己的声音 来让AI接听电话

301 VIEWS
2024年5月23日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版