XiaoHu.AI学院

No Result

View All Result

Login

XiaoHu.AI学院

No Result

View All Result

Home 开源项目案例库 AI 资源

Llama3 中文综合资源库集合了与Llama3 模型相关的各种中文资料

by 小互

2024年5月11日

in AI 资源

Llama3 中文综合资源库集合了与Llama3 模型相关的各种中文资料

0

SHARES

755

VIEWS

Share on Facebook Share on Twitter

Llama3 中文聊天项目综合资源库，集合了与Llama3 模型相关的各种中文资料，包括微调版本、有趣的权重、训练、推理、评测和部署的教程视频与文档。

多版本支持与创新：该仓库提供了多个版本的Llama3 模型，包括基于不同技术和偏好的微调版本，如直接中文SFT版、Instruct偏好强化学习版、趣味版等。此外，还有Phi3模型中文资料仓库的链接，和性能超越了8b版本的Llama3。
部署与使用：项目提供了网页部署的代码和教程，使用户可以轻松地在网页上使用这些模型。部署教程包括如何在Streamlit上部署这些模型进行在线体验。
训练与推理资源：除了已经提供的模型，仓库还包括多种训练和推理的资源，如训练教程、推理脚本、优质训练数据集的整理等。
扩展和增强：项目还在计划中包括增加更多的扩展如角色扮演增强模型、长上下文支持等，旨在提升模型的功能和适应更多复杂场景的能力。

可用Chat版模型整理

llama3相关对话版本优质权重整理：（欢迎issue补充）

shareAI系列：
- base预训练 + 直接中文SFT版:
  - 训练数据：https://modelscope.cn/datasets/baicai003/Llama3-Chinese-dataset/summary
  - V1版
    - OpenCSG满速下载：https://opencsg.com/models/shareAI/llama3-Chinese-chat-8b
    - WiseModel满速下载：https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b
  - V2版
    - modelscope：https://modelscope.cn/models/baicai003/Llama3-Chinese_v2/summary
- Instruct + 继续中文SFT版：
  - modelscope模型下载：https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary
  - 云服务器镜像在线体验（点击即用，免费 4 小时）：https://www.suanyun.cn/console/share?uuid=b1ba51908f8a4bd1af37148765c293ee
- Instruct + 强化学习中文版：
  - DPO 表情趣味版（10分钟左右可训练好，对原多语言instruct版最小化性能损伤，实测超过大多中文大量训练版）
    - modelscope下载：https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary
    - 偏好学习数据集：DPO-zh-en-emoji
- Base预训练 + 海量中文优质数据增量预训练：正在进行中
- 70b 中文版：计划中
下面几个版本因对话模版格式不同暂时不支持网页部署推理，需要用fastchat体验：
- Base + 中文SFT：https://modelscope.cn/models/zhuangxialie/Llama3_Chinese_Sft/files
- Base + ORPO：https://modelscope.cn/models/zhuangxialie/Llama3-Chinese-ORPO/summary 偏爱长对话
- Instruct + DPO：https://www.modelscope.cn/models/zhuangxialie/Llama3-Chinese-DPO/summary 偏爱长对话
llama3 Pro（加block版，推荐网友积极在该方案上做更多尝试、探索）：
- linjh1118网友（第一个ORPO偏好对齐 + 扩展2*blocks）：https://github.com/linjh1118/Llama3-Chinese-ORPO
llama3 Moe增强版：
- cooper12121-llama3-8x8b-MoE：https://github.com/cooper12121/llama3-8x8b-MoE
长上下文版本：
- 联通微调版v2 (中文，28k上下文）：https://huggingface.co/UnicomLLM/Unichat-llama3-Chinese-8B-28K
- 262k上下文（英文）：https://huggingface.co/gradientai/Llama-3-8B-Instruct-262k
- 262k上下文（中文）：计划中
- 无限上下文版本：计划中，参考：https://medium.com/neoxia/llm-infini-attention-with-linear-complexity-3209b87a77c3
其他普通中文微调版本：
- 联通微调版（SFT，网友尝试反馈幻觉多）：https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summary
- Openbuddy微调版（SFT，据说不错）：https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary
- zhichen微调版（ORPO方法，应该是第一个orpo）：https://github.com/seanzhang-zhichen/llama3-chinese
- shenzhi-wang微调版（ORPO方法，说是第一个orpo）：https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat
- Rookie微调版（SFT）：https://github.com/Rookie1019/Llama-3-8B-Instruct-Chinese
- hit-sz klc lab 微调版本：https://github.com/zyg18181818/Llama-3-Chinese
破解安全限制系列（暂时只支持英文）：
- Unholy：https://huggingface.co/Undi95/Llama-3-Unholy-8B
- neural-chat：https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b
- dolphin：https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b
v-llama3 多模态图文版：（英文，支持视觉问答）
- Bunny-Llama-3-8B-V：https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V
- llava-llama-3-8b：https://huggingface.co/xtuner/llava-llama-3-8b-v1_1
agent工具能力增强版：
- ModelScope Chinese Agent版V1（中文，可根据要求帮你选择工具）：https://modelscope.cn/models/swift/Llama3-Chinese-8B-Instruct-Agent-v1/summary
基于EmoLLM心理数据微调的Llama3-8B-Instruct 模型
- EmoLLM 3.0 在线体验链接
  - EmoLLM Llama3心理咨询室V3.0 https://st-app-center-006861-9746-jlroxvg.openxlab.space/
  - 或者前往OpenXLab EmoLLM3.0-Llama3启动 https://openxlab.org.cn/apps/detail/chg0901/EmoLLM-Llama3-8B-Instruct3.0
- 模型链接
  - ** OpenXLab ** https://openxlab.org.cn/models/detail/chg0901/EmoLLM-Llama3-8B-Instruct3.0
  - ModelScope https://modelscope.cn/models/chg0901/EmoLLM-Llama3-8B-Instruct3.0/summary
小说、网文、故事撰写任务增强版：计划中
音乐生成任务版：计划中
猫娘扮演版：计划中
涩涩版：计划中

新增Phi3模型中文资料仓库（性能超越llama3 8b，以小搏大)，正在适配中https://github.com/CrazyBoyM/phi3-Chinese
新增网页部署：点此查看
新增趣味版，数据集已开源：https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary

模型评测

可用训练工具整理

下面的库都是相当好用的，代码封装简洁又清晰，如果你也想微调个自己的llama3 中文定制版，不要错过～

Firefly – https://github.com/yangjianxin1/Firefly
萤火虫 – https://github.com/yangjianxin1/Firefly
LLaMA-Factory – https://github.com/hiyouga/LLaMA-Factory
unsloth – https://github.com/unslothai/unsloth
Xtuner – https://github.com/SmartFlowAI/Llama3-XTuner-CN
SWIFT – https://github.com/modelscope/swift

Llama3 相关教程推荐

Self-LLM 自LLM

GitHub仓库地址：https://github.com/CrazyBoyM/llama3-Chinese-chat

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日

Fireworks AI新功能能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

AI 工具

Fireworks AI新功能能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日

Anthropic 公布了一种全新的 AI 越狱技术可以轻松破解所有前沿模型

AI 论文

Anthropic 公布了一种全新的 AI 越狱技术可以轻松破解所有前沿模型

2024年12月23日

INFP：基于音频驱动的双人对话中的互动头像生成能自动区分谁在说话，谁在听

AI 项目

INFP：基于音频驱动的双人对话中的互动头像生成能自动区分谁在说话，谁在听

2024年12月22日

No Result

View All Result

Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?

Unlock left : 0

Are you sure want to cancel subscription?