Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

微软 Azure 宣布了一系列更新 推出Phi-3无服务器微调 支持Llama 3.1 405B等1600个模型

by 小互
2024年7月27日
in XiaoHu.AI日报
0 0
0
微软 Azure 宣布了一系列更新 推出Phi-3无服务器微调 支持Llama 3.1 405B等1600个模型
0
SHARES
148
VIEWS
Share on FacebookShare on Twitter

微软Azure宣布了一系列更新,旨在帮助开发人员利用Azure AI工具链快速创建定制的AI解决方案。包括Phi-3-mini和Phi-3-medium模型的无服务器微调,这些模型现在可以在云和边缘场景中快速、轻松地进行定制。更新还包括OpenAI、Meta和Mistral的最新模型,以提供更多选择和灵活性。

  • Phi-3-mini 和 Phi-3-medium 模型的无服务器微调使开发者能够在无需安排计算资源的情况下快速轻松地定制这些模型,用于云和边缘场景。
  • Phi-3-mini 更新包括核心质量、指令跟随和结构化输出的显著提升,使开发者能够在无需额外成本的情况下构建性能更强的模型。
  • 本月早些时候最新模型的同日发布包括 OpenAI (GPT-4o mini)、Meta (Llama 3.1 405B) 和 Mistral (Large 2) 到 Azure AI,提供了更大的选择和灵活性。

Phi-3家族的小型开放模型是微软最具成本效益的小型语言模型(SLM),并且已优化以改进指令跟随和结构化输出。Phi-3-mini和Phi-3-medium模型现在可以微调以构建更符合用户需求的AI体验。

Phi-3-mini更新内容包括以下几个方面:

  1. 核心质量改进:
    • 提高了模型的核心质量,使其在各种应用场景中表现更好。
  2. 指令跟随能力:
    • 重新训练模型,显著改进了指令跟随能力。现在模型更能准确理解和执行复杂的指令。
  3. 结构化输出支持:
    • 增强了对JSON和XML格式结构化输出的支持,提升了输出的准确性和一致性。
  4. 多轮对话质量:
    • 提高了多轮对话的质量,使得对话更流畅、更自然。
  5. 推理能力:
    • 显著改进了模型的推理能力,使其在回答复杂问题时表现更好。
  6. 系统提示支持:
    • 新增了对<|system|>提示的支持,使模型能更好地理解和响应系统级指令。
  7. 性能提升:
    • 总体性能提升,包括在不同任务中的表现,例如数学问题的准确性和对错误的纠正能力。

以下是不同更新前后的表现对比:

  • 指令跟随(Instruction Extra Hard):从5.7提升到6.0
  • 结构化输出(JSON):从11.5提升到52.3
  • 推理能力(GPQA):从23.7提升到30.6

Azure AI还引入了无服务器端点,方便开发人员快速入门AI开发。Phi-3-vision多模态模型也即将通过无服务器端点提供。

  1. 无服务器端点:无服务器端点(Serverless Endpoint)是一种云服务,开发者可以使用它来运行和管理AI模型,而不需要关心底层的服务器或硬件资源。这意味着开发者不需要配置、管理或维护物理或虚拟服务器,所有的基础设施管理都由云服务提供商(如Azure)负责。
  2. 快速轻松地开始AI开发:因为开发者不需要管理底层基础设施,他们可以专注于AI模型的开发和应用的实现。这加速了开发过程,使得开发者能够更快地部署和测试他们的AI应用程序。
  3. 简化管理:无服务器端点让开发者免去了处理服务器配置、负载均衡、扩展等复杂任务的麻烦。云服务会自动处理这些问题,确保应用的高可用性和可扩展性。

具体好处包括:

  • 即用即付:开发者只需为实际使用的计算资源付费,而无需为闲置的资源买单。
  • 自动扩展:云服务可以根据应用负载自动调整计算资源,确保应用在高峰期仍能正常运行。
  • 减少运维工作:开发者不再需要进行服务器维护、软件更新和安全补丁管理等运维工作。
  • 高效开发:开发者可以把更多时间和精力投入到模型优化和应用开发上,而不是基础设施管理。

Azure AI 现有超过 1600 种模型

Azure AI继续增加模型选择,目前已有超过1600个模型。微软致力于安全、负责任地构建AI解决方案,通过Azure AI评估和内容安全功能,帮助组织管理AI风险。

包括来自 AI21、Cohere、Databricks、Hugging Face、Meta、Mistral、Microsoft Research、OpenAI、Snowflake、Stability AI 等提供商的 1600 多种模型。本月我们增加了通过 Azure OpenAI 服务提供的 OpenAI 的 GPT-4o mini、Meta Llama 3.1 405B 和 Mistral Large 2。

Cohere Rerank 现已在 Azure 上提供。 Cohere 的企业级语言模型,结合 Azure AI 的强大基础设施,使企业能够无缝、可靠、安全地将最先进的语义搜索技术集成到他们的应用中。这一集成使用户能够利用 Azure 的灵活性和可扩展性,结合 Cohere 的高性能和高效语言模型,在生产中提供卓越的搜索结果。

Cohere 的旗舰生成模型 Command R+ 也在 Azure AI 上提供,专为与 Cohere Rerank 在检索增强生成 (RAG) 系统中配合工作而设计。它们一起能够在生产中满足一些最苛刻的企业工作负载需求。

本周早些时候,我们宣布 Meta Llama 3.1 405B 以及最新的微调 Llama 3.1 模型(包括 8B 和 70B)现已通过 Azure AI 的无服务器端点提供。Llama 3.1 405B 可用于高级合成数据生成和蒸馏,其中 405B-Instruct 作为教师模型,8B-Instruct/70B-Instruct 模型作为学生模型。了解更多关于此公告的信息。

Mistral Large 2 现已在 Azure 上提供,使 Azure 成为第一个提供这一下一代模型的领先云提供商。Mistral Large 2 在编码、推理和智能行为方面优于以前的版本,与其他领先模型不相上下。此外,Mistral Nemo 是与 NVIDIA 合作开发的,带来了一个强大的 12B 模型,推动了语言理解和生成的边界。了解更多。

官方博客介绍

访问:https://azure.microsoft.com/en-us/solutions/ai

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

 Hugging Face 推出一站式搜索开源成果的平台:Paper Central

 Hugging Face 推出一站式搜索开源成果的平台:Paper Central

207 VIEWS
2024年10月3日
STRUCT CHEM:提高大语言模型解决复杂化学问题的能力

STRUCT CHEM:提高大语言模型解决复杂化学问题的能力

132 VIEWS
2024年3月6日
苹果发布 Apple Intelligence 智能助手 深度个性化 支持跨应用交互操作

WWDC 2024 发布会Apple Intelligence中文介绍完整视频

335 VIEWS
2024年6月11日
ReFlux:一次使用多个微调的 FLUX.1 模型在一个无限大的画布上生成图像

ReFlux:一次使用多个微调的 FLUX.1 模型在一个无限大的画布上生成图像

322 VIEWS
2024年9月3日
最新泄露的细节显示 Google Pixel 9将带来更多 AI 功能 包括类似微软的Recall功能

最新泄露的细节显示 Google Pixel 9将带来更多 AI 功能 包括类似微软的Recall功能

164 VIEWS
2024年7月4日
Google:个人健康大语言模型和智能体研究 利用可穿戴设备数据进行健康监测

Google:个人健康大语言模型和智能体研究 利用可穿戴设备数据进行健康监测

266 VIEWS
2024年6月18日
麻省理工开发出 AI 聊天机器人 可以让你和60岁的自己进行对话

麻省理工开发出 AI 聊天机器人 可以让你和60岁的自己进行对话

587 VIEWS
2024年6月22日
斯坦福大学推出一种上下文向量(ICV)新方法 提高模型微调效率和可扩展性

斯坦福大学推出一种上下文向量(ICV)新方法 提高模型微调效率和可扩展性

74 VIEWS
2024年7月14日
Dynamic Typography :“动态排版”技术 可以让文字变成动画

Dynamic Typography :“动态排版”技术 可以让文字变成动画

174 VIEWS
2024年4月20日
MimicBrush:通过模仿参考图像对目标图像选定区域自动进行局部编辑

MimicBrush:通过模仿参考图像对目标图像选定区域自动进行局部编辑

631 VIEWS
2024年6月18日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版