Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Cohere 推出 Rerank 3 可与任何数据库或搜索索引兼容

by 小互
2024年4月13日
in XiaoHu.AI日报
0 0
0
Cohere 推出 Rerank 3 可与任何数据库或搜索索引兼容
0
SHARES
206
VIEWS
Share on FacebookShare on Twitter

Cohere 最近推出了其最新的基础模型 Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。这个模型能与任何数据库或搜索索引兼容,并可以轻松集成到已有的带有原生搜索功能的应用程序中。Rerank 3 旨在通过一种高效且成本低廉的方式改善搜索性能和检索准确性。

解决的问题

Rerank 3 主要解决以下几个问题:

  1. 搜索质量提升:对于长文档或含有复杂数据结构的文档,传统搜索系统往往难以准确理解和索引其内容,导致搜索结果不准确或不相关。

  2. 多语言和多格式数据处理:多语言环境和各种半结构化数据格式(如 JSON、电子邮件等)的搜索一直是企业搜索领域的难题。

  3. 成本和效率:在保持或提升搜索精度的同时,降低企业的总拥有成本(TCO)和操作延迟。

功能特点

  1. 高级搜索能力:

    • 支持长达 4k 字符的上下文长度,显著提高了长文档的搜索质量。
    • 能够处理多方面和半结构化数据,如电子邮件、发票、JSON 文档、代码和表格。
    • 支持 100 多种语言,提高了多语言数据的搜索准确性。
  2. 提升企业搜索性能:

    • 通过对多方面数据进行基于所有相关元数据字段的排序,增强了搜索的相关性和准确性。
    • 优化代码和文档检索功能,提升了搜索系统在处理专业或技术性较强的内容时的效率。
  3. 成本效率和低延迟:

    • 结合 RAG 系统使用时,可以减少传递给生成模型的文档数量,从而在不增加延迟的情况下提高响应的准确性,显著降低成本。
    • 与 Cohere 的高效 Command R 系列模型结合使用,进一步降低了总拥有成本。
    • 与其他生成型大语言模型(LLM)相比,使用 Rerank 3 的系统运行成本可以降低 80% 至 93%。
    • 低延迟操作:在处理短文或长文时,Rerank 3 显示出比前一版本(Rerank 2)高达 3 倍的延迟改进,对于需要快速响应的商业领域(如电子商务或客户服务)尤其重要。

  4. 易于集成和扩展:

    • Rerank 3 已在 Elasticsearch 的推理 API 中原生支持,便于在现有的企业系统中集成和部署。
    • 提供强大的语义重排能力,改善了关键词和向量搜索的效率和精确度。

通过这些功能,Rerank 3 不仅提升了企业搜索的效率和准确性,也为企业减少了运维成本,特别是在多语言和复杂数据环境下,提高了搜索系统的适用性和可靠性。

性能更强、效率更高的 RAG

Rerank 3 对检索增强生成(RAG)系统的性能提升具有重要影响

 

  1. 高质量的响应:Rerank 3 提升了对 RAG 性能的关键因素,包括响应的质量和延迟。该模型能够隔离出对用户问题最相关的文档,从而提高整体的响应精度。这样的高精度语义重排确保在生成阶段,只有少数、更高质量的文档被传递给大型语言模型(LLM)进行内容生成。

  2. 延迟改进:与先前版本的 Rerank 模型相比,Rerank 3 在短文档长度的情况下延迟降低了 2 倍,而在长上下文长度的情况下延迟改进高达 3 倍。这种延迟的显著降低对于需要快速响应的业务领域,如电子商务或客户服务,至关重要。

  3. 成本效率:在 RAG 系统中,检索步骤至关重要。通过 Rerank 3 加入 RAG 系统,用户可以向 LLM 传递更少的、更相关的文档进行基于内容的生成,同时维持总体的精确度,并且不增加延迟。这一效应使得与 Rerank 一起运行 RAG 的成本比使用其他生成型 LLMs 在市场上的成本降低了 80-93%,与 Rerank 和 Command R 一起使用时的节省成本可达 98%。

    基于 TREC 2020 数据集 nDCG@10 的准确度(越高越好)。LLMs 按照 RankGPT(Sun 等人,2023 年)中使用的方法,以列表方式进行评估。

  4. 独立成本:基于 1M RAG 提示的推理成本进行计算,每个文档包含 250 个令牌,每个输出包含 250 个令牌,不使用 Rerank 的成本与使用 Rerank 的成本进行了对比。在使用 Rerank 的场景中,只处理 5 份文档的成本显著低于传统方法。

详细介绍:https://txt.cohere.com/rerank-3/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

H2O-Danube3:无需联网 可以直接在手机上运行的开源模型

H2O-Danube3:无需联网 可以直接在手机上运行的开源模型

436 VIEWS
2024年7月16日
OpenDiLoCo:一个分布式低通信模型训练开源框架 允许在全球进行分布式AI训练

OpenDiLoCo:一个分布式低通信模型训练开源框架 允许在全球进行分布式AI训练

356 VIEWS
2024年7月12日
OpenAI、斯坦福、微软等多所机构筛选出1565篇论文 发布大模型提示技术报告

OpenAI、斯坦福、微软等多所机构筛选出1565篇论文 发布大模型提示技术报告

543 VIEWS
2024年6月19日
BlenderAlchemy:集成GPT-4V 通过聊天形式来进行3D图形编辑

BlenderAlchemy:集成GPT-4V 通过聊天形式来进行3D图形编辑

81 VIEWS
2024年4月30日
Relightful :自动调节人像光照条件,与任意背景的自然融合

Relightful :自动调节人像光照条件,与任意背景的自然融合

86 VIEWS
2024年3月5日
DreamWalk:在图像生成中 实现对风格和内容的精细控制

DreamWalk:在图像生成中 实现对风格和内容的精细控制

59 VIEWS
2024年4月9日
Anthropic击败OpenAI:Claude 3.5 Sonnet与GPT-4o的并排对比

Anthropic击败OpenAI:Claude 3.5 Sonnet与GPT-4o的并排对比

263 VIEWS
2024年6月28日
Google DeepMind宣布开源其能够预测蛋白质结构的AI模型 AlphaFold 3

Google DeepMind宣布开源其能够预测蛋白质结构的AI模型 AlphaFold 3

92 VIEWS
2024年11月12日
X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术

X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术

612 VIEWS
2024年11月7日
Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

265 VIEWS
2024年10月23日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版