Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

Cohere 推出 Rerank 3 可与任何数据库或搜索索引兼容

by 小互
2024年4月13日
in XiaoHu.AI日报
0 0
0
Cohere 推出 Rerank 3 可与任何数据库或搜索索引兼容
0
SHARES
206
VIEWS
Share on FacebookShare on Twitter

Cohere 最近推出了其最新的基础模型 Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。这个模型能与任何数据库或搜索索引兼容,并可以轻松集成到已有的带有原生搜索功能的应用程序中。Rerank 3 旨在通过一种高效且成本低廉的方式改善搜索性能和检索准确性。

解决的问题

Rerank 3 主要解决以下几个问题:

  1. 搜索质量提升:对于长文档或含有复杂数据结构的文档,传统搜索系统往往难以准确理解和索引其内容,导致搜索结果不准确或不相关。

  2. 多语言和多格式数据处理:多语言环境和各种半结构化数据格式(如 JSON、电子邮件等)的搜索一直是企业搜索领域的难题。

  3. 成本和效率:在保持或提升搜索精度的同时,降低企业的总拥有成本(TCO)和操作延迟。

功能特点

  1. 高级搜索能力:

    • 支持长达 4k 字符的上下文长度,显著提高了长文档的搜索质量。
    • 能够处理多方面和半结构化数据,如电子邮件、发票、JSON 文档、代码和表格。
    • 支持 100 多种语言,提高了多语言数据的搜索准确性。
  2. 提升企业搜索性能:

    • 通过对多方面数据进行基于所有相关元数据字段的排序,增强了搜索的相关性和准确性。
    • 优化代码和文档检索功能,提升了搜索系统在处理专业或技术性较强的内容时的效率。
  3. 成本效率和低延迟:

    • 结合 RAG 系统使用时,可以减少传递给生成模型的文档数量,从而在不增加延迟的情况下提高响应的准确性,显著降低成本。
    • 与 Cohere 的高效 Command R 系列模型结合使用,进一步降低了总拥有成本。
    • 与其他生成型大语言模型(LLM)相比,使用 Rerank 3 的系统运行成本可以降低 80% 至 93%。
    • 低延迟操作:在处理短文或长文时,Rerank 3 显示出比前一版本(Rerank 2)高达 3 倍的延迟改进,对于需要快速响应的商业领域(如电子商务或客户服务)尤其重要。

  4. 易于集成和扩展:

    • Rerank 3 已在 Elasticsearch 的推理 API 中原生支持,便于在现有的企业系统中集成和部署。
    • 提供强大的语义重排能力,改善了关键词和向量搜索的效率和精确度。

通过这些功能,Rerank 3 不仅提升了企业搜索的效率和准确性,也为企业减少了运维成本,特别是在多语言和复杂数据环境下,提高了搜索系统的适用性和可靠性。

性能更强、效率更高的 RAG

Rerank 3 对检索增强生成(RAG)系统的性能提升具有重要影响

 

  1. 高质量的响应:Rerank 3 提升了对 RAG 性能的关键因素,包括响应的质量和延迟。该模型能够隔离出对用户问题最相关的文档,从而提高整体的响应精度。这样的高精度语义重排确保在生成阶段,只有少数、更高质量的文档被传递给大型语言模型(LLM)进行内容生成。

  2. 延迟改进:与先前版本的 Rerank 模型相比,Rerank 3 在短文档长度的情况下延迟降低了 2 倍,而在长上下文长度的情况下延迟改进高达 3 倍。这种延迟的显著降低对于需要快速响应的业务领域,如电子商务或客户服务,至关重要。

  3. 成本效率:在 RAG 系统中,检索步骤至关重要。通过 Rerank 3 加入 RAG 系统,用户可以向 LLM 传递更少的、更相关的文档进行基于内容的生成,同时维持总体的精确度,并且不增加延迟。这一效应使得与 Rerank 一起运行 RAG 的成本比使用其他生成型 LLMs 在市场上的成本降低了 80-93%,与 Rerank 和 Command R 一起使用时的节省成本可达 98%。

    基于 TREC 2020 数据集 nDCG@10 的准确度(越高越好)。LLMs 按照 RankGPT(Sun 等人,2023 年)中使用的方法,以列表方式进行评估。

  4. 独立成本:基于 1M RAG 提示的推理成本进行计算,每个文档包含 250 个令牌,每个输出包含 250 个令牌,不使用 Rerank 的成本与使用 Rerank 的成本进行了对比。在使用 Rerank 的场景中,只处理 5 份文档的成本显著低于传统方法。

详细介绍:https://txt.cohere.com/rerank-3/

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
615
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Optimizer AI:专为视频自动生成音效的AI工具 可为视频自动配音

Optimizer AI:专为视频自动生成音效的AI工具 可为视频自动配音

108 VIEWS
2024年3月11日
Adobe 将推出新的生成式 AI 视频模型  Firefly Video Model 集成到其视频工具中

Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中

180 VIEWS
2024年9月12日
Claude 3 加入了性格训练 让 AI 保持好奇心和交谈时更有人情味

Claude 3 加入了性格训练 让 AI 保持好奇心和交谈时更有人情味

210 VIEWS
2024年6月9日
Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构

Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构

479 VIEWS
2024年10月5日
Screenpipe:24小时不间断记录你的屏幕和音频数据 帮你自动干活

Screenpipe:24小时不间断记录你的屏幕和音频数据 帮你自动干活

599 VIEWS
2024年9月29日
HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

408 VIEWS
2024年11月13日
Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

Bing 推出生成式AI搜索功能 根据用户的查询提供量身定制的动态响应结果

124 VIEWS
2024年7月25日
O-one :通过语音操控你的电脑 一个开源语言模型计算机

O-one :通过语音操控你的电脑 一个开源语言模型计算机

140 VIEWS
2024年3月22日
Octopus-v2:可以在移动设备上运行的2B LLMs ,性能优于 GPT-4

Octopus-v2:可以在移动设备上运行的2B LLMs ,性能优于 GPT-4

774 VIEWS
2024年4月8日
一个用于认知行为疗法(CBT)的提示 帮你识别生活中令人困扰事情

一个用于认知行为疗法(CBT)的提示 帮你识别生活中令人困扰事情

412 VIEWS
2024年7月16日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版