Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 论文

南洋理工大学提出Q*框架:可大幅提升大语言模型的多步推理能力

by 小互
2024年6月24日
in AI 论文
0 0
0
南洋理工大学提出Q*框架:可大幅提升大语言模型的多步推理能力
0
SHARES
424
VIEWS
Share on FacebookShare on Twitter

大语言模型(LLMs)在许多自然语言任务中展示了令人印象深刻的能力。然而,在执行多步推理时,自动回归生成过程使得LLMs容易产生错误、幻觉和不一致的陈述。

Skywork AI和南洋理工大学提出了一种通用、灵活的框架:Q* ,用于通过深思熟虑的规划来指导大语言模型(LLMs)的解码过程,以改进多步推理能力。通过学习一个即插即用的Q值模型作为启发函数,Q*能够有效地指导LLMs选择最有希望的下一步,而无需为每个任务微调LLMs,从而避免了大量的计算开销和可能的性能退化。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

苹果收购法国初创公司Datakalab 专注于AI和计算机视觉技术

42 VIEWS
2024年4月23日
微软 Copilot 升级全新的外观 加入了语音模式 速度更快、性能更强

微软 Copilot 升级全新的外观 加入了语音模式 速度更快、性能更强

479 VIEWS
2024年9月30日
英伟达黄仁勋 Computex 2024 演讲全文及精华介绍

英伟达黄仁勋 Computex 2024 演讲全文及精华介绍

1.1k VIEWS
2024年6月3日
PictoGraphic:拥有超过40000张的免费AI生成插图库

PictoGraphic:拥有超过40000张的免费AI生成插图库

913 VIEWS
2024年5月19日
Sailor:是一套为东南亚国家量身定制的语言模型

Sailor:是一套为东南亚国家量身定制的语言模型

101 VIEWS
2024年3月2日
Figure 机器人接入ChatGPT后获得自我推理等惊人能力

Figure 机器人接入ChatGPT后获得自我推理等惊人能力

29 VIEWS
2024年3月14日
字节跳动发布AI开发工具:豆包MarsCode 无需配置环境实现云端编码开发

字节跳动发布AI开发工具:豆包MarsCode 无需配置环境实现云端编码开发

591 VIEWS
2024年6月27日
Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

413 VIEWS
2024年9月6日
Prompt 学习地图 02 | 编写清晰的说明 – 让GPT学会角色扮演

Prompt 学习地图 02 | 编写清晰的说明 – 让GPT学会角色扮演

139 VIEWS
2024年3月25日
Google在其搜索中集成先进的 Gemini 模型 更新一些列功能

Google在其搜索中集成先进的 Gemini 模型 更新一些列功能

150 VIEWS
2024年5月16日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版