Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 论文

南洋理工大学提出Q*框架:可大幅提升大语言模型的多步推理能力

by 小互
2024年6月24日
in AI 论文
0 0
0
南洋理工大学提出Q*框架:可大幅提升大语言模型的多步推理能力
0
SHARES
424
VIEWS
Share on FacebookShare on Twitter

大语言模型(LLMs)在许多自然语言任务中展示了令人印象深刻的能力。然而,在执行多步推理时,自动回归生成过程使得LLMs容易产生错误、幻觉和不一致的陈述。

Skywork AI和南洋理工大学提出了一种通用、灵活的框架:Q* ,用于通过深思熟虑的规划来指导大语言模型(LLMs)的解码过程,以改进多步推理能力。通过学习一个即插即用的Q值模型作为启发函数,Q*能够有效地指导LLMs选择最有希望的下一步,而无需为每个任务微调LLMs,从而避免了大量的计算开销和可能的性能退化。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
494
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
346
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
460
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
284
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
636
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
435

Recommendeds

一组由GPT-4组成的智能代理团队 自主破解零日安全漏洞 成功率达到53%

一组由GPT-4组成的智能代理团队 自主破解零日安全漏洞 成功率达到53%

90 VIEWS
2024年6月10日
教程:使用 IC 灯光变换器重新照亮您的视频 随意更换视频背景和光照

教程:使用 IC 灯光变换器重新照亮您的视频 随意更换视频背景和光照

643 VIEWS
2024年7月11日
超200位知名音乐人签署公开信 呼吁阻止AI对人类创造力的攻击

超200位知名音乐人签署公开信 呼吁阻止AI对人类创造力的攻击

255 VIEWS
2024年4月3日
Screenshot to Code:将网页屏幕截图直接转换为干净的代码

Screenshot to Code:将网页屏幕截图直接转换为干净的代码

80 VIEWS
2024年3月3日
Google推出 LearnLM 教育模型工具 专门用于提升教育和学习体验

Google推出 LearnLM 教育模型工具 专门用于提升教育和学习体验

153 VIEWS
2024年5月23日
Genie 一个更像人类工程师的 AI 模型 在编程任务中超越所有的现有AI模型

Genie 一个更像人类工程师的 AI 模型 在编程任务中超越所有的现有AI模型

206 VIEWS
2024年8月13日
ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音

ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音

233 VIEWS
2024年6月1日
Claude 3发布:性能超越GPT4 具有“接近人类”理解能力

Claude 3发布:性能超越GPT4 具有“接近人类”理解能力

33 VIEWS
2024年3月5日
GRM:只需少量图片 能在0.1秒内构建出物体的3D模型或整个场景

GRM:只需少量图片 能在0.1秒内构建出物体的3D模型或整个场景

975 VIEWS
2024年4月2日
Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型

Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型

55 VIEWS
2024年3月11日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版