Google DeepMind 推出通过强化学习实现自我纠正(SCoRe)的训练方法 提高模型在复杂数学和编码任务中的准确性 by 小互 2024年9月24日 0 236 大语言模型(LLMs)在数学问题解决和代...