Update tot.zh.mdx

This commit is contained in:
kiner-tang(文辉) 2023-08-09 14:20:57 +08:00 committed by GitHub
parent b11893d87e
commit b5dd7548fa
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -17,7 +17,7 @@ ToT 框架原理如下:
ToT 需要针对不同的任务定义思维/步骤的数量以及每步的候选项数量。例如,论文中的“算 24 游戏”是一种数学推理任务,需要分成 3 个思维步骤每一步都需要一个中间方程。而每个步骤保留最优的best 5 个候选项。
ToT 完成算 24 的游戏任务要执行度优先搜索BFS每步思维的候选项都要求 LM 给出能否得到 24 的评估“sure/maybe/impossible”一定能/可能/不可能) 。作者讲到“目的是得到经过少量向前尝试就可以验证正确sure的局部解基于太大/太小的常识消除那些不可能impossible的局部解其余的局部解作为maybe保留。”每步思维都要抽样得到 3 个评估结果。整个过程如下图所示:
ToT 完成算 24 的游戏任务要执行广度优先搜索BFS每步思维的候选项都要求 LM 给出能否得到 24 的评估“sure/maybe/impossible”一定能/可能/不可能) 。作者讲到“目的是得到经过少量向前尝试就可以验证正确sure的局部解基于太大/太小的常识消除那些不可能impossible的局部解其余的局部解作为maybe保留。”每步思维都要抽样得到 3 个评估结果。整个过程如下图所示:
<Screenshot src={TOT2} alt="TOT2" />
图片援引自:[Yao et el. (2023)](https://arxiv.org/abs/2305.10601)