Merge pull request #266 from kiner-tang/main-1

docs: Update tot.zh.mdx
pull/272/head
Elvis Saravia 1 year ago committed by GitHub
commit 00f6655129
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

@ -17,7 +17,7 @@ ToT 框架原理如下:
ToT 需要针对不同的任务定义思维/步骤的数量以及每步的候选项数量。例如,论文中的“算 24 游戏”是一种数学推理任务,需要分成 3 个思维步骤每一步都需要一个中间方程。而每个步骤保留最优的best 5 个候选项。
ToT 完成算 24 的游戏任务要执行度优先搜索BFS每步思维的候选项都要求 LM 给出能否得到 24 的评估“sure/maybe/impossible”一定能/可能/不可能) 。作者讲到“目的是得到经过少量向前尝试就可以验证正确sure的局部解基于太大/太小的常识消除那些不可能impossible的局部解其余的局部解作为maybe保留。”每步思维都要抽样得到 3 个评估结果。整个过程如下图所示:
ToT 完成算 24 的游戏任务要执行广度优先搜索BFS每步思维的候选项都要求 LM 给出能否得到 24 的评估“sure/maybe/impossible”一定能/可能/不可能) 。作者讲到“目的是得到经过少量向前尝试就可以验证正确sure的局部解基于太大/太小的常识消除那些不可能impossible的局部解其余的局部解作为maybe保留。”每步思维都要抽样得到 3 个评估结果。整个过程如下图所示:
<Screenshot src={TOT2} alt="TOT2" />
图片援引自:[Yao et el. (2023)](https://arxiv.org/abs/2305.10601)
@ -40,4 +40,4 @@ ToT 完成算 24 的游戏任务要执行宽度优先搜索BFS每步思
以此类推,直到所有专家写完他们思考的所有步骤。
只要大家发现有专家的步骤出错了,就让这位专家离开。
请问...
```
```

Loading…
Cancel
Save