Prompt-Engineering-Guide/pages/techniques/consistency.zh.mdx

66 lines
3.7 KiB
Plaintext
Raw Normal View History

2023-03-30 19:09:04 +00:00
# 自我一致性
也许在提示工程中更高级的技术之一是自我一致性。由[Wang等人2022](https://arxiv.org/pdf/2203.11171.pdf)提出自我一致性旨在“替换链式思维提示中使用的天真贪婪解码方法”。其想法是通过少样本CoT采样多个不同的推理路径并使用生成结果选择最一致的答案。这有助于提高CoT提示在涉及算术和常识推理的任务中的性能。
让我们尝试以下算术推理示例:
*提示:*
```
当我6岁时我的妹妹是我的一半年龄。现在我70岁了我的妹妹多大
2023-03-30 19:09:04 +00:00
```
*输出:*
```
35
```
输出是错误的我们如何通过自我一致性来改进这个问题让我们试试。我们将使用Wang等人2022年的少量样本范例表17
*提示:*
```
Q林中有15棵树。林业工人今天将在林中种树。完成后将有21棵树。林业工人今天种了多少棵树
A我们从15棵树开始。后来我们有21棵树。差异必须是他们种树的数量。因此他们必须种了21-15 = 6棵树。答案是6。
Q停车场有3辆汽车又来了2辆汽车停车场有多少辆汽车
A停车场已经有3辆汽车。又来了2辆。现在有3 + 2 = 5辆汽车。答案是5。
QLeah有32块巧克力她的姐姐有42块。如果他们吃了35块他们总共还剩多少块
ALeah有32块巧克力Leah的姐姐有42块。这意味着最初有32 + 42 = 74块巧克力。已经吃了35块。因此他们总共还剩74-35 = 39块巧克力。答案是39。
QJason有20个棒棒糖。他给Denny一些棒棒糖。现在Jason只有12个棒棒糖。Jason给Denny多少棒棒糖
AJason有20个棒棒糖。因为他现在只有12个所以他必须把剩下的给Denny。他给Denny的棒棒糖数量必须是20-12 = 8个棒棒糖。答案是8。
QShawn有五个玩具。圣诞节他从他的父母那里得到了两个玩具。他现在有多少个玩具
A他有5个玩具。他从妈妈那里得到了2个所以在那之后他有5 + 2 = 7个玩具。然后他从爸爸那里得到了2个所以总共他有7 + 2 = 9个玩具。答案是9。
Q服务器房间里有9台计算机。从周一到周四每天都会安装5台计算机。现在服务器房间里有多少台计算机
A从周一到周四有4天。每天都添加了5台计算机。这意味着总共添加了4 * 5 =
20台计算机。一开始有9台计算机所以现在有9 + 20 = 29台计算机。答案是29。
QMichael有58个高尔夫球。星期二他丢失了23个高尔夫球。星期三他又丢失了2个。星期三结束时他还剩多少个高尔夫球
AMichael最初有58个球。星期二他丢失了23个所以在那之后他有58-23 = 35个球。星期三他又丢失了2个所以现在他有35-2 = 33个球。答案是33。
QOlivia有23美元。她用每个3美元的价格买了五个百吉饼。她还剩多少钱
A她用每个3美元的价格买了5个百吉饼。这意味着她花了5
Q当我6岁时我的妹妹是我的一半年龄。现在我70岁了我的妹妹多大
2023-03-30 19:09:04 +00:00
A
```
*输出1*
```
当我6岁时我的妹妹是我的一半年龄也就是3岁。现在我70岁了所以她是70-3 = 67岁。答案是67。
2023-03-30 19:09:04 +00:00
```
*输出2*
```
当叙述者6岁时他的妹妹是他年龄的一半也就是3岁。现在叙述者70岁了他的妹妹应该是70-3 = 67岁。答案是67。
2023-03-30 19:09:04 +00:00
```
*输出3*
```
当我6岁时我的妹妹是我的一半年龄也就是3岁。现在我70岁了所以她是70/2 = 35岁。答案是35。
2023-03-30 19:09:04 +00:00
```
计算最终答案涉及几个步骤(详见论文),但为了简单起见,我们可以看到已经出现了大多数答案,因此这基本上将成为最终答案。