You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Prompt-Engineering-Guide/pages/techniques/consistency.zh.mdx

66 lines
3.8 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 自我一致性
也许在提示工程中更高级的技术之一是自我一致性。由 [Wang等人2022](https://arxiv.org/pdf/2203.11171.pdf) 提出,自我一致性旨在“替换链式思维提示中使用的天真贪婪解码方法”。其想法是通过少样本 CoT 采样多个不同的推理路径,并使用生成结果选择最一致的答案。这有助于提高 CoT 提示在涉及算术和常识推理的任务中的性能。
让我们尝试以下算术推理示例:
*提示:*
```
当我6岁时我的妹妹是我的一半年龄。现在我70岁了我的妹妹多大
```
*输出:*
```
35
```
输出是错误的!我们如何通过自我一致性来改进这个问题?让我们试试。我们将使用 Wang 等人 2022 年的少量样本范例(表 17
*提示:*
```
Q林中有15棵树。林业工人今天将在林中种树。完成后将有21棵树。林业工人今天种了多少棵树
A我们从15棵树开始。后来我们有21棵树。差异必须是他们种树的数量。因此他们必须种了21-15 = 6棵树。答案是6。
Q停车场有3辆汽车又来了2辆汽车停车场有多少辆汽车
A停车场已经有3辆汽车。又来了2辆。现在有3 + 2 = 5辆汽车。答案是5。
QLeah有32块巧克力她的姐姐有42块。如果他们吃了35块他们总共还剩多少块
ALeah有32块巧克力Leah的姐姐有42块。这意味着最初有32 + 42 = 74块巧克力。已经吃了35块。因此他们总共还剩74-35 = 39块巧克力。答案是39。
QJason有20个棒棒糖。他给Denny一些棒棒糖。现在Jason只有12个棒棒糖。Jason给Denny多少棒棒糖
AJason有20个棒棒糖。因为他现在只有12个所以他必须把剩下的给Denny。他给Denny的棒棒糖数量必须是20-12 = 8个棒棒糖。答案是8。
QShawn有五个玩具。圣诞节他从他的父母那里得到了两个玩具。他现在有多少个玩具
A他有5个玩具。他从妈妈那里得到了2个所以在那之后他有5 + 2 = 7个玩具。然后他从爸爸那里得到了2个所以总共他有7 + 2 = 9个玩具。答案是9。
Q服务器房间里有9台计算机。从周一到周四每天都会安装5台计算机。现在服务器房间里有多少台计算机
A从周一到周四有4天。每天都添加了5台计算机。这意味着总共添加了4 * 5 =
20台计算机。一开始有9台计算机所以现在有9 + 20 = 29台计算机。答案是29。
QMichael有58个高尔夫球。星期二他丢失了23个高尔夫球。星期三他又丢失了2个。星期三结束时他还剩多少个高尔夫球
AMichael最初有58个球。星期二他丢失了23个所以在那之后他有58-23 = 35个球。星期三他又丢失了2个所以现在他有35-2 = 33个球。答案是33。
QOlivia有23美元。她用每个3美元的价格买了五个百吉饼。她还剩多少钱
A她用每个3美元的价格买了5个百吉饼。这意味着她花了15美元。她还剩8美元。
Q当我6岁时我的妹妹是我的一半年龄。现在我70岁了我的妹妹多大
A
```
*输出 1*
```
当我6岁时我的妹妹是我的一半年龄也就是3岁。现在我70岁了所以她是70-3 = 67岁。答案是67。
```
*输出 2*
```
当叙述者6岁时他的妹妹是他年龄的一半也就是3岁。现在叙述者70岁了他的妹妹应该是70-3 = 67岁。答案是67。
```
*输出 3*
```
当我6岁时我的妹妹是我的一半年龄也就是3岁。现在我70岁了所以她是70/2 = 35岁。答案是35。
```
计算最终答案涉及几个步骤(详见论文),但为了简单起见,我们可以看到已经出现了大多数答案,因此这基本上将成为最终答案。