2023-03-30 19:09:04 +00:00
|
|
|
|
# 方向性刺激提示
|
|
|
|
|
|
|
|
|
|
import { Callout, FileTree } from 'nextra-theme-docs'
|
|
|
|
|
import {Screenshot} from 'components/screenshot'
|
|
|
|
|
import DSP from '../../img/dsp.jpeg'
|
|
|
|
|
|
2024-03-02 10:47:57 +00:00
|
|
|
|
[Li 等人,(2023)](https://arxiv.org/abs/2302.11520)提出了一种新的提示技术,以更好地指导 LLM 生成所需的摘要。
|
2023-03-30 19:09:04 +00:00
|
|
|
|
|
2024-03-02 10:47:57 +00:00
|
|
|
|
训练了一个可调节的策略 LM 来生成刺激/提示。越来越多地使用RL来优化 LLM。
|
2023-03-30 19:09:04 +00:00
|
|
|
|
|
2024-03-02 10:47:57 +00:00
|
|
|
|
下图显示了方向性刺激提示与标准提示的比较。策略 LM 可以很小,并且可以优化以生成指导黑盒冻结 LLM 的提示。
|
2023-03-30 19:09:04 +00:00
|
|
|
|
|
|
|
|
|
<Screenshot src={DSP} alt="DSP" />
|
2024-03-02 10:47:57 +00:00
|
|
|
|
图片来源:[Li 等人,(2023)](https://arxiv.org/abs/2302.11520)
|
2023-03-30 19:09:04 +00:00
|
|
|
|
|
|
|
|
|
完整示例即将推出!
|