You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
|
|
# 方向性刺激プロンプティング
|
|
|
|
|
|
|
|
|
|
import { Callout, FileTree } from 'nextra-theme-docs'
|
|
|
|
|
import {Screenshot} from 'components/screenshot'
|
|
|
|
|
import DSP from '../../img/dsp.jpeg'
|
|
|
|
|
|
|
|
|
|
[Li et al.、(2023)](https://arxiv.org/abs/2302.11520)は、望ましい要約を生成するためにLLMをより適切に誘導するための新しいプロンプティング技術を提案しています。
|
|
|
|
|
|
|
|
|
|
調整可能なポリシーLMは、刺激/ヒントを生成するためにトレーニングされます。RLの使用がLLMの最適化により多く見られるようになっています。
|
|
|
|
|
|
|
|
|
|
以下の図は、方向性刺激プロンプティング(Directional Stimulus Prompting)が標準的なプロンプティングと比較した場合の様子を示しています。ポリシーLMは小さく、ブラックボックスの凍結LLMを誘導するヒントを生成するために最適化されます。
|
|
|
|
|
|
|
|
|
|
<Screenshot src={DSP} alt="DSP" />
|
|
|
|
|
Image Source: [Li et al., (2023)](https://arxiv.org/abs/2302.11520)
|
|
|
|
|
|
|
|
|
|
具体的な例は近日中に公開します!
|