You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Prompt-Engineering-Guide/pages/techniques/dsp.de.mdx

17 lines
896 B
Markdown

# Directional Stimulus Prompting
import { Callout, FileTree } from 'nextra-theme-docs'
import {Screenshot} from 'components/screenshot'
import DSP from '../../img/dsp.jpeg'
[Li et al., (2023)](https://arxiv.org/abs/2302.11520) schlagen eine neue Prompting-Technik vor, um den LLM bei der Erzeugung der gewünschten Zusammenfassung besser zu leiten.
Ein abstimmbarer Policy-LM wird trainiert, um den Stimulus/Hinweis zu generieren. Man sieht einen vermehrten Einsatz von RL, um LLMs zu optimieren.
Die untenstehende Abbildung zeigt, wie sich Directional Stimulus Prompting im Vergleich zum standard Prompting verhält. Der Policy-LM kann klein sein und optimiert werden, um die Hinweise zu generieren, die einen Black-Box gefrorenen LLM leiten.
<Screenshot src={DSP} alt="DSP" />
Bildquelle: [Li et al., (2023)](https://arxiv.org/abs/2302.11520)
Ein vollständiges Beispiel folgt in Kürze!