You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
|
|
# Directional Stimulus Prompting
|
|
|
|
|
|
|
|
|
|
import { Callout, FileTree } from 'nextra-theme-docs'
|
|
|
|
|
import {Screenshot} from 'components/screenshot'
|
|
|
|
|
import DSP from '../../img/dsp.jpeg'
|
|
|
|
|
|
|
|
|
|
[Li et al., (2023)](https://arxiv.org/abs/2302.11520) istenen özeti oluşturmada LLM'ye daha iyi rehberlik etmek için yeni bir yönlendirme tekniği önermektedir.
|
|
|
|
|
|
|
|
|
|
Ayarlanabilir bir politika LM, uyaran/ipucu oluşturmak için eğitilir. LLM'leri optimize etmek için RL'nin daha fazla kullanıldığını görmek.
|
|
|
|
|
|
|
|
|
|
Aşağıdaki şekil, Yönlü Uyaran İsteminin standart yönlendirmeyle karşılaştırmasını göstermektedir. Politika LM'si küçük olabilir ve bir kara kutu dondurulmuş LLM'ye rehberlik eden ipuçlarını oluşturmak için optimize edilebilir.
|
|
|
|
|
|
|
|
|
|
<Screenshot src={DSP} alt="DSP" />
|
|
|
|
|
Resim Kaynağı: [Li et al., (2023)](https://arxiv.org/abs/2302.11520)
|
|
|
|
|
|
|
|
|
|
Tam örnek çok yakında!
|