You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Prompt-Engineering-Guide/pages/techniques/dsp.ca.mdx

16 lines
827 B
Markdown

# Estimulació d'Estímuls Directius
import { Callout, FileTree } from 'nextra-theme-docs'
import {Screenshot} from 'components/screenshot'
import DSP from '../../img/dsp.jpeg'
[Li et al., (2023)](https://arxiv.org/abs/2302.11520) proposen una nova tècnica d'estimulació per guiar millor el LLM en la generació del resum desitjat.
Es forma un LM de política ajustable per generar l'estímul/suggeriment. S'observa un ús més ampli de RL per optimitzar els LLM.
La figura de sota mostra com l'Estimulació d'Estímuls Directius es compara amb l'estimulació estàndard. El LM de política pot ser petit i optimitzat per generar les pistes que guien un LLM congelat de caixa negra.
<Screenshot src={DSP} alt="DSP" />
Font de la imatge: [Li et al., (2023)](https://arxiv.org/abs/2302.11520)
Exemple complet properament!