mirror of
https://github.com/dair-ai/Prompt-Engineering-Guide
synced 2024-11-02 15:40:13 +00:00
16 lines
827 B
Plaintext
16 lines
827 B
Plaintext
# Estimulació d'Estímuls Directius
|
|
|
|
import { Callout, FileTree } from 'nextra-theme-docs'
|
|
import {Screenshot} from 'components/screenshot'
|
|
import DSP from '../../img/dsp.jpeg'
|
|
|
|
[Li et al., (2023)](https://arxiv.org/abs/2302.11520) proposen una nova tècnica d'estimulació per guiar millor el LLM en la generació del resum desitjat.
|
|
|
|
Es forma un LM de política ajustable per generar l'estímul/suggeriment. S'observa un ús més ampli de RL per optimitzar els LLM.
|
|
|
|
La figura de sota mostra com l'Estimulació d'Estímuls Directius es compara amb l'estimulació estàndard. El LM de política pot ser petit i optimitzat per generar les pistes que guien un LLM congelat de caixa negra.
|
|
|
|
<Screenshot src={DSP} alt="DSP" />
|
|
Font de la imatge: [Li et al., (2023)](https://arxiv.org/abs/2302.11520)
|
|
|
|
Exemple complet properament! |