Prompt-Engineering-Guide/pages/techniques/dsp.fi.mdx

16 lines
885 B
Plaintext
Raw Normal View History

2023-05-19 19:24:17 +00:00
# Suuntaa Antava Kehottaminen
import { Callout, FileTree } from 'nextra-theme-docs'
import {Screenshot} from 'components/screenshot'
import DSP from '../../img/dsp.jpeg'
[Li ym., (2023)](https://arxiv.org/abs/2302.11520) ehdottaa uutta kehotetekniikkaa, joka ohjaa LLM:ää paremmin halutun yhteenvedon tuottamiseen.
Säädettävä menettelytapa kielimalli koulutetaan tuottamaan vihjeitä/kannusteita. Kielimallien optimointiin käytetään yhä enemmän vahvistusoppimista (Reinforcement Learning, RL).
Alla oleva kuva näyttää, miten suuntaa antava kehotetekniikka vertautuu tavanomaiseen kehotetekniikkaan. Menettelytapa-kielimalli voi olla pieni ja optimoitu tuottamaan vihjeitä, jotka ohjaavat "mustaan laatikkoon jäädytettyä" LLM:ää.
<Screenshot src={DSP} alt="DSP" />
Kuvan lähde: [Li ym., (2023)](https://arxiv.org/abs/2302.11520)
Täysi esimerkki tulossa pian!