Prompt-Engineering-Guide/pages/techniques/zeroshot.it.mdx

24 lines
1.5 KiB
Plaintext
Raw Normal View History

2023-04-14 07:54:31 +00:00
# Prompt Zero-Shot
2024-01-13 11:27:52 +00:00
I grandi LLM di oggi, come GPT-3, sono regolati per seguire le istruzioni e sono addestrati su grandi quantità di dati; quindi sono in grado di eseguire alcuni compiti "zero-shot".
2023-04-12 14:41:11 +00:00
2024-01-13 11:27:52 +00:00
Nella sezione precedente abbiamo provato alcuni esempi zero-shot. Ecco uno degli esempi utilizzati:
2023-04-12 14:41:11 +00:00
*Prompt:*
```
2023-04-13 12:30:15 +00:00
Classificare il testo in neutro, negativo o positivo.
2023-04-12 14:41:11 +00:00
2024-01-13 11:27:52 +00:00
Testo: Penso che le vacanze siano ok.
2023-04-13 12:30:15 +00:00
Sentimento:
2023-04-12 14:41:11 +00:00
```
*Output:*
```
2023-04-13 12:30:15 +00:00
Neutro
2023-04-12 14:41:11 +00:00
```
2024-01-13 11:27:52 +00:00
Si noti che nel prompt non abbiamo fornito al modello alcun esempio di testo insieme alle relative classificazioni; l'LLM capisce già il "sentiment": si tratta delle capacità zero-shot al lavoro.
2023-04-12 14:41:11 +00:00
La messa a punto delle istruzioni ha dimostrato di migliorare l'apprendimento zero-shot [Wei et al. (2022)](https://arxiv.org/pdf/2109.01652.pdf). La messa a punto delle istruzioni è essenzialmente il concetto di perfezionamento dei modelli su insiemi di dati descritti tramite istruzioni. Inoltre, l'[RLHF](https://arxiv.org/abs/1706.03741) (reinforcement learning from human feedback, apprendimento per rinforzo dal feedback umano) è stato adottato per scalare la messa a punto delle istruzioni, in cui il modello viene allineato per adattarsi meglio alle preferenze umane. Questo recente sviluppo alimenta modelli come ChatGPT. Discuteremo tutti questi approcci e metodi nelle prossime sezioni.
2023-04-13 12:30:15 +00:00
Quando zero-shot non funziona, si raccomanda di fornire dimostrazioni o esempi nel prompt, il che porta ai prompt few-shot. Nella prossima sezione mostreremo i prompt few-shot.
2023-04-12 14:41:11 +00:00