You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Prompt-Engineering-Guide/pages/techniques/art.tr.mdx

24 lines
2.1 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# Otomatik Akıl Yürütme ve Araç Kullanımı (ART)
import { Callout, FileTree } from 'nextra-theme-docs'
import {Screenshot} from 'components/screenshot'
import ART from '../../img/ART.png'
import ART2 from '../../img/ART2.png'
CoT yönlendirmeyi ve araçları birbirine sıralı bir şekilde entegre etmek, LLM'ler ile birçok görevi ele almak için güçlü ve sağlam bir yaklaşım olduğunu kanıtlamıştır. Bu yöntemler genellikle görev özelinde elle oluşturulan gösterimler ve model üretimlerinin araç kullanımı ile dikkatlice senaryolaştırılmış birleştirmesi gerektirir. [Paranjape ve diğerleri, (2023)](https://arxiv.org/abs/2303.09014) dondurulmuş bir LLM'yi kullanarak bir program olarak ara akıl yürütme adımlarını otomatik olarak oluşturan yeni bir çerçeve önermektedir.
ART şu şekilde çalışır:
- yeni bir görev verildiğinde, görev kütüphanesinden çoklu adım akıl yürütme ve araç kullanımı gösterimlerini seçer
- test zamanında, dış araçlar çağrıldığında üretimi duraklatır ve üretimi yeniden başlatmadan önce çıktılarını entegre eder
ART, modelin gösterimlerden genelleme yaparak yeni bir görevi parçalara ayırmaya ve araçları uygun yerlerde kullanmaya teşvik eder; bu da sıfır-atışlı bir yöntemdir. Ek olarak, ART genişletilebilirdir çünkü ayrıca insanların akıl yürütme adımlarındaki hataları düzeltmelerine veya yalnızca görev ve araç kütüphanelerini güncelleyerek yeni araçlar eklemelerine olanak tanır. Süreç aşağıda gösterilmiştir:
<Screenshot src={ART} alt="ART" />
Resmin Kaynağı: [Paranjape ve diğerleri, (2023)](https://arxiv.org/abs/2303.09014)
ART, BigBench ve MMLU ölçütlerinde görülmemiş görevlere, az-atışlı yönlendirmeyi ve otomatik CoT'yi büyük ölçüde geliştirmekte ve insan geri bildirimi dahil edildiğinde elle oluşturulan CoT yönlendirmelerinin performansını aşmaktadır.
Aşağıda, ART'ın BigBench ve MMLU görevlerindeki performansını gösteren bir tablo bulunmaktadır:
<Screenshot src={ART2} alt="ART2" />
Resmin Kaynağı: [Paranjape ve diğerleri, (2023)](https://arxiv.org/abs/2303.09014)