Fine-tuning mi, RAG mi, Prompt mu? Hangisini Ne Zaman Kullanmalı

Bir yapay zeka projesine başlarken en çok sorulan sorulardan biri şudur: “Modeli kendi verimizle eğitelim mi (fine-tuning), dışarıdan bilgi mi besleyelim (RAG), yoksa sadece iyi bir komut mu yazalım (prompt)?” Üçü de geçerlidir; ama yanlış olanı seçmek size aylar ve ciddi bir bütçe kaybettirebilir. Bu yazıda üç yaklaşımı günlük analojilerle, maliyet–güncellik–doğruluk ekseninde karşılaştırıyor ve sonunda hızlı bir karar tablosu veriyoruz.

Üç yaklaşım, tek cümlede

Karmaşık görünen bu üç kavram aslında modele “bilgiyi ne zaman verdiğinizle” ilgilidir:

Prompt (komut mühendisliği): Modele soruyu sorarken talimatı ve örnekleri siz verirsiniz. Modelin ağırlıklarına dokunmazsınız.
RAG (Retrieval-Augmented Generation): Model cevap üretmeden hemen önce, ilgili belgeleri bir veritabanından çekip isteme ekler. Bilgi dışarıda, taze ve değiştirilebilir kalır.
Fine-tuning (ince ayar): Modeli kendi örnekleriniz üzerinde yeniden eğitirsiniz; bilgi ve davranış modelin ağırlıklarına işler.

Pratik kural: Prompt davranışı şekillendirir, RAG bilgiyi taze tutar, fine-tuning üslubu ve formatı kalıcı hâle getirir.

Sınava giren öğrenci analojisi

Bir öğrenciyi sınava hazırladığınızı düşünün:

Prompt, sınav sorusunu net yazmak gibidir: “Cevabı üç maddede ve resmî bir dille ver.” Doğru yönlendirme çoğu zaman tek başına şaşırtıcı sonuç verir.
RAG, açık kitap sınavı gibidir: Öğrenci her şeyi ezberlemez; soruyla ilgili sayfayı açıp oradan okur. Kitap güncellenince cevap da güncellenir.
Fine-tuning, aylarca süren bir kurs gibidir: Öğrenci konuyu içselleştirir, refleks kazanır. Ama müfredat değişirse kursu tekrar almak gerekir.

İpucu: Çoğu ekibin hatası, en pahalı yoldan (fine-tuning) başlamaktır. Önce prompt’u zorlayın, sonra RAG ekleyin; fine-tuning’i yalnızca ölçülebilir bir ihtiyaç ortaya çıkınca düşünün.

Maliyet açısından karşılaştırma

Maliyeti iki kalemde düşünmek gerekir: kurulum (bir kerelik) ve çalıştırma (her istekte).

Prompt: Kurulum maliyeti neredeyse sıfır. Tek dikkat edilmesi gereken, uzun talimatların her istekte token tükettiği ve istemi şişirebileceğidir.
RAG: Orta düzey kurulum: belgeleri parçalama (chunking), gömme (embedding) ve bir vektör veritabanı gerekir. Çalıştırmada her istek biraz daha uzar, çünkü çekilen belgeler isteme eklenir.
Fine-tuning: En yüksek kurulum maliyeti: kaliteli etiketli veri, eğitim süresi ve uzmanlık ister. Buna karşılık çalışma anında istemi kısaltabildiği için tekil istek maliyetini bazen düşürür.

Güncellik açısından karşılaştırma

Bilginiz ne sıklıkla değişiyor? Bu soru genellikle kararı tek başına belirler.

RAG burada açık ara önde: Yeni bir belge eklemek, onu indekslemek kadar kolaydır; modeli yeniden eğitmenize gerek yoktur. Fiyat listeleri, mevzuat, ürün dokümanları gibi sık değişen içerikler için idealdir.
Fine-tuning durağandır: Modele işlediğiniz bilgi “dondurulur”. Bilgi değişince yeni bir eğitim turu gerekir, bu da gecikme ve maliyet demektir.
Prompt anlıktır ama bilgiyi siz isteme elle koyduğunuz sürece günceldir; büyük bilgi tabanları için ölçeklenmez.

Doğruluk açısından karşılaştırma

Doğruluk tek bir şey değildir; “hangi tür doğruluk?” diye sormak gerekir.

Olgusal doğruluk ve kaynak gösterme için RAG güçlüdür: Cevaplar gerçek belgelere dayanır ve atıf verilebilir, bu da uydurma (halüsinasyon) riskini azaltır.
Üslup, format ve alana özgü davranış için fine-tuning güçlüdür: Modelin her seferinde tutarlı bir biçimde, doğru terminolojiyle cevap vermesini sağlar.
Prompt ile de yüksek doğruluk mümkündür, ama tutarlılık talimatın kalitesine bağlı kalır ve karmaşık görevlerde dalgalanabilir.

Özetle: “Ne söylediği” genelde RAG’in, “nasıl söylediği” genelde fine-tuning’in işidir.

Bir karar akışı (pseudocode)

Aşağıdaki basit sözde-kod, çoğu projede doğru sıralamayı yakalar:

def yaklasim_sec(gorev):
    # 1. Adım: Önce en ucuz yolu dene
    if iyi_prompt_yeterli(gorev):
        return "Prompt"

    # 2. Adım: Bilgi dışarıda ve değişken mi?
    if harici_bilgi_gerek(gorev) or bilgi_sik_degisir(gorev):
        cozum = "RAG"
        # Üslup/format hâlâ tutarsızsa ekle
        if uslup_tutarsiz(gorev):
            cozum += " + Fine-tuning"
        return cozum

    # 3. Adım: Sabit, derin, üslup-yoğun davranış
    if buyuk_etiketli_veri_var(gorev) and uslup_kritik(gorev):
        return "Fine-tuning"

    return "Prompt"  # şüphedeyken en yalın çözüm

Karar tablosu

Hızlı bir referans için:

Bilgi sık değişiyor → RAG
Kaynak/atıf gerekiyor → RAG
Sınırlı bütçe, hızlı başlangıç → Prompt
Tutarlı üslup/format/terminoloji → Fine-tuning
Çok dar, tekrarlayan, sabit bir görev → Fine-tuning
Geniş, taze bir bilgi tabanı + tutarlı üslup → RAG + Fine-tuning
Belirsiz veya prototip aşaması → Prompt (sonra RAG)

İkisini birden kullanmak

Bu üçü rakip değil, katmandır. Olgun bir sistem genellikle hepsini bir arada kullanır: net bir prompt ile davranışı belirler, RAG ile cevabı güncel belgelere bağlar ve gerekiyorsa fine-tuning ile alanına özgü üslubu kalıcılaştırır. Örneğin hukuk gibi hem güncel hem de terminolojiye duyarlı bir alanda, RAG’in tazeliğiyle ince ayarın tutarlılığı birbirini tamamlar.

Öne çıkanlar

Prompt davranışı şekillendirir, RAG bilgiyi taze tutar, fine-tuning üslubu kalıcılaştırır.
En ucuzdan başlayın: önce prompt, sonra RAG, en son fine-tuning.
Bilgi sık değişiyorsa veya kaynak gerekiyorsa RAG neredeyse her zaman doğru seçimdir.
Fine-tuning bilgiyi değil, asıl olarak üslubu ve formatı öğretmek için güçlüdür.
Olgun sistemler üçünü birlikte kullanır; bunlar rakip değil katmandır.

RAG kullanıyorsam fine-tuning’e hiç gerek kalmaz mı?

Çoğu bilgi-yoğun senaryoda RAG tek başına yeterlidir. Fine-tuning’e asıl ihtiyaç, cevabın içeriği değil biçimi (üslup, format, terminoloji) tutarsız kaldığında ortaya çıkar.

Fine-tuning modele yeni güncel bilgi öğretmez mi?

Öğretebilir, ama bilgi “dondurulur”. İçerik değiştiğinde yeniden eğitim gerekir. Sık değişen bilgiyi taze tutmanın daha ucuz ve hızlı yolu RAG’dir.

Küçük bir ekip için en mantıklı başlangıç hangisi?

Neredeyse her zaman prompt ile başlayın; ölçülebilir bir sınıra çarpınca RAG ekleyin. Fine-tuning’i ancak net, tekrar eden bir ihtiyaç doğunca düşünün, çünkü en yüksek kurulum maliyetine ve uzmanlığa o ihtiyaç duyar.

Doğru yaklaşım, projenizin sorununa göre değişir; çoğu zaman cevap “üçünden biri” değil, “doğru sırayla hepsi”dir. Bilgiyi gerçek belgelere bağlayan RAG mimarisini pratikte nasıl kurduğumuzu merak ediyorsanız, Türkçe yapay zeka ürünleri geliştiren EcoFluxion’ın yaklaşımına göz atabilir; hukuk alanındaki uygulamasını İçtiHub üzerinden inceleyebilirsiniz.

Fine-tuning mi, RAG mi, Prompt mu? Hangisini Ne Zaman Kullanmalı

İçindekiler

Üç yaklaşım, tek cümlede

Sınava giren öğrenci analojisi

Maliyet açısından karşılaştırma

Güncellik açısından karşılaştırma

Doğruluk açısından karşılaştırma

Bir karar akışı (pseudocode)

Karar tablosu

İkisini birden kullanmak

Öne çıkanlar

İsmail Tarık Şenkal