RAG Mimarileri: Kurumsal Yapay Zeka Rehberi

Büyük dil modelleri etkileyici yetenekler sunuyor; ancak kurumsal kullanımda iki temel engelle karşılaşıyor: Modeller şirketinizin iç bilgisini bilmiyor ve bilmediği konularda kendinden emin biçimde yanlış yanıtlar üretebiliyor. RAG (Retrieval-Augmented Generation, Getirimle Zenginleştirilmiş Üretim) mimarisi, bu iki sorunu modeli yeniden eğitmeden çözen pratik bir yaklaşımdır: Kullanıcının sorusuyla ilgili belgeler önce kurumsal bilgi tabanından bulunur, ardından modele bağlam olarak verilir ve yanıt bu kaynaklara dayanarak üretilir. Bu rehberde, üretim ortamına taşınabilir bir RAG sistemi kurmanın yapı taşlarını ele alıyoruz.

RAG Neden İnce Ayardan (Fine-Tuning) Önce Gelir?

Kurumsal bilgiyi modele kazandırmanın iki yolu vardır: Modeli kendi verinizle yeniden eğitmek (fine-tuning) veya bilgiyi sorgu anında bağlam olarak sunmak (RAG). Sık sorulan "hangisini seçmeliyiz?" sorusunun yanıtı, çoğu kurumsal senaryo için nettir: Başlangıç noktası RAG olmalıdır, çünkü:

Güncellik: Bilgi tabanına eklenen belge anında kullanılabilir; ince ayar ise her güncellemede yeniden eğitim gerektirir.
Kaynak gösterme: RAG, yanıtın hangi belgeye dayandığını gösterebilir; bu, kurumsal güven ve denetlenebilirlik için kritiktir.
Erişim denetimi: Kullanıcının yetkisi olmayan belgeler getirim aşamasında filtrelenebilir; ince ayarda modele giren bilgi herkese açılır.
Maliyet: Eğitim altyapısı gerektirmez; mevcut modellerle çalışır.

İnce ayar; üslup kazandırma, dar alanda biçimsel tutarlılık ve özel görev formatları için anlamlıdır. İki teknik rakip değildir, gerektiğinde birlikte kullanılır.

Mimari Bileşenler: Veri Hattından Yanıta

Bir RAG sistemi, kabaca iki hattan oluşur. Hazırlık hattında belgeler toplanır, temizlenir, parçalara bölünür (chunking), gömme (embedding) modeliyle vektörlere dönüştürülür ve bir vektör veritabanına yazılır. Sorgu hattında ise kullanıcının sorusu aynı gömme uzayına çevrilir, en ilgili parçalar getirilir, gerekiyorsa yeniden sıralanır (reranking) ve seçilen bağlam, özenle kurgulanmış bir istemle dil modeline iletilir. Vektör veritabanı seçenekleri geniştir: Özel çözümlerin yanı sıra PostgreSQL'in pgvector eklentisi gibi mevcut altyapıyla bütünleşen seçenekler, çoğu kurumsal ölçekte fazlasıyla yeterlidir ve operasyonel yük eklemez.

Sahada kaliteyi belirleyen, model seçiminden çok bu hattın mühendisliğidir:

Parçalama stratejisi: Belgeleri rastgele sabit uzunlukta kesmek yerine başlık ve bölüm yapısına saygılı parçalama, getirim isabetini belirgin biçimde artırır. Parça boyutu, içerik türüne göre denenerek ayarlanmalıdır.
Hibrit arama: Yalnızca vektör benzerliği, ürün kodu ve özel ad gibi birebir eşleşme gerektiren sorgularda zayıf kalır. Anahtar kelime aramasıyla (BM25) vektör aramasını birleştiren hibrit yaklaşım, pratikte en sağlam sonucu verir.
Yeniden sıralama: Getirilen yirmi adaydan en iyi beşini seçen bir reranker modeli, bağlam kalitesini yükselterek halüsinasyonu azaltır.
Meta veri filtreleri: Tarih, departman, belge türü ve erişim yetkisi gibi alanlarla getirimi daraltmak hem isabeti hem güvenliği artırır.

Kaliteyi Ölçmeden Üretime Çıkmayın

RAG projelerinin en sık atlanan adımı değerlendirmedir. "Demoda iyi görünüyor" ile "üretimde güvenilir" arasındaki farkı ancak sistematik ölçüm kapatır; demo birkaç elle seçilmiş soruda parlar, üretim ise binlerce öngörülemeyen soruyla sınanır. Pratik yöntem şudur: Alan uzmanlarıyla birlikte gerçek kullanıcı sorularından oluşan bir değerlendirme seti hazırlayın ve her sürümde iki ekseni ölçün: Getirim kalitesi (doğru belgeler bulunuyor mu?) ve üretim kalitesi (yanıt, getirilen bağlama sadık mı, soruyu karşılıyor mu?). Bu ölçümler otomatikleştirilebilir; LLM tabanlı değerlendiriciler insan değerlendirmesinin yerini tamamen tutmasa da regresyonları yakalamak için yeterlidir. Parçalama boyutu, gömme modeli veya istem şablonu değiştiğinde etkisini sayıyla görmek, RAG geliştirmeyi tahmin işinden mühendisliğe dönüştürür.

Güvenlik ve KVKK Boyutu

Kurumsal RAG sistemleri, doğası gereği hassas veriyle çalışır. Tasarımda üç ilke gözetilmelidir. Birincisi, erişim denetimi getirim katmanında uygulanmalıdır: Kullanıcı, normalde göremeyeceği bir belgenin içeriğini sohbet arayüzünden de öğrenememelidir. İkincisi, istem enjeksiyonuna karşı önlem alınmalıdır: Bilgi tabanındaki bir belgenin içine yerleştirilmiş kötü niyetli talimatlar, modelin davranışını değiştirmeye çalışabilir; sistem istemlerinin sağlamlaştırılması ve çıktı denetimleri gerekir. Üçüncüsü, kişisel verilerin işlenmesi KVKK kapsamında değerlendirilmelidir: Hangi verilerin gömme modeline ve dil modeline gönderildiği, verinin yurt dışına aktarılıp aktarılmadığı ve log kayıtlarında nelerin tutulduğu belgelenmeli; gerekiyorsa kurum içinde barındırılan modeller tercih edilmelidir.

Gelişmiş Desenler: Sorgu Dönüştürme ve Agentic RAG

Temel RAG hattı olgunlaştıktan sonra kaliteyi yükselten bir dizi gelişmiş teknik devreye alınabilir. Sorgu dönüştürme, kullanıcının dağınık sorusunu getirime daha uygun biçime çevirir: Soru yeniden yazılabilir, alt sorulara bölünebilir veya varsayımsal bir yanıt üretilip onun gömmesiyle arama yapılabilir (HyDE). Çok adımlı senaryolarda ise "agentic RAG" yaklaşımı öne çıkıyor: Model, tek seferde yanıt üretmek yerine hangi kaynaklarda arama yapacağına karar verir, ara sonuçları değerlendirir ve gerekirse yeni aramalar yaparak yanıtı adım adım kurar. Belgeler arası ilişkilerin önemli olduğu alanlarda bilgi grafiğiyle desteklenen GraphRAG varyantları da değerlendirilebilir. Bu tekniklerin her biri gecikme ve maliyet ekler; basit hattın yetersiz kaldığı ölçülmeden karmaşıklığa geçilmemelidir.

Sahadan Öğrenilen Dersler

Çöp giren çöp çıkar: RAG, bilgi tabanınızın kalitesini yansıtır. Güncelliğini yitirmiş ve çelişen belgelerle dolu bir arşiv üzerine kurulan sistem, çelişkili yanıtlar üretir. Projeye içerik temizliğiyle başlayın.
Dar kapsamla başlayın: "Tüm şirket bilgisine cevap veren asistan" yerine tek bir alanda (ör. insan kaynakları politikaları veya teknik destek dokümanları) derinleşen bir pilot, çok daha hızlı değer üretir ve ölçülebilir bir başarı hikâyesiyle sonraki yatırımın önünü açar.
"Bilmiyorum" demeyi öğretin: Bağlamda yanıt yoksa modelin bunu açıkça söylemesi, kendinden emin bir yanlış yanıttan her zaman iyidir; istem tasarımında bu davranışı açıkça isteyin ve değerlendirme setinizde yanıtı olmayan sorulara da yer verin.
Geri bildirim döngüsü kurun: Kullanıcıların yanıtları puanlayabilmesi, hem sorunlu belgeleri hem de kapsam boşluklarını ortaya çıkarır; bu sinyaller değerlendirme setinizi sürekli zenginleştirir.
Gecikme bütçesi belirleyin: Getirim, yeniden sıralama ve üretim adımlarının her biri süre ekler; kullanıcı deneyimi için uçtan uca yanıt süresine baştan bir hedef koyun ve her bileşeni buna göre seçin.

Sonuç

RAG, büyük dil modellerini kurumsal gerçekliğe bağlayan en olgun mimari desendir: Güncel bilgi, kaynak gösterme ve erişim denetimi sunarken altyapı maliyetini makul tutar. Teknoloji yığını hızla evrilse de buradaki temel ilkeler kalıcıdır. Başarının anahtarı modelde değil; veri hattının kalitesinde, sistematik değerlendirmede ve güvenlik tasarımındadır. OPEIS Teknoloji olarak, kurumsal bilgi tabanlarıyla bütünleşik yapay zeka çözümleri tasarlıyor ve RAG projelerini fikir aşamasından üretime taşıyoruz. Kurumunuz için bir keşif çalışmasıyla başlamak isterseniz bizimle iletişime geçebilirsiniz.

RAG Mimarileri: Kurumsal Yapay Zeka Uygulamaları için Pratik Rehber

RAG Neden İnce Ayardan (Fine-Tuning) Önce Gelir?

Mimari Bileşenler: Veri Hattından Yanıta

Kaliteyi Ölçmeden Üretime Çıkmayın

Güvenlik ve KVKK Boyutu

Gelişmiş Desenler: Sorgu Dönüştürme ve Agentic RAG

Sahadan Öğrenilen Dersler

Sonuç

İlgili Yazılar

Yapay Zeka ile İş Süreçlerini Optimize Etme

Üretken Yapay Zeka (Generative AI) ile İş Süreçlerinde Dönüşüm: 2026 Vizyonu

Sizi Arayalım

Çerez Bilgilendirmesi