Sızdırılan ChatGPT 4o Sistem Promptu: Arama Nasıl Çalışıyor?
Haziran 2025'te sızdırılan ChatGPT 4o sistem promptu, OpenAI'nin perde arkasındaki kural kitabını tüm detaylarıyla gün yüzüne çıkardı. Her sohbetin başında bağlam penceresine (context window) enjekte edilen bu gizli talimatlar, yapay zekanın arama motoru optimizasyonu (SEO) dinamiklerini ve canlı web'i nasıl taradığını anlamamız için altın değerinde bilgiler sunuyor.
Bu belgeler, ChatGPT'nin web aramasını tam olarak ne zaman tetiklediğini, eşzamanlı sorguları nasıl yönettiğini, tazelik (freshness) faktörünü nasıl ele aldığını ve URL indeksleme konusundaki en büyük yanılgıları açığa çıkarıyor.

ChatGPT'nin Kendi Arama İndeksi Yok
Sızıntıdan elde edilen en kritik bulgu net: ChatGPT kendi URL indeksini tutmuyor.
ChatGPT bir soruyu web araması tetiklemeden yanıtladığında, metni tamamen hafızasından üretiyor. Model, eğitim sürecinde öğrendiği şablonları kullanıyor ancak başvurabileceği dahili bir web sitesi veritabanına sahip değil. Bu modda ürettiği herhangi bir bağlantı (URL), hatırladığı kadarıyla token bazında sıfırdan inşa ediliyor.
Yapay zeka tarafından üretilen bağlantıların neden sıklıkla 404 hata sayfalarına yönlendirdiği bu sayede daha iyi anlaşılıyor. Model, sisteminde saklanan gerçek bir bağlantıyı çekmiyor; sadece eğitim verilerindeki örüntülere dayanarak bir URL'nin neye benzemesi gerektiğini tahmin ediyor.
SISTRIX tarafından yapılan bağımsız bir araştırma, ChatGPT yanıtlarının yalnızca %6'sının çalışan bir bağlantı içerdiğini ortaya koymuştu. Gemini'de ise bu oran %23 seviyesinde. Aradaki bu devasa fark, ChatGPT'nin canlı aramadan ziyade kendi hafızasına daha fazla güvenmesinden kaynaklanıyor.
ChatGPT Web Aramasını Ne Zaman Tetikler?
Sistem promptu, ChatGPT'nin yerleşik bir web() aracına sahip olduğunu gösteriyor. Talimatlar bu aracı, "web'den güncel bilgilere erişmek veya kullanıcının konumuyla ilgili bilgileri işlemek" amacıyla tanımlıyor.
Ancak ChatGPT bu aracı her soruda kullanmıyor. Talimatlarda, "kullanıcı açıkça genel kaynakları tercih etmediği sürece, dahili olarak bilinen bilgiler için web aracını kullanmaktan kaçının" kuralı açıkça belirtiliyor.
Sistem, web aramasını yalnızca şu dört senaryoda zorunlu kılıyor:
- Gerçek zamanlı bilgiler: "Güncel Bitcoin fiyatı nedir?" veya "Dünkü maçı kim kazandı?" gibi anlık değişen, hafızanın yetersiz kalacağı veriler.
- Konuma dayalı sorgular: Kullanıcının lokasyon bağlamını gerektiren aramalar (örneğin çevredeki kahveciler).
- Niş veya spesifik konular: Eğitim verilerinde henüz yer almayan yeni yayımlanmış makaleler veya çok spesifik yerel duyurular.
- Güncelliğini yitirmiş bilginin zarar verebileceği durumlar: "Node.js son sürümü nasıl kurulur?" gibi, eski bilgilerin güvenlik açıklarına veya sistem hatalarına yol açabileceği teknik dokümantasyonlar.
Eğer soru bu kategorilerden birine girmiyorsa, model yanıtı doğrudan hafızasından veriyor ve bu nedenle çoğu yanıtta kaynak bağlantısı bulunmuyor.
Web Arama Aracı Nasıl Çalışıyor?
Sistem promptu, ChatGPT'nin web aramasını tetiklediğinde tek bir sorgu ile yetinmediğini gösteriyor. Model, aynı anda beş adede kadar paralel sorgu çalıştırıyor. Tıpkı bir insanın derinlemesine araştırma yaparken konuyu farklı açılardan incelemesi gibi, yapay zeka da tek bir soruyu parçalara bölerek birden fazla arama açısı yaratıyor ve bunları eşzamanlı olarak tarıyor.
Tazelik Puanlandırması (QDF)
Oluşturulan her sorgu, sistemin "Query Deserved Freshness (Sorgunun Hak Ettiği Tazelik)" adını verdiği bir puan alıyor. Bu puanlama, arama motoruna yeni içeriklerin eski içeriklere göre ne kadar tercih edilmesi gerektiğini söylüyor:
- QDF=0: Tazeliğin önemli olmadığı evrensel bilgileri temsil eder. "Dünyanın yarıçapı" veya "fotosentez nasıl çalışır" gibi sorgularda beş yıl önceki bir içerik ile bugünkü içerik aynı değerdedir.
- QDF=5: Tazeliğin kritik olduğu anlık bilgileri belirtir. "Bugün hava durumu" veya "yeni teknoloji ürünlerinin çıkış tarihi" gibi sorgularda arama motoru son 30 gün içinde yayınlanmış sayfalara çok güçlü bir öncelik verir.
Bu puanlama sistemi, sık değişen konularda güncel içerik yayınlayan platformların ciddi bir avantaja sahip olduğunu kanıtlıyor.
Çok Dilli Sorgu Yedekliliği
Sistem promptundaki en ilginç kurallardan biri dil optimizasyonuyla ilgili. Bir kullanıcı İngilizce dışında bir dilde soru sorduğunda, ChatGPT sorguları hem İngilizce hem de kullanıcının orijinal dilinde yapmak zorunda.
İngilizce içeriklerin web ekosistemindeki hakimiyeti düşünüldüğünde bu kural büyük önem taşıyor. Yapay zeka, teknik bir konuyu kendi dilinde araştıran bir kullanıcıya hem yerel dildeki hem de İngilizce sayfalardan sonuçlar sunuyor. Bu durum marka ve içerik üreticileri için çok net bir strateji ortaya koyuyor: Hedef kitleniz farklı bir dilde olsa bile, içeriklerinizin mutlaka bir İngilizce versiyonunu yayınlayın.
Yapay Zeka Arama Görünürlüğü İçin Ne Anlama Geliyor?
Sızıntı ile kesinleşen bu kurallar, üretken yapay zeka aramalarında (GEO) kaynak olarak gösterilmek için atılması gereken stratejik adımları netleştiriyor:
- Bing tarafından indekslenin: ChatGPT'nin web arama aracı arka planda Bing'i kullanıyor. Eğer siteniz Bing indeksinde yoksa, canlı web araması tetiklendiğinde ChatGPT sizi bulamaz.
- İngilizce versiyonlara yatırım yapın: Çok dilli arama kuralı, İngilizce içeriğin en geniş erişime sahip olduğunu doğruluyor. Diğer dillerdeki içerikleriniz atıf alabilir, ancak bir İngilizce kopyaya sahip olmak görünürlük ihtimalinizi ikiye katlar.
- Çoğu yanıtın hafızadan geldiğini unutmayın: ChatGPT canlı webi sadece zorunlu olduğunda tarar. Markanızın ve içeriklerinizin sadece canlı web'de değil, aynı zamanda büyük dil modellerinin genel eğitim verilerinde de sağlam bir otoriteye sahip olması gerekir.
- Zamana duyarlı içerikleri güncel tutun: QDF (tazelik) skorlaması, haberler, fiyatlar, ürün sürümleri veya sektörel güncellemeler gibi konularda daima en yeni sayfalara öncelik verir. Sürekli evrim geçiren bir alanda içerik üretiyorsanız, sayfalarınızı düzenli olarak güncelleyin.
Not: Sızdırılan prompt analizindeki ilk teknik incelemeler için Hanns Kronenberg'e teşekkür ederiz.
