WebGPT

GPT-3 Alternatif Büyük Dil Modelleri (LLM’ler)

Web’de arama yapabilen bir GPT-3 versiyonu.

Website

WebGPT Hakkında

OpenAI, GPT-3’ün web’de arama yapabilen, bilgileri sentezleyebilen ve sorulara daha doğru yanıtlar verebilmek için kaynaklarına atıfta bulunabilen bir araştırma versiyonunu eğitmiştir.

GPT-3 gibi dil modelleri birçok farklı görev için kullanışlıdır, ancak gerçek dünya bilgisinin belirsiz olmasını gerektiren görevleri yerine getirirken bilgileri “halüsinasyon” görme eğilimindedir.23 Bunu ele almak için OpenAI, GPT-3’e metin tabanlı bir web tarayıcısı kullanmayı öğretti. Modele açık uçlu bir soru ve tarayıcı durumunun bir özeti verilir ve “Ara …”, “Sayfada bul: …” veya “Alıntı yap: …”. Bu şekilde, model web sayfalarından pasajlar toplar ve daha sonra bunları bir cevap oluşturmak için kullanır.

Model, daha önce kullanılan genel yöntemler kullanılarak GPT-3’ten ince ayarlanmıştır. OpenAI, insan tercihlerini tahmin etmek için bir ödül modeli eğiterek ve takviyeli öğrenme veya reddetme örneklemesi kullanarak buna karşı optimizasyon yaparak modelin yanıtlarının yardımseverliğini ve doğruluğunu geliştirdi.

Kaynak: https://openai.com/blog/improving-factual-accuracy/