InstructGPT

GPT-3 Alternatif Büyük Dil Modelleri (LLM’ler)

Daha gerçekçi ve daha az zehirli bir GPT-3.

Website

InstructGPT Hakkında

OpenAI API, dikkatlice tasarlanmış metin istemleri kullanılarak doğal dil görevlerini yerine getirmeye ikna edilebilen GPT-3 dil modelleri tarafından desteklenmektedir. Ancak bu modeller gerçek dışı, zehirli veya zararlı duyguları yansıtan çıktılar da üretebilir. Bunun nedeni kısmen GPT-3’ün kullanıcının istediği dil görevini güvenli bir şekilde yerine getirmek yerine, büyük bir İnternet metni veri kümesinde bir sonraki kelimeyi tahmin etmek üzere eğitilmiş olmasıdır. Başka bir deyişle, bu modeller kullanıcılarıyla uyumlu değildir.InstructGPT modelleri talimatları takip etmede GPT-3’ten çok daha iyidir. Ayrıca gerçekleri daha az uydururlar ve toksik çıktı üretiminde küçük düşüşler gösterirler. Etiketleyicilerimiz, 100 kat daha az parametreye sahip olmasına rağmen, 1.3B InstructGPT modelimizden elde edilen çıktıları 175B GPT-3 modelinden elde edilen çıktılara tercih etmektedir.

aynak: https://openai.com/blog/instruction-following/#guide