Facebook’un LLaMA’sı için açık kaynaklı bir ChatGPT tarzı sohbet robotu.
Meta kısa bir süre önce 7 ila 65 milyar parametre arasında değişen temel büyük dil modelleri koleksiyonu olan LLaMA’yı yayınladı. LLaMA, GPT-3’ten daha küçük olmasına rağmen daha iyi performansa sahip olduğu için büyük heyecan yaratıyor. Örneğin, LLaMA’nın 13B mimarisi 10 kat daha küçük olmasına rağmen GPT-3’ten daha iyi performans gösteriyor. Bu yeni temel modeller koleksiyonu, daha hızlı çıkarım performansına ve chatGPT benzeri gerçek zamanlı asistanlara kapı açarken, aynı zamanda uygun maliyetli ve tek bir GPU üzerinde çalışıyor. Bununla birlikte, LLaMA, İnsan Geri Bildiriminden Takviyeli Öğrenme (RLHF) eğitim süreci ile talimat görevi için ince ayarlanmamıştır.ChatLLaMA, Facebook’un LLaMA varyantlarıyla etkileşim için deneysel bir sohbet botu arayüzüdür. Bu bot, Alpaca veri kümesi üzerinde ince ayarlanmış 7 milyar parametreli varyantı kullanmaktadır.
Kaynak: https://github.com/juncongmoo/chatllama