Toolformer

GPT-3 Alternatif Büyük Dil Modelleri (LLM’ler)

Dil modelleri kendi kendilerine araçları ve API’leri kullanmayı öğretebilir.

Website

Toolformer Hakkında

Toolformer, Meta AI tarafından hangi API’lerin çağrılacağına, ne zaman çağrılacağına, hangi argümanların iletileceğine ve sonuçların gelecekteki token tahminine en iyi şekilde nasıl dahil edileceğine karar vermek için eğitilmiş bir modeldir. Bu, kendi kendini denetleyen bir şekilde yapılır ve her API için bir avuç gösterimden başka bir şey gerektirmez. Bir hesap makinesi, bir Soru-Cevap sistemi, bir arama motoru, bir çeviri sistemi ve bir takvim de dahil olmak üzere bir dizi araç içerirler. Toolformer, temel dil modelleme yeteneklerinden ödün vermeden, genellikle çok daha büyük modellerle rekabet eden çeşitli aşağı akış görevlerinde önemli ölçüde geliştirilmiş sıfır atış performansı elde eder.