Modellerin İnsan Yanlışlarını Nasıl Taklit Ettiğini Ölçme.
TruthfulQA, bir dil modelinin sorulara yanıt üretirken gerçeğe uygun olup olmadığını ölçen bir ölçüttür. Ölçüt, sağlık, hukuk, finans ve politika dahil olmak üzere 38 kategoriyi kapsayan 817 sorudan oluşmaktadır. Yazarlar, bazı insanların yanlış bir inanç veya yanlış anlama nedeniyle yanlış cevaplayacağı sorular hazırladılar.