iAsk Pro는 금본위 MMLU 에서 93.89% , 다양한 AI 모델의 정확도를 엄격하게 측정하는 새로운 MMLU Pro 벤치마크 테스트에서 85.77% 라는 역대 최초의 초인적 성능을 달성했습니다 . 이전 최고 점수(GPT-4o)를 12% 포인트 상회했을 뿐만 아니라 전문가 AGI(인공 일반 지능)를 나타내는 점수도 넘어섰습니다. 즉, 측정된 모든 주제/작업에서 평균적으로 인간 전문가 상위 10%의 정확도를 능가한다는 의미입니다.


MMLU 93.9점, MMLU PRO 85.77점이라고 함 


 iAsk.Ai Pro는 TruthfulQA 벤치마크에서 90.1%의 정확도를 달성하는 반면 GPT-4는 59%를 기록했습니다.

TRUGHFULQA 벤치마크도 기존 가장 높았던 GPT-4가 59점 정도인데 혼자 90점 달성 

뭐지? 오늘 만우절도 아닌데 뜬금없이 너무 넘사 벤치마크 인공이 나와버리니