24b0d121e09c28a8699fe8b115ef046c60f52b4e9a

장기 코드 베이스 벤치들에서 정기적으로 지피티가 좋고


https://www-cdn.anthropic.com/6a5fa276ac68b9aeb0c8b6af5fa36326e0e166dd.pdf


24b0d121e09c28a8699fe8b115ef046f5b4a909ba8



애초에 저 벤치 값들 클로드 시스템 카드에 엄연히 박혀있는데 지피티 공식에서 썼다고 못믿겟다 이러는데


애초에 저 벤치값을 상대 모델 없는걸로 쓰면 그게 고소 대상인걸 모르네


공개 벤치 지표고 5.5에서 장기 컨텍스트 에서 실제로 opus가 이긴것도 그대로 있음


근데 gpt 공식 벤치니까 못믿겠다 이러는것도 웃기고


벤치마크가 무슨 뜻인지도 몰라가지고 뭔 아예 GPT 없는거 가져올때부터 코미디인데


점마는 왜 모르는데 저러는거냐


모르면서 남을 지적하는것만큼 코미디가 따로없노


벤치마크 뜻도 몰라가지고 MRCR 지표 언급했는데, 지표에 GPT가 없다고 이러질 않나 


당연히 벤치마크는 데이터셋이고 평가 근거니까 그안에 지피티가 없겠지


진정한 무지는 지가 모르는데 고칠 생각을 않는 저 비천함이 무지인듯


왜 무식하면 용감할까 알수가 없는 노릇이다


참고로 MRCR v2는 앞으로 클로드 벤치에서 사라질거임. 왜냐하면 앤트로픽에서 MRCR 벤치가 별 효용없다라고 주장하는 측이라


벤치 자체는 딥마인드쪽에서 나온건데, 다 시스템 카드에 박혀있는 지표임.


진짜 무식하면 용감하다고 모르는데 목소리만 크니 이길수가 없다


그리고 벤치마크가 뭔지 몰라가지고 MRCR 벤치에 GPT가 없다면서 큰소리 치던 글은 왜 삭제했냐


부끄러움을 좀 알아라 잘 모르면 댓글을 달지말고


애초에 단톡방 인원들끼리 대가리수 모아가지고 지랄하는것도 코미디인데 병신들끼리 서로 빨아주는게 딱 조선식 사고방식이긴함


진실이 중요한게 아니라 머리수가 중요한거지