장기 코드 베이스 벤치들에서 정기적으로 지피티가 좋고
https://www-cdn.anthropic.com/6a5fa276ac68b9aeb0c8b6af5fa36326e0e166dd.pdf
애초에 저 벤치 값들 클로드 시스템 카드에 엄연히 박혀있는데 지피티 공식에서 썼다고 못믿겟다 이러는데
애초에 저 벤치값을 상대 모델 없는걸로 쓰면 그게 고소 대상인걸 모르네
공개 벤치 지표고 5.5에서 장기 컨텍스트 에서 실제로 opus가 이긴것도 그대로 있음
근데 gpt 공식 벤치니까 못믿겠다 이러는것도 웃기고
벤치마크가 무슨 뜻인지도 몰라가지고 뭔 아예 GPT 없는거 가져올때부터 코미디인데
점마는 왜 모르는데 저러는거냐
모르면서 남을 지적하는것만큼 코미디가 따로없노
벤치마크 뜻도 몰라가지고 MRCR 지표 언급했는데, 지표에 GPT가 없다고 이러질 않나
당연히 벤치마크는 데이터셋이고 평가 근거니까 그안에 지피티가 없겠지
진정한 무지는 지가 모르는데 고칠 생각을 않는 저 비천함이 무지인듯
왜 무식하면 용감할까 알수가 없는 노릇이다
참고로 MRCR v2는 앞으로 클로드 벤치에서 사라질거임. 왜냐하면 앤트로픽에서 MRCR 벤치가 별 효용없다라고 주장하는 측이라
벤치 자체는 딥마인드쪽에서 나온건데, 다 시스템 카드에 박혀있는 지표임.
진짜 무식하면 용감하다고 모르는데 목소리만 크니 이길수가 없다
그리고 벤치마크가 뭔지 몰라가지고 MRCR 벤치에 GPT가 없다면서 큰소리 치던 글은 왜 삭제했냐
부끄러움을 좀 알아라 잘 모르면 댓글을 달지말고
애초에 단톡방 인원들끼리 대가리수 모아가지고 지랄하는것도 코미디인데 병신들끼리 서로 빨아주는게 딱 조선식 사고방식이긴함
진실이 중요한게 아니라 머리수가 중요한거지
이 글에서 유의미한 내용은 롱컨텍스트 벤치들에서 정기적으로 GPT가 더 낫다는 보고를 하고 있다는 1줄 뿐이네 왤케 무의미한 욕설이 갈수록 늘어나냐 글고 벤치마크란 건 원래 나온 순간부터 의미가 퇴색되기 시작하는 물건임. 왜냐면 다들 벤치에 맞춰서 모델을 만들어버리니깐. 하물며 openai가 만든 벤치에 클로드 포함시켜놓고 gpt가 이겼다고 해봤자 그게 뭔 의미가 있겠음? 그 결과를 클로드가 갖다 썼다고 해서 그게 더 유의미해지진 않지.
애초에 저 병신이 저 길게 쓴 글이 다 병신인거지
즉 오픈 ai 벤치가 아니라, 시스템 카드에 박혀있는 시스템 성능 가지고 그냥 비교한거야. MRCR 자체는 구글 딥마인드서 최초로 만들고 V2로 계량했는데, 이때 앤트로픽도 인정한 벤치임 4.6서
실제로 4.6 시스템 카드에도 적혀있던거라 걍 무슨 벤치 어쩌고로 저러니까 이해가 안간다는거 애초에 클로드서도 자사 모델 광고할때 써먹은 벤치임
@ㅆㅇㅆ(124.216) 아니 그럼 이 벤치는 구글이 만들었고 V2 시점에서는 엔트로픽도 좋은 벤치라고 인정했다는 거네?
@에이도비 ㅇㅇ 시스템 카드에도 박혀있어 저거 봐. 근데 모델이 진화하면서 효용성 떨어진다고 opus 4.8 부터는 버린다고 했는데 현재로써는 인정된 벤치임. 그래서처음에 꺼낸거고 나는 메뉴얼에 없는 얘기 안함. 메뉴얼보고 쳐 이야기하는데 저 씨발련은 그걸 모르고 지랄하니까 빡치는거지
@ㅆㅇㅆ(124.216) 모르는 게 당연하지. 세상 모든 걸 어캐 다 암. 아는 사람이 가져와서 보여주면 되지. 근데 욕은 좀 줄이는 게 좋겠음. 중요한 내용이 욕에 다 가려지잖아
@에이도비 나도 모른다 말하면 좋게 말해줌. 근데 저새끼 말투를 봐라 걍 시비거는데 누가 좋게 말해주냐
ㅋㅋ
이 댓글은 게시물 작성자가 삭제하였습니다.
이 댓글은 게시물 작성자가 삭제하였습니다.
걍 개좆도 모르는데 댓달지말고 좀 꺼져라
이 댓글은 게시물 작성자가 삭제하였습니다.
ㅆㅇㅆ가 주작한 념글에 작성자가 삭제한 댓글이 많은 이유
https://archive.md/e52ei