1ebec223e0dc2bae61abe9e74683716d90d524a0bc059ff2fe52d4abf1e9518709137b0cb90e541cc5f4495b

7fed8273b58669f551ed87e04e817473c81facfcdf9000884e9617c6dcc0f0

Dragontail VS Riverhollow VS Shadebrook (LMSys 아레나 모델 코딩 능력 비교)

* 드래곤테일: 셋 중엔 압도적 원탑. 코드 양도 제일 많고 퀄리티도 제일 좋았다. 거의 제미나이 2.5 프로급이거나, 어떤 면에서는 더 낫다.

* 리버할로우: 나쁘진 않은데, 드래곤테일이랑 비교하면 확실히 급이 낮다는 느낌. 제미나이 2.5 플래시나 그 비슷한 수준일 것 같다.

* 셰이드브룩: 성능이 제일 별로. 특히 프론트엔드 디자인 쪽에서 약하고, 전반적으로 코딩 실력이 부족해 보인다.


이 평가는 "시각적으로 아주 멋진 스페이스 인베이더 게임 만들어줘" 라는 프롬프트를 던졌을 때 나온 결과.





+

1ebec223e0dc2bae61abe9e74683716d90d524a0bc069af4f850d4abf1e951874ebb25341b2a4cc6b59161cd

Nightwhisper 모델 없어지기 전에 똑같은 프롬프트 돌려봤거든. UI가 얼마나 더 괜찮았는지 봐봐. 진짜 하트 모양으로 목숨 표시하고, 점수판 색깔이랑 폰트도 딱 스페이스 인베이더 게임에서 기대할 법한 스타일이었어. 그 모델 진짜 뭔가 다르긴 했어 :)