AI전문가 말고 AI사용자 입장으로 평가하는건데


무한루프도 많이 돌고 api응답도 느린데 작업량도 형편없다.

토큰량이 적은건지 똥같은 답변때문에 재작업이 발생하는건지 확실히는 모르겠다.


그런데 메시지 내려가는거 보고 있으면 무한루프도 많이 도는게... gemini 3.0이전버전 쓸때랑 비슷하네


claude code, codex하고 

작업량이 비교도 안된다. claude code로 200$ 요금제로 20%도 안쓰고 처리할 양을 zai로 쓰면 절반 날아감 


opencode에다가 zai, codex 같이 연결해서 쓰고 있어서 일부 작업 codex가 처리하고 있음에도 소모량이 이지랄 났음




그 의미없는 점수로는 얼마 차이 안 나는데 토큰소비나 품질차이가 심각하다

glm 코드 품질은 떨어지는거 당연히 알았는데

토큰량도 존나 의미없는 허수네


gemini도

gemini 3.0 까지는 쓰레기였는데 3.1부터 sonnet 4점초반수준으로 품질 나오는 수준인데

그런데 점수는 gemini가 더 높다고 발표는 많이 났었다.