이 지표가 뭔지아냐? 쉽게말하면 사람의 사고력을 점수화 시킨건데 그래프 속도도 예사롭지않음 후발주자인 구글, 메타조차 반년 정도의 텀을 가지고 있음 이런속도로 에이전트라는게 나옴 지금까지는 챗봇한테 "이거알려줘" 했잖아 에이전트는 "보고서 양식 맞춰서 ppt까지 만들어줘" 하면 만들어줌 이번달 안에 오픈ai에서 에이전트 내놓는데 그거 성능좋으면 진짜 작살날듯 - dc official App
뭔가 일어날것같긴하다 상상도 못했던식으로
ㄹㅇㅋㅋ
Fact) 경쟁사 엔트로픽에서 컴퓨터를 제어하는 기능까지 갖춘 computer use라는걸 출시한지 한 2달쯤 되가는데 구려서 못써먹을 정도였다.
앤트로픽 모델수중이 gpt4수준이고, gpt4o수준도 못온건 알지? - dc App
앤트로픽 최고 모델부터는 취향의 차이지 성능상 큰 차이 없음 ㅇㅇ. 지금 챗 아래나 기준으로는 제미나이가 1~3등 다먹었네
지금 그 제미나이 모델이 저 그래프에서 gpt4o랑 비슷하다 게이야.. 구글이 최근에 낸게 o1 따라잡았고, 트렌드도 바꼈음 - dc App
뭐 이건 취향차이긴한데, 모델 서능평가에서 데이터셋을 이용한건 안믿는 편이라, 사람이 직접 평가하는 챗 아레나를 난 믿는 편임.
O1 pro가 추론방법을 좀 바꿔서 리소스 오지게 처먹고 느리다고 말나오던데? Gpt5는 조단위로 풀튜닝 2번 돌렸는데 성능향상이 미미해서 출시도 못하고 있고
경량화 속도도 ㅈㄴ빠른게 문제임.. 일단 이번에 에이전트 나와야 알겠다만, 속도자체가 일반인 생각보다 빠른것도 사실인지라.. - dc App
지금 오픈소스 진영에서도 gpt4급 성능은 그냥 다 나오기 시작해서 굳이 openai할 이유가 점점 없어지고 있음. 죄다 기업용 솔루션으로 바꾸려고 하고
gpt5는 확언 나온게 없어서 성공도, 실패도 찌라시라고보면됨. 확실한건 모델크기 유지한채 저 성능곡선임. 전기료는 물론 왕창먹음 - dc App
저 곡선 자체가 구라라니깐 평가방법이 잘못됬음. 내는 기업마다 죄다 자기꺼가 더 좋다고 내는데 그게 무슨 모델 평가냐
찌라시는 맞는데 임원들 다 튀는거보면 openai가 뭔가 문제있는거임
ㄷㄷ