잼2.5에 5만달러 박아도 80프로 못찍는게 현실임
돈찍누 되는 모델이 있고 안되는 모델이 있음
(자폐아 모델을 내며)
저거는 arc잖아
Arc같은 패턴 추론 잘하는 Ai (o3) 박사급 QnA, 수학, 코딩 잘하는 Ai (2.5 pro) 뭐쓸거임? 공부할때?
o3가 arc agi에서만 높은 성능 보인건 아니잖음?
잼2.5에 5만달러 드립은 뭔 소리야
내말은 잼2.5로 arc agi 테스트할때 o3 비용만큼 돌려도 80프로 못찍는다는것
아니 그 비용만큼 돌린다 이런게 의미없는 비교임 잼2.5는 애초에 추론 시간이 제한된 상태라 리밋이 걸린 상태인데. o3만큼 비용 들여서 추론 시간 쓰는 경우 성능은 모르는거지
o3 low가 추론시간 제한걸린 상태다 아님?
잼2.5는 지금 o1pro보다도 1/100 비용으로 리밋 걸은 상태로 돌리는거라 정확한 비교가 안됨. 구글에서 비용 신경 안쓰고 추론 올인한 벤치 공개하지 않는 이상
TPU 최대로 하면 O3 그냥 닦아버릴 것 같은데 - dc App
o3가 2.5에 근접하다는 헛소리 좀 그만하자
이건 좀.. - dc App
이새끼는 혼자 횡설수설하고앉았네 ㅋㅋㅋ어디감히 오쓰레기를 2.5에비벼? - dc App
(자폐아 모델을 내며)
저거는 arc잖아
Arc같은 패턴 추론 잘하는 Ai (o3) 박사급 QnA, 수학, 코딩 잘하는 Ai (2.5 pro) 뭐쓸거임? 공부할때?
o3가 arc agi에서만 높은 성능 보인건 아니잖음?
잼2.5에 5만달러 드립은 뭔 소리야
내말은 잼2.5로 arc agi 테스트할때 o3 비용만큼 돌려도 80프로 못찍는다는것
아니 그 비용만큼 돌린다 이런게 의미없는 비교임 잼2.5는 애초에 추론 시간이 제한된 상태라 리밋이 걸린 상태인데. o3만큼 비용 들여서 추론 시간 쓰는 경우 성능은 모르는거지
o3 low가 추론시간 제한걸린 상태다 아님?
잼2.5는 지금 o1pro보다도 1/100 비용으로 리밋 걸은 상태로 돌리는거라 정확한 비교가 안됨. 구글에서 비용 신경 안쓰고 추론 올인한 벤치 공개하지 않는 이상
TPU 최대로 하면 O3 그냥 닦아버릴 것 같은데 - dc App
o3가 2.5에 근접하다는 헛소리 좀 그만하자
이건 좀.. - dc App
이새끼는 혼자 횡설수설하고앉았네 ㅋㅋㅋ어디감히 오쓰레기를 2.5에비벼? - dc App