https://github.com/bytedance/UI-TARS
AI가 UI를 분석해서 어떤 기능을 수행하는지 이해하고 추론, 판단하는 모델 내놓음
얘가 기존 모델이랑의 차이점은 웹, PC, 모바일의 UI를 전부 학습했는지 플랫폼에 상관없이 UI를 인지하는 능력이 향상됨
UI를 분석 후 어떻게 수행할지 누르면 어떤 동작이 수행되는지 계획을 세우고 학습하면 작동되는 방식이라고 설명되어 있음.
메모리 기능도 있어서 장기, 단기 기억도 저장함
https://github.com/bytedance/UI-TARS
AI가 UI를 분석해서 어떤 기능을 수행하는지 이해하고 추론, 판단하는 모델 내놓음
얘가 기존 모델이랑의 차이점은 웹, PC, 모바일의 UI를 전부 학습했는지 플랫폼에 상관없이 UI를 인지하는 능력이 향상됨
UI를 분석 후 어떻게 수행할지 누르면 어떤 동작이 수행되는지 계획을 세우고 학습하면 작동되는 방식이라고 설명되어 있음.
메모리 기능도 있어서 장기, 단기 기억도 저장함
기대되네