리얼타임 api와 연계

+ 에이전트가 적용 될 것 같음

추론을 중간에 끝내는게 아니라 걍 상시로 추론하여 계속해서 답을 출력하는거지

리얼타임 api로 실시간으로 입력을 받으면서 계속해서 출력을 제공하는 것

에이전트의 경우 화면을 실시간으로 보고 그때그때 행동한다거나 그런식

근데 추론 비용이 좆되게 들어서 당분간은 텍스트 입력만 지원 할 듯