짤 보내고 원하는 이미지나 그런걸 클릭하라고 한다거나 좌표값 보내면 그거 클릭하는거 이것만 가능해도 할 수 있는거 존나 무궁무진함 4o로 해상도 계산시켜서 그 위치 좌표 뱉는 거는 해봤는데 왼쪽 오른쪽 구분만 가능한 수준이더라
더 자세히 얘기해줄 수 있음?
이미지 보내면 그 안의 어떤 위치든 정확하게 좌표를 계산할 수 있으면 좋겠다구
아니 좌표 찍어서 활용할 수 있는 분야 쪽에 대해서. 분야 막론하고(자율주행, VR, 스포츠 등등) 쓰일 수 있다는 건 알겠는데 너가 생각하고 있는 건 뭔지 궁금해서
마이크로소프트에서 몇개만들엇는데 비전성능때문인지 성공률이 한자리대야
대충 왼쪽 위 이런건 맞추는데 정확한 좌표는 도저히 안나오더라
openai가 이제까지 보여준 행보로 봤을 때는 그런 건 기본으로 가능하고 진짜 어느정도는 쓸만한 수준일 듯 문제는 가격이 기존 가격이 아닐 확률이 높아서 그렇지