Synthetic Data 자체가 실제처럼 만들어진 가상 데이터임. 정보량 자체가 정해져있는데 합성 데이터가 실제 데이터 정보량을 넘을 수는 없음. 3차원 시공간에서 4차원 시공간의 데이터를 얻었다고 하는것과 동일한 말임. 정보이론관점의 공리같은거임
가가가가(room1186)2024-07-30 10:51:00
답글
3차원 시공간에서 4차원 시공간 데이터 얻는다는 비유는 진짜 오바인데 ;; 합성 데이터는 그냥 있는 데이터를 더 잘 활용해서 새로운 통찰력을 얻는 거지, 무슨 차원을 뛰어넘는 마법 같은 거 아님. 걍 현실적으로 생각해봐, 합성 데이터는 분명히 효용가치 있는 기술임. 인류가 한정된 공간에서 지금의 반도체 기술을 끌어올린듯이 llm도 그런 방식으로 작동할거임
익명(211.195)2024-07-30 10:56:00
답글
정보량이 이미 정해져있기 때문에 그 정보량을 뛰어넘어서는 데이터를 창출할 수는 없음 새로운게 아니라 기존 정보를 재조합한 데이터임. 내가 왜 3차원 4차원 비유를 했는지 알겠음?
가가가가(room1186)2024-07-30 11:00:00
답글
통찰력도 기존 데이터를 재조합해서 기존 데이터에서 창출할 수 있는 정보를 창출하는 과정임. 창의력이 뭐 완전히 새로운 정보를 가져오는 과정이 아니잖음
Synthetic Data 자체가 실제처럼 만들어진 가상 데이터임. 정보량 자체가 정해져있는데 합성 데이터가 실제 데이터 정보량을 넘을 수는 없음. 3차원 시공간에서 4차원 시공간의 데이터를 얻었다고 하는것과 동일한 말임. 정보이론관점의 공리같은거임
3차원 시공간에서 4차원 시공간 데이터 얻는다는 비유는 진짜 오바인데 ;; 합성 데이터는 그냥 있는 데이터를 더 잘 활용해서 새로운 통찰력을 얻는 거지, 무슨 차원을 뛰어넘는 마법 같은 거 아님. 걍 현실적으로 생각해봐, 합성 데이터는 분명히 효용가치 있는 기술임. 인류가 한정된 공간에서 지금의 반도체 기술을 끌어올린듯이 llm도 그런 방식으로 작동할거임
정보량이 이미 정해져있기 때문에 그 정보량을 뛰어넘어서는 데이터를 창출할 수는 없음 새로운게 아니라 기존 정보를 재조합한 데이터임. 내가 왜 3차원 4차원 비유를 했는지 알겠음?
통찰력도 기존 데이터를 재조합해서 기존 데이터에서 창출할 수 있는 정보를 창출하는 과정임. 창의력이 뭐 완전히 새로운 정보를 가져오는 과정이 아니잖음