옛날엔 4kb메모리 컴퓨터로 사람을 달에 보냈었는데 지금은 "틀린" 곱셈하는데 50초간 슈퍼컴쓴다고 ㅋㅋㅋㅋㅋ
- dc official App
댓글 10
곱셈만 시키면 유독 ㅄ이 되던데
딥부이 1(123.213)2024-09-23 17:01
이유가 뭐지 연산을 신경망으로 하니까 오차가 있는건가
익명(117.111)2024-09-23 17:37
굳이 곱셈을 o1급한테 시켜야할까? 소를 잡는데는 그만한 칼날이 있지 않을까?
익명(49.142)2024-09-23 17:53
답글
제너러티브 ai가 만든 결과물을, 결국 그 과정 과정을 완전히 이해하고 있는 도메인 엑스퍼트가 검증해야 된다는 뜻이라서 제너러티브 ai를 활용한 추상화 (예를 들어 내가 게임개발을 몰라도 야 이러이러한 게임 좀 만들어봐 라는 식으로)가 잘 안될거라는 뜻이니까.
focalors(pytorch)2024-09-23 18:18
답글
그렇게 간단한 문제가 아님. 충분히 복잡한 엔지니어링 문제를 ai 어시스트를 받는다고 했을 때, 그 수많은 과정 중에 저정도 산술연산이 없을까? 저 정도의 가장 기초적인 부분에서 i) 원인도 모르고, ii) 확률적으로 발생하며, iii) 심지어 발견하기도 힘들지만 (나 저거 처음에 좀 과정을 이상하게 한다 싶긴 했는데 값 틀린지도 몰랐음ㅋㅋㅋ) 전혀 다른 결과를 산출할 수 있는 에러가 발생한다는건
focalors(pytorch)2024-09-23 18:20
답글
댓글 순서 반대로 되있음 ㅋㅋㅋ 뭔가 오류나서 첫 댓글 이상하게 달려서 삭제하고 새로쓴거라
focalors(pytorch)2024-09-23 18:20
분명 LLM이 좋아질수록 오류율이 줄어들긴 하는데, 문제는 그 오류가 줄어들수록 발생하는 오류는, i) 전혀 예상치 못한 곳에서, ii) 더욱 교묘하고 발견하기 어렵게 생겨버리는 경향성이 있다고 느낌... 예를 들어 그림이다 하면 그림이나 글은 조그만 파츠가 잘못돼도 전체에 영향이 없거나 적고, 만약 그 부분이 보기 싫으면 그 부분만 수정하거나 하면 되는데 대부분의 정교한 엔지니어링(코딩 포함)은 그 결과물이 작지만 중요한 파츠들의 극히 복잡한 결합이기 때문에 그 파츠 중 하나가 아주 교묘하게 잘못 만들어져 있다라고 한다면 그걸 잡는 데에는 거의 그 시스템을 처음부터 조립하는 수준만큼의 지식과 시간이 필요하니까...
곱셈만 시키면 유독 ㅄ이 되던데
이유가 뭐지 연산을 신경망으로 하니까 오차가 있는건가
굳이 곱셈을 o1급한테 시켜야할까? 소를 잡는데는 그만한 칼날이 있지 않을까?
제너러티브 ai가 만든 결과물을, 결국 그 과정 과정을 완전히 이해하고 있는 도메인 엑스퍼트가 검증해야 된다는 뜻이라서 제너러티브 ai를 활용한 추상화 (예를 들어 내가 게임개발을 몰라도 야 이러이러한 게임 좀 만들어봐 라는 식으로)가 잘 안될거라는 뜻이니까.
그렇게 간단한 문제가 아님. 충분히 복잡한 엔지니어링 문제를 ai 어시스트를 받는다고 했을 때, 그 수많은 과정 중에 저정도 산술연산이 없을까? 저 정도의 가장 기초적인 부분에서 i) 원인도 모르고, ii) 확률적으로 발생하며, iii) 심지어 발견하기도 힘들지만 (나 저거 처음에 좀 과정을 이상하게 한다 싶긴 했는데 값 틀린지도 몰랐음ㅋㅋㅋ) 전혀 다른 결과를 산출할 수 있는 에러가 발생한다는건
댓글 순서 반대로 되있음 ㅋㅋㅋ 뭔가 오류나서 첫 댓글 이상하게 달려서 삭제하고 새로쓴거라
분명 LLM이 좋아질수록 오류율이 줄어들긴 하는데, 문제는 그 오류가 줄어들수록 발생하는 오류는, i) 전혀 예상치 못한 곳에서, ii) 더욱 교묘하고 발견하기 어렵게 생겨버리는 경향성이 있다고 느낌... 예를 들어 그림이다 하면 그림이나 글은 조그만 파츠가 잘못돼도 전체에 영향이 없거나 적고, 만약 그 부분이 보기 싫으면 그 부분만 수정하거나 하면 되는데 대부분의 정교한 엔지니어링(코딩 포함)은 그 결과물이 작지만 중요한 파츠들의 극히 복잡한 결합이기 때문에 그 파츠 중 하나가 아주 교묘하게 잘못 만들어져 있다라고 한다면 그걸 잡는 데에는 거의 그 시스템을 처음부터 조립하는 수준만큼의 지식과 시간이 필요하니까...
그냥 LLM의 한계임 ㅇㅇ
https://arxiv.org/abs/2409.05746
?
LLM 결과물을 검증하기 위한 LLM 결과물을 검증하기 위한 LLM 결과물을 검증하기 위한 LLM 결과물을 검증하기 위한 LLM 결과물을 검증하기 위한 LLM 결과물을 검증하기 위한 LLM 결과물을 검증하기 위한 ....