https://www.nature.com/articles/s41586-024-07566-y

AI models collapse when trained on recursively generated data - Nature
Analysis shows that indiscriminately training generative artificial intelligence on real and generated content, usually done by scraping data from the Internet, can lead to a collapse in the ability of the models to generate diverse high-quality output.
www.nature.com
Arxiv 버전도 잇긴함
생성형 ai 아키텍처 바꾼다고 이게 해결될까? 나는 이게 ermpirical risk minimization 방법의 이론적 한계(너무 자명했지만 이악물고무시했던)라고봄
안그래도 ai밥값못한다고해서 걱정이던데 이론적한계는 명확하고 비용도 줄일수없으니(결국 인력이 지금처럼 투입되야함) 곧 제3의 겨울올듯
https://www.ekoreanews.co.kr/news/articleView.html?idxno=67346
알파고의 비둑판 같이 손쉽게 구현 가능한 세계에서는 이런 문제가 없지만, 생성형은 어렵군.
저런 논문도 있고 gpt가 agi라는 논문도 있고... 참 이쪽세계는 논문은 희한한듯 ㅋㅋㅋ
이거 아직도 선동당하는 인간이 있네
원논문 아카이브에 올라온게 1년쯤 전이었던거 같은데 그때 읽어보니 '생성데이터를 아무런 후처리 없이 다시 학습데이터로 사용하는걸 재귀적으로 반복하다보면, 비지배적인 특징들이 점점 비중이 약해지고 지배적인 특징만 남게되서 결과적으로 다양성이 파괴된다'라는 내용임
그러니까 이 논문에서 경각심을 주려는건 아무 정제없이 마구잡이로 인터넷에서 데이터를 크롤링하면 모델이 붕괴될 위험이 있다는 거지, 생성데이터를 쓰면 큰일나요 라는 의도가 아님
오히려 실제 데이터로 수집하기 어려운 희귀 케이스를 합성데이터로 보완해서 성능을 더 향상시키는 연구도 있음
선동당해서 네이처에 올라감? ㅋㅋㅋ
니말이 맞고 저논문의 시사점도 그게 맞는데, 내가 뒤에 ai비용 기사를 왜 썻는지 한번 생각해보면 좋을것같음
글쓴아 댓글에서는 네가 논문을 이해 못했다고 주장하는거잖니. 네이처에 올라갔는지 아닌지를 따지는게 아니고.
아니그니까 나도 시사점은 아는데, 그건 학자관점의 시사점이고 비용관련해서 생각을 해보시라구요... Erm관련해서는 순전히 내생각이 맞는데, 저 논문의 실험절차를 생각해보면 어느정도 합리적이라고 생각함. 저자가 그걸 지적안할걸수도 있지. 결국 finite sample으로 학습하면 그럴싸함으로 귀결되어 다양성이 부족해진다는점이 되는것이고, 저자는 시사점을
다양성을 휴먼이 주어야한다는건데, 이게 지금 ai투자자들이 기대하는바와 전혀 일치하지않는다구요
다양성을 휴먼이 주어야 한다는 건 논리 비약이지. 무분별한 인터넷 크롤링을 하지 말라고 하니 그럼 대안이 휴먼레이블링 뿐이다? 이건 너무 극단적임
저번에 오픈ai에서 입증자-검증자 게임을 제안하기도 했고, 요번에 메타에서 평가자를 자율학습시키는 방법도 제안됐고... 학습을 자동화하려는 시도는 꾸준히 이뤄지고 있음
자동화한다는것은 결국 ai기반이라는건데, 그알고리즘이 자명한것이라면 애초에 생성형ai가 필요가 없을것이고 human driven이라면 비용이된다는거임. 결국 사람이 erm으로 학습하지않기때문에 유니크하다는것이고. 이건 내생각맞음.
논문 시사점이랑 글 주장이 얼라인 잘 안되는건 맞음. 주장 자체의 타당성을 떠나서 - dc App
AI가 거품은 맞는거같다. 글도 읽을줄 모르는 온동네 뜨내기들이 설쳐대는꼴이 그것을 잘 나타내주는거같다. 경영/경제/사회 학자 빙의해서 투자에 대한 이론을 설명하는 주식커뮤니티속 그네들을 볼때와 비슷한 감정이 찾아온다.
인용수1 논문보고 일침 ㅅㅌㅊ노
ㄹㅇㅋㅋ
논문 이해 못한거같은데
얘 엔비디아 주식 숏쳐서 이러는거냐 아님 한주도 못사고 쳐물려서 배아파서 이러는거냐
생성데이터를 쓰지말자가 요지가 아닌거 같은데...
주식 유튜브로 ai배운새끼