딥러닝을 할려면 수학을 알아야한다가 겉멋이라고 하는데 나는 그렇게 생각안함
우선 딥러닝의 설계 자체가 수학이라는 학문으로 이루어 진거고
수학 자체를 공부하지 않는다면 sigmoid에 왜 mse를 붙이면 안되는지도 모를거임
왜 mse가 사장됐는지도 모를거고 어느 모델에 어느 함수를 붙여야하는지 모름
너무 기초적이라고 하는데 난이도 좀 올려서 rnn에 BCE 를 쓰지만 초기 Gan에 왜 KLD를 왜 만들어 냈을까
Kld 이해못하는 애들은 kld가 좋은지 알고 rnn에 붙이는 애들도 있음 결국 BCE랑 같은건데 쓸데없는 짓을 하는거지
그 뿐 아니라 모델층 쌓을때도 문제가 생김 batchmomal도 모르면 어떤 상황에 어떻게 층을 쌓아야 하는지도 모름
이걸 단순 암기나 효능 이해만으로는 확실히 말하는데 절대로 제대로 된 모델이 나올 수 없음
지금 Ai 가 수학적으로 제대로 증명이 안된다고? 그걸 푸는 게 수학임
거기다 그런걸 일일이 공부해서 언제 딥러닝 하냐고 하는데 그럴거면 딥러닝 공부하지 말고 허깅페이스 모델이나 가져다 쓰고 파인튜닝 코드 가져다 쓰는게 나음
물론 파인튜닝했다고 제대로 된 오차분석이나 할 수 있는지도 의문이지만
AI의 깊은 수학 지식을 가지게 되면 현재의 환경에 가장 좋은 모델과 현 모델을 가볍게 하기 위해서 불필요한 수식을 수정하거나 없애는 게 가능함
대학교 수준의 수학만 알면 된다? 그런 수준으로 접근할거면 고졸과 다를 바 없음
고졸이 허깅페이스 가져다 써서 쓰는 수준과 그냥 똑같음
딥러닝을 하는데 수학공부가 필요하다는 의문에 로우 레벨 Api와 하이 레벨 api가 왜 나뉘어져 있는지 생각하길 바라고
항상 성능 좋은 모델이 최고가 아니라 환경에 맞게 모델을 정하고 수정해야한다는 걸 알아두었으면 좋겠음
저런 기초적인 것조차 이해하는 것이 학과 수준을 벗어난다고 생각하는데 lmm에 레그나 양자화, 로라는 제대로 쓸 수 있다고 생각하는 거 자체가 오만이라 생각함
너가 정말 Ai에 수학이 필요없다고 생각된다면 앤드류 응이나 일리야 정도까지는 가고 판단해라
우선 딥러닝의 설계 자체가 수학이라는 학문으로 이루어 진거고
수학 자체를 공부하지 않는다면 sigmoid에 왜 mse를 붙이면 안되는지도 모를거임
왜 mse가 사장됐는지도 모를거고 어느 모델에 어느 함수를 붙여야하는지 모름
너무 기초적이라고 하는데 난이도 좀 올려서 rnn에 BCE 를 쓰지만 초기 Gan에 왜 KLD를 왜 만들어 냈을까
Kld 이해못하는 애들은 kld가 좋은지 알고 rnn에 붙이는 애들도 있음 결국 BCE랑 같은건데 쓸데없는 짓을 하는거지
그 뿐 아니라 모델층 쌓을때도 문제가 생김 batchmomal도 모르면 어떤 상황에 어떻게 층을 쌓아야 하는지도 모름
이걸 단순 암기나 효능 이해만으로는 확실히 말하는데 절대로 제대로 된 모델이 나올 수 없음
지금 Ai 가 수학적으로 제대로 증명이 안된다고? 그걸 푸는 게 수학임
거기다 그런걸 일일이 공부해서 언제 딥러닝 하냐고 하는데 그럴거면 딥러닝 공부하지 말고 허깅페이스 모델이나 가져다 쓰고 파인튜닝 코드 가져다 쓰는게 나음
물론 파인튜닝했다고 제대로 된 오차분석이나 할 수 있는지도 의문이지만
AI의 깊은 수학 지식을 가지게 되면 현재의 환경에 가장 좋은 모델과 현 모델을 가볍게 하기 위해서 불필요한 수식을 수정하거나 없애는 게 가능함
대학교 수준의 수학만 알면 된다? 그런 수준으로 접근할거면 고졸과 다를 바 없음
고졸이 허깅페이스 가져다 써서 쓰는 수준과 그냥 똑같음
딥러닝을 하는데 수학공부가 필요하다는 의문에 로우 레벨 Api와 하이 레벨 api가 왜 나뉘어져 있는지 생각하길 바라고
항상 성능 좋은 모델이 최고가 아니라 환경에 맞게 모델을 정하고 수정해야한다는 걸 알아두었으면 좋겠음
저런 기초적인 것조차 이해하는 것이 학과 수준을 벗어난다고 생각하는데 lmm에 레그나 양자화, 로라는 제대로 쓸 수 있다고 생각하는 거 자체가 오만이라 생각함
너가 정말 Ai에 수학이 필요없다고 생각된다면 앤드류 응이나 일리야 정도까지는 가고 판단해라
???:그건수학이아니라산수야
밑에 놈 글 쓰는거 보니까 걍 어그로 같던데 수학과 말고 공학이나 자연계에서 정상적으로 배웠으면 당연히 아는 사실인데 ㅈㄴ 답답함
와 좋은 글 고마움..... 이 글 고수의 향기가 느껴진다 덕분에 방향을 잡을수있게됨 - dc App
글쎄.. 너가 말한 예시들은 전부 이론이 아니라 경험적으로 사용하는 테크닉들이고 가장 간단한 infinite width 케이스도 mse 로스 및 아키텍쳐 제한, 파라메터들의 분포에 대한 일정 조건이 없으면 이론적으로 설명이 안된다. 설계 자체가 수학으로 됬다는건 동의를 절대로 못하겠다. NTK 자체가 딥러닝이 한참 뜬 이후에 나왔고 설명 못하는게 많음
여기서 논쟁의 핵심이 나오는데, 이 글에서 설명가능한것처럼 현학적으로 말하지만, 아직 이론으로 증명이 안됨. 다 경험적으로 접근한 내용들
수식을 이해하면 어느 상황에 써서 어떻개 모델을 개선할 수 있는지를 알수 있지 결과값으로 loss 나 acc 나 f1이나 레이턴시나 증명이 안되더라도 모델을 개선하기 위해선 어떤 함수를 붙여야하는지 자체를 모르는데 모델의 성능을 개선가능하녀 불가능하냐 그차이는 천지차이지
예를 들어서 증명이 안된다고 수학을 안배운다? 그럼 rnn에 BCE 붙이는거고 SIGMOID에 MSE 붙이는 거임 그럼 제대로 된 모델이 안나오겠지 우리가 수학을 공부하는건 수학을 증명하기 위해서가 아니라 AI 모델을 개선하고 성능을 좋게 하기 위해서다 여기서 성능이란 정확도 뿐 아닌 여러 요소를 말하는거임
그냥 한줄 요약됨. 글쓴이는 임팩트 있는 논문 보유하고 있는지 ? citation 몇천이상
새로운 수식을 내는것도 Ai 연구자의 일이지만 이미 증명된 수식들을 상황에 맞게 븥이는것도 Ai 연구자가 해야 할 일임
너말대로라면 앤드류 응이나 일리야를 예로 들 수 있을거고 그 사람들은 전처리와 그에 필요한 수학적 지식이 필요하다고 항상 얘기하고 외국의 유명 교수들 조차 모델을 가르칠때 수학적 지식과 유도를 가르쳐줌
너가 그사람들 급이 아니라면 그사람들이 알려주는대오 수학공부나 해
“어느 모델에 어느 함수를 붙여야하는지” 이거 수학으로 증명하면 citation 만개 넘을 수 있음
이미 증명 된 것들을 붙이는거지 무슨 새로운걸 창조하는게 아님
증명이 됐더라도 어느 상황에 어떻개 붙여야 하는지도 모르는데 그럴바에야 허깅페이스나 쓰셈
이미 증명 같은 소리하네. 너가 그거 이미 증명된거라고 corollary 로 보여주면 학계가 뒤집어질텐데
너가 그냥 수학필요없다고 증명하고 싶으면 일리야나 앤드류 옹보다 유명해지면 됨 ㅇㅇ
내가 증명 됐다고 얘기하는거랑 저가 얘기하는거랑 매칭이 안되는거 같은데 그거 맞출 필요도없음
그냥 니가 일리야나 앤드류 응 수준이 되어서 걔들한테 반박하셈 ㅇㅇ
수학 타령하고, 이미 니가쓴 내용들은 수학적으로 증명 됬다면서요? 말장난치고 잇네? 수학을 해본적이 없는 애들이 수학타령이나 하니까 비웃음 받지
내 말은 단순함 니가 앤드류 응이나 일리야보다 유명해져서 걔들한테 반박하셈
내가 말하는 거랑 니가 말하는거랑 얘기하고 있는게 다른것도 알고 있거든? 근대 굳이 그거 맞춰서 내가 설명할 필요가 없이 앤드류 응, 일리야 이기고 와
그냥 수학도 갈것없이 그냥 권위의 오류를 범하고 있네. 이 친구는 논리학부터 학부 교양부터 다시배워야할듯
니들이 좋아하는 그 권위대로 논리 펼친거임
나도 니들 말대로 어느정도 증명은 해야된다고 봄 그게 일리야나 앤드류 응급이지 그리고 그 말이 잘못됐으면 다른 학자들이 반박했을거고
내가 말하고 있는건 이미 유명 교수 및 저자들과 권위자들을 가지고 온거임 근데 너가 그급이 아닌데 너가 말하는 건 그저 지구가 평평하다라고 말하는 일개 개미에 불과함
그래서 왜 시그모이드에 mse쓰면 안되냐? mse가 정규분포 가정이라서? - dc App
역전파 할줄알음? 역전파 수식써보셈
이런건 직접 미분해서 어떻게 시각적으로 확인하는게 제일 각인됨
뭐 0또는 1 근접에서 기울기 소실얘긴가보네 이건 수학적 증명이아님 - dc App
그래 너말이 맞다
MSE 사장됐다는건 어디서 튀나온거? 당장 탑티어 APPLICATION쪽 논문만 봐도 리그레션 문제에선 MSE많이 쓰는데 - dc App
내가 말을 좀 이상하게 썼네. 오해가게 쓴건 미안하고 글을 읽어보면 알겠지만 sigmoid에 mse 경우를 말한거임
글의 요지가 수학적 지식도 없으면 제대로 된 모델이 못나논다는 말을 하고 싶었고 그 예시를 풀어쓴 것들임
Mse 미분도 할줄 모르면 아무 모델에나 붙여넣을게 뻔한데 수학 공부 안햐도 되겠냐 이말임
그거에 대해선 어느정도 공감한다. rnn계열에 시계얼 252 time step 죄다 집어넣는 연구보면 개병신이란 생각부터 드니까 역전파 수식한번 안써본거지 - dc App
그리고 자꾸 나보고 수학 필요없다면 너의 가치를 증명해라 하는데 일리야나 앤드류 응 그외에 외국의 유명 교수들도 Ai 가르칠때 수학적 관념으로 다 접근하는데 수학안배워도 된다는건
당연히 이쪽에서 논문없으면 너가 말하는 그들이나 너나 동급임 - dc App
오히려 수학 안배워도 된다고 하는 쟤들이 자기 가치를 더 증명해야 하지 않나? 외국 강의보먄 수학 없는 강의를 본적도 없고 유도까지 다 설명하던데
논문은 많긴함 다만 내가 현재 회사에 몸담고 있어서 증명하기가 꺼림
거의 회사에서 4~5시간은 논문 쓰는 시간이라 논문은 많지
다만 그걸 증명하지 못하니깐 말을 아끼는거고
근데 생각해보니깐 내가 굳이 설명할 필요 있을까 싶음 어차피 회사가면 쥐어터질텐데 내가 백번 설명해도 의미있나 싶다 뮨제생기면 다 자기가 책임 껴안고 가는건데 다만 저글 보고 새싹들이 수학 포기할까 걱정은 되네
ㅈㄴ 학부 3학년이 쓴 글같노
글을 쓸때 청자가 누구냐에 따라서 글을 맞춰써야지
내가 보기엔 여기 직장인도 없음 다 학생이고