제아무리 application 측면에서 끝난다 할지라도
진짜 안하느니만 못할텐데..
왜냐면 뭐 반도체를 예로 들면, 그냥 전공살려서 도메인 지식을 더 딮하게 discuss하고,
그 discussion을 머신러닝이나 통계분석을 제대로 하는 데이터 분석가 그룹에게 전달해서 걔네보고 걍 하라고 하는게 훨씬 건설적임.
로우레벨 노가다 데이터 전처리만 시키는 것 역시 비전공자가 해오면 진짜 소름 돋을 정도일 때가 많아서 진짜로 안하느니만 못함.
라는 나의 생각ㅇㅇ
그 discussion을 머신러닝이나 통계분석을 제대로 하는 데이터 분석가 그룹에게 전달해서 걔네보고 걍 하라고 하는게 훨씬 건설적임 < 여기서 찐빠가 존나 많이남. 데이터 분석만 하는놈들이 많아서 내용 전달 제대로 이해도 못하고 영 왔다갔다 하는 케이스가 많음
아니 인덱싱이 다 되어 있을거아니냐.. 프로그래밍 언어 공대면 앵간치 알텐데 걔네 프레임에 맞게 쉽게쉽게 설명해 주는거지ㅇㅇ 오히려 갖잖은 실력으로 갖다주면 그게 더 대형사고야
걍 말이 안되는거지 ㄹㅇ
그리고 도메인 지식을 더 딥하게 토론한다 할지라도, 데이터와 시뮬레이션간의 간극이 크다거나 하는 이유 등으로 인해서 도메인 지식만으로 설명 안되는 부분이 많은 케이스가 많아서, 코웍이 아주 건설적으로 되지 않는이상 그래도 어느정도 데이터를 알고 도메인 지식을 쓰는쪽이 완전 깊게 파는것보다 유리한 경우가 많다
데이터를 모르라는 말이 아니라 데이터 관련된 일에 관여되지 말라는 뜻이었어ㅇㅇ 데이터 모르면 당연 ㅈ되지 ㅋㅋㅋ
데이터 관련된 일이 뭐 코딩최적화 백/프론트엔드 이런거면 당연히 건들면 안되는데 애초에 멍청하게 비전공자면서 그걸 건드는새낀 거의 없고, 대부분은 미들웨어 수준에서 얘기만 하는 정도지.
근데 글 내용에서 말하는 머신러닝, 통계분석은 데이터만 아는놈한테는 아무리 전문지식 설명 잘한다고 해도 완벽히 원하는 바대로 수행 못함. 계속 옆에서 코멘트 주고 피드백 받고 해야하는데 그래서 비전공자들이 머신러닝을 어느정도는 알아야 한다는거임.
물론 모든 케이스가 그렇다는건 아니고 이론쪽 정립이 확실히 되어있고 흔히들 관측하는 noise 등의 이슈도 없고 등등으로 인해 데이터 자체를 해석할 때 도메인 지식만으로 충분히 커버가 가능하다면, 니가 말하는 방향 (전문적인 토론 후 => 데이터 전문가들에게 포팅만 부탁하는 식의 작업)이 좋겠으나, 현실에선 그런 케이스는 거의 없다보면됨
바이오 인포매틱스 재료 인포매틱스 분야는 그럼 ㄴ뭘까?
118.36 의견에 전적으로 동의함.
비전공자라고 해도 머신러닝 좀 배운 놈들이랑 아예 백지상태인 놈들이랑 협업 난이도가 천지차이야 ㅄ아