하지만 인간에게는 항상 무한한 정보는 커녕 유한하면서 완전하지도 않은 자료가 주어진다. 그렇다고 닭쫓던 개 지붕 처다보듯이 있을수는 없잖아. 인간은 결국 제한된 정보로 선택을 해와야 했고 그 선택의 결과가 제한된 정보를 확률로 해석할 때 가장 좋았다 카더라.
효과를 가장 잘 봤던 건 대체로 천문학쪽이었다. 당연히 그 당시 천문 기술로는 정확도가 한계가 있었지만 천문은 워낙 스케일이 거대한 학문이다보니 조금의 오차가 완전 다른 결과를 낼 수 있었다. 오차 문제는 중요한 문제였고 통계학적 방법은 갈릴레오도 <두 체계에 대한 대화>에 신명나게 씀. 가우스 시대에 세레스의 궤도를 계산하는 문제가 화제였고 상당히 중요한 문제였는데 이걸 가우스가 관측데이터에 르장드르에 의해 다듬어진 최소제곱법을 사용해 19살에 해결했다.
그리고, 그 당시 라플라스는 두가지 업적을 세움. 첫번째로 역확률을 개척했다. 모비율 표본비율 어쩌구 맞음. 확률과 역확률의 관계를 매우 직접적으로 제시했던 결과였어. 두번째로 어떤 데이터를 모아놓으면 결과적으로 이렇게 된다는 걸 이항분포의 극한 형태로 내놓은 중심극한정리를 만들었음. 이때까지 베르누이 드무아브르 등이 축척한 결과의 과실을 맺은 정리였는데...
여기서 가우스가 이걸로 위의 세레스 궤도 계산하는데 정규분포의 오차 이론을 만들어버림. 데이터의 오차의 분포가 정규분포와 관련이 있다! 역확률과 엮어서 생각하면 대박이었지. 라플라스는 이 논문을 보고 엄청 충격을 받았고 그 뒤 라플라스와 가우스의 논의로 선형근사와 확률을 엮는 이론이 발전해서 최소제곱법의 수학적 근거를 만든 가우스-마르코프 정리가 증명됬고 참값에 대한 근사값 데이터의 분포가 이중제곱분포 (라플라스분포)를 따른다는 라플라스의 결과가 나오고... 하여튼 이 두사람에 의해 정식으로 귀납에 대한 확률적 접근이 정립됬다. 끼워맞추기라고 오해받는 통계학의 수많은 결과는 사실 경험칙이 아니라 라플라스-오일러가 수학적으로 후드려만든 엄청난 내용이었다.
그리해 케틀레라는 사람이 수학계에서 정제되고 천문학계에서 응용된 확률적 발상을 라플라스한테 배워와서 사회분야에 적용하려는 사회적 움직임를 만들었다. 국제통계학회는 이 사람 손에서 만들어졌음. 그 핵심 아이디어는'보통 사람들'로부터 일반 사회의 보편사실을 알아내자 는 거고 실제로 논문도 다방면으로 내고 꽤 실행에 옮겼는데..
하지만 사회는 천문 등 과학현상과는 비교도 할수 없을만큼 난장판이었고 일단 표본 만드는 것부터가 너무 어려운 이야기였다. 애초에 보통 사람이 어딨고 있다고 해도 도대체 어떻게 찾을 건데? 그리고 케틀레 이사람은 수학적 범재라서 수학적 오류나 수학개념 미비라는 비판 융단폭격을 제대로 방어할 수 없었음. 그래서 통계적 사고에 중요한 영향을 끼쳤음에도 수리통계학사 책에서 이사람 이름은 보이지 않음.
그럼 그 표본문제는 수학적으로 극복가능한 문제냐? 무시무시하게도 답은 '그렇다'다. 이걸 해결했던 건 인간의 다양성과 불확실성이 문제가 되면서 그나마 가장 통제되기 쉬워서 그랬는지 계량생물학에서 쏟아졌다. (그런데 그 전에 심리학계에서 중요한 발전이 있었음. 아무리 한 길 마음속 모른다 해도 '사회'보단 훨씬 통제하기 쉽잖아?)
일단 프랜시스 골턴이 나타나서 증명한게 '정규분포의 모임도 정규분포다'라는 몰카에 몰카급의 정리를 증명해서 오차이론을 발전시키고, 여기서 예상가능한듯 골턴은 회귀와 상관(상관관계의 그것)의 개념을 발전시킴. 그걸 발전시켜달라는 골턴의 부탁을 받아서 현대의 통계적 이론을 꽤 만든게 칼 피어슨과 율. 상관이론, 회귀분석,카이제곱검정, 시계열분석 등 많은 결과물이 나왔다.
그리고 여기서 통계학의 분수령을 만들고 현대 통계학이 보이도록 정립한 게 R. A. 피셔. 가우스/라플라스 뒤에 나온 많은 사람들은 사실 범재의 영역이지만 이양반은 어릴때부터 개빡센 근시때문에 수학연구를 연필로 못해서 문제를 기하학으로 전환시켜 머리로 연구하던 사람이다. 오랜시간 통계학자들에게 고통을 안겨주던 상관관계의 분포 문제를 보자마자 일주일만에 해결하고 통계학의 수많은 난제가 그의 손에서 기하학적 예술이 되서 나타났다.(시간나면 Statistical Methods for Research Workers 읽어보셈. 아트다 아트.) 수많은 통계학 문제를 2차원,3차원 기하학으로 해결해버리는 바람에 양민 통계학자들이 못따라간게 문제지만.. 가장 최적화된 표본만들기, 가장 효율적인 통계적 방법 등... 통계학의 수많은 철학적?으로 쟁점이 될만한 부분도 정립하고 귀무 가설이라는 개념도 만들고... 대단한 사람임. 통계학에서 사용하는 많은 수학적 방법은 대부분 이분으로부터 시작됬고 수학적인 증명이 따랐다. (그러니까 이쯤되서 통계학을 유사수학이라고 비웃으면 가우스랑 피셔가 저승에서 포복절도하다 쇼크사할듯.)
그러면서 성질도 좀 더럽고 해서 피어슨이랑 여러 쟁점에서 충돌하고 마지막엔 피어슨의 쟁점에 대해서 거의 승리를 가져가는 듯했지만 계승자가 나타나 이를 다시 원점으로 돌려놓은 사람이 있었음. 바로 저지 네이만. 칼 피어슨의 아들 에곤 피어슨과 함께 협동해서 만들어낸 여러가지 이론과 도그마들을 만들어내고, 무엇보다 귀무가설과 대립가설간의 관계에도 검정력이라는 확률적 개념을 도입해 "답이 맞는가?" 보다 "우리는 어떻게 답을 얻어야 하는가?"라는 통계적 사고를 자리잡게한 인물임. 피셔는 통계적 방법을 제공하고 네이만은 통계적 사고를 제공했다고 하대.
대충 요약하면 이정도인데, 사실 유럽의 지성사와 연관지어보면 더 흥미로운 점이 많다. 예를 들어서, 계량생물학에는 유전학에 더해 "우생학"도 들어있었고 골턴, 칼 피어슨, 피셔는 모두 우생학자이고 우생학 학장까지 맡았다. 왜 그랬을까? 경험주의를 지지하는 경험론과 경험을 모조리 의심한 합리론이 회오리같이 엮인 중심에도 확률적 사고가 있었고, 피어슨/네이만 과 피셔간의 논쟁도 귀납의 본질에서부터 기인했다.
그리고 이 사고방식은 결과적으론 현대 학문의 헤게모니가 되었다. 사회학적 필요성에 의해 발전한 통계적 사고는 현재 경험적 결과로부터 의미있는 데이터를 뽑는데에 짜맞추기라고 보기엔 너무 훌륭한 능력을 보여주고 있다. 그래서 나는 현대의 통계학은 어떤 학문을 과학이게 만드는 현대 학문의 정수가 되었다고 생각해.
나는 도대체 철학자들이 통계학을 강하게 고려 안하는지 이해가 안됨. 과학철학에서 제일 중요한 게 통계학이어야 하는것같은데... 통계학의 의미나 통계학의 역사에 대한 책이 영어권에 1990년대에 많이 나왔다지만 그래도 너무 적음. 한국엔 거의 없다시피하고... 통계학에 미묘한 문제가 얼마나 많으며 얼마나 어이없을 정도로 대단한 결과들이 많은지, 그에 따라 현대인들에게 완전히 새로운 사고방식을 통으로 만들었는데, 그걸 의식조차 못하고 대학교 1학년때 당연하고 대수롭지 않은 듯이 배우고 있는게 지금보면 너무 신기함. 하지만 가까이서 보면 볼수록 대단한 학문이라고 생각하고 인류가 귀납에 대해 대하는 자세를 혁명적으로 바꾼 학문이라 생각함. 니들도 한번쯤은 통계학에 대해 깊이 알아볼 필요가 있다.
더 알아볼만한 책은
* 스티븐 스티글러 (통계사학자)의 책들 - 통계학의 역사(1900년 전까지), 통계학을 떠받치는 일곱가지 기둥
* 우연을 길들이다
* 천재들의 주사위(1900년대 후, 대부분의 통계학사 책은 1900년대 후 이야기는 너무 복잡해서 잘 안함)
* a history of parametric statistical inference from bernoulle to fisher
* 우연의 과학
* 수학적 사고의 힘
1900년대 뒤부터 완전 뭉개졌네 근데 졸립고 귀찮으니까 패스
통계 입문 추천서도 내놔야지ㅡㅡrigorous한거추천좀
와...레알로 글 잘썼다ㅋㅋㅋㅋ 빨려들어가면서 읽음
[V. K. Rohatgi and A. K. Md. Ehsanes Saleh] An introduction to probability and statistics ㄱㄱ
콜모고로브는 어떤 사람?
통계학이 위대하다고 착각하는것 같은데 최근 재 주목받고 있는건 통계학이 그자체가 아니라 통계학적 사고 방법 일 뿐임. 그 둘은 완전히 다르고 목표로 지향하는 바도 완전히 다름.
ㄴ글쎄..글쓴인데 니가 말하는게 뭔진 알겠는데 동의 안한다.
니가 통계학 교양서 하나써라 왠만한 수학교양서보다 나을듯하네 이 글은 서문으로 넣고
개재밌네 ㅋㅋㅋㅋㅋ 개추
다른건 모르겠고 글 잘쓰네 개추