질문 원본
산술평균, 최빈값, 중간값이 대표값이 될 수 있는건 - 통계 마이너 갤러리 (dcinside.com)
중심측도, 퍼진측도, 상대측도가 생긴 이유
예비지식) 수량화란 : 어떤 질을 이산 수와 연속 량으로 바꾸는 것
예)
단백질 함량 : 질=단백질 함, 량=1.5그람(연속값)
단위면적 당 이삭 수 : 질=단위면적당 이삭, 수=1개, 2개(이산값)
가구당 사육두수 : 질=가구당 사육두, 수=1마리, 2마리(이산값)
본론)
측도란 질을 수량으로 바꾸는 것인데 데이터에 대한 측도가 있고 분포에 대한 측도가 있음
A) 변수에 대한 측도는 명순구비라고 해서 명목척도, 순서척도, 구간척도, 비율척도로 잼
이 척도는 1940년 대 경 개발됨, 따지고 보면 통계학의 역사는 실질적으로 겨우 80년도 안 됨
B) 또 다른 측도인 확률분포에 대한 측도가 있는데
1) 중심측도는 분포의 중심위치를 파악하려고 생긴 개념 (산술평균, 가중평균, 기하평균, 조화평균, 중앙값, 최빈값)
2) 퍼진측도는 중심위차가 같은 경우 서로 다른 두 분포를 비교하려고 생긴 개념 (분산, 표준편차 등)
3) 상대측도는 한 분포 내에서 서로 비교하려고 생긴 개념 (10분위수의 하위1분위와 상위1분위를 비교하여 개발된 지니지수 같은거)
이 중 최빈값은 해당 분포의 "전형적인 경향"을 보려고 만든 개념
전형이란 '어떤 부류의 특징을 가장 잘 나타내는 것'
그래서 최빈값도 대표값으로서 자격이 있음
만약 100명 중에 80명이 아이폰을 가지고 있고 나머지 20명은 갤럭시 샤오미 등등을 가지고 있다면 최빈값 아이폰이 의미가 있으므로
이 대표값을 이용해서 경영활동이나 장사에 응용할 수 있을 것
산술평균이 대표값이 되는 이유는 각각의 개별값과 평균의 차를 모두 합하면 0이 되기 때문이고
제곱합을 하면 "다른 것에 비해" 차이가 최소가 되기 때문 이라고 함
산술평균이 대푯값이 되는건 결국 산술평균의 정의대로 구한 값이 그 자료의 중심이 되기 때문인거죠? 산술평균과 개별값의 차이의 총합이 0이 된다는 것이.
남들이 그럿다고 함