질문 원본


산술평균, 최빈값, 중간값이 대표값이 될 수 있는건 - 통계 마이너 갤러리 (dcinside.com)





중심측도, 퍼진측도, 상대측도가 생긴 이유



예비지식) 수량화란 : 어떤 질을 이산 수와 연속 량으로 바꾸는 것


예)

단백질 함량 : 질=단백질 함, 량=1.5그람(연속값)

단위면적 당 이삭 수 : 질=단위면적당 이삭, 수=1개, 2개(이산값)

가구당 사육두수 : 질=가구당 사육두, 수=1마리, 2마리(이산값)



본론)


측도란 질을 수량으로 바꾸는 것인데 데이터에 대한 측도가 있고 분포에 대한 측도가 있음


A) 변수에 대한 측도는 명순구비라고 해서 명목척도, 순서척도, 구간척도, 비율척도로 잼

이 척도는 1940년 대 경 개발됨, 따지고 보면 통계학의 역사는 실질적으로 겨우 80년도 안 됨


B) 또 다른 측도인 확률분포에 대한 측도가 있는데


1) 중심측도는 분포의 중심위치를 파악하려고 생긴 개념 (산술평균, 가중평균, 기하평균, 조화평균, 중앙값, 최빈값)


2) 퍼진측도는 중심위차가 같은 경우 서로 다른 두 분포를 비교하려고 생긴 개념 (분산, 표준편차 등)


3) 상대측도는 한 분포 내에서 서로 비교하려고 생긴 개념 (10분위수의 하위1분위와 상위1분위를 비교하여 개발된 지니지수 같은거)




이 중 최빈값은 해당 분포의 "전형적인 경향"을 보려고 만든 개념

전형이란 '어떤 부류의 특징을 가장 잘 나타내는 것'

그래서 최빈값도 대표값으로서 자격이 있음

만약 100명 중에 80명이 아이폰을 가지고 있고 나머지 20명은 갤럭시 샤오미 등등을 가지고 있다면 최빈값 아이폰이 의미가 있으므로

이 대표값을 이용해서 경영활동이나 장사에 응용할 수 있을 것



산술평균이 대표값이 되는 이유는 각각의 개별값과 평균의 차를 모두 합하면 0이 되기 때문이고

제곱합을 하면 "다른 것에 비해" 차이가 최소가 되기 때문 이라고 함