이걸 어떻게 판단해서 정리하나요??
줄기와 잎 그림은 변량의 개수가 무척 많은 경우에, 줄기에 속하는 잎을 일일이 다 적어주기 힘들어지거나, 줄기도 엄청 길게 늘어질 수 있어서, 이런 경우에 한 눈에 보기 어려우니 도수분포표로 정리한다고 하는데...
실제 자료가 주어졌을 때, 혹은 내가 어떤 자료를 직접 수집했을 때 뭘로 정리하는게 좋을지를 생각해야 한다면 이런 설명만으론 막연할 것 같아서..
이걸 어떻게 판단해서 정리하나요??
줄기와 잎 그림은 변량의 개수가 무척 많은 경우에, 줄기에 속하는 잎을 일일이 다 적어주기 힘들어지거나, 줄기도 엄청 길게 늘어질 수 있어서, 이런 경우에 한 눈에 보기 어려우니 도수분포표로 정리한다고 하는데...
실제 자료가 주어졌을 때, 혹은 내가 어떤 자료를 직접 수집했을 때 뭘로 정리하는게 좋을지를 생각해야 한다면 이런 설명만으론 막연할 것 같아서..
쫌 지나면 연속 이산 배움 줄기나 막대는 이산 자료 도수나 도수분포, 히스토는 연속자료
막대와 히스토의 이산 연속 차이는 막대 사이 간격으로 구분 막대나 히스토나 비슷해 보이는데 막대 간 사이를 벌린 이유는 이산임을 나타내기 때문이고, 히스토의 막대를 붙이는 이유는 연속임을 나타내려고 그런다함
도수분포표는 모든 그래프의 출발이라 구분대상 아님
데이터의 갯수가 50개 미만이고 개별 데이터 값을 보여주는 것이 도움이 되면, 줄기-잎 그림이 좋습니다. 대표적인 예로 수업을 듣는 학생들의 중간고사 시험 성적은 줄기-잎 그림으로 하기 좋습니다. 각 학생들은 자신의 점수를 알고 있으므로 줄기-잎 그림을 보고 자신이 몇등인지도 알 수 있습니다. 그러나 데이터 갯수가 많거나, 각각 데이터 값을 아는것이 별로 중요하지 않으면 히스토그램을 쓰는 것이 좋습니다. 다시 말해, 데이터 갯수가 적고 개별 값을 보여주는 것이 중요-> 줄기-잎 그림, 데이터 갯수가 많거나 개별 값을 보여주는 것이 중요하지 않으면 히스토그램을 씁니다.
이상치나, 중앙값, Q1, Q3 같은 값들이 관심 대상이면 상자 그림 (box-plot)도 쓰입니다. 도수분포표는 구간별 갯수가 관심대상일 때 쓰입니다. (예: 10-20 몇명, 20-30 몇명, 30-40 몇명). 정리하자면, 실전에서 가장 무난하게 많이 사용되는 방법이 히스토그램이고, 상황에 따라 줄기-잎 그림, 상자 그림, 도수분포표이 쓰인다고 할 수 있습니다.
모든 그래프는 도수분폽표를 거치지 않으면 나올 수 없음 근데 그래프를 그릴 때 도수분포표를 그리지도 않았는데도 각종 그래프를 그릴 수 있는 이유는, 도수 즉 빈도수만 측정하고 분포는 생랔하기 때문임, 도수 즉 빈도수를 어떤 그래프든 필요로 하기 때문에 모든 그래프의 출발점이 도수분포표라고 하는거임
생략이 가능한 이유에는 컴퓨터의 발달도 이유
추가적으로, 도수값(이산) 말고 측정값(연속)도 도수로 빈도를 보므로 모든 측정값은 도수분포표가 가능