집중경향치
- 어떤 변수의 범주 또는 값의 분포를 요약해서 나타내는 수치로, 최빈치, 중위수, 산술평균 등이 있다.
- 최빈치: 한 변수의 분포에서 가장 빈번히 나타나는 범주 또는 수치로, 주로 명목변수에 사용된다.
- 중위수: 중위수는 한 변수의 값을 가장 작은 것에서 큰 순서로 배열하였을 때, 전체를 양분하는 중앙(50%)에 놓이게 되는 값으로 주로 등간, 비율 변수에 사용된다.
- 평균: 한 변수의 분포에 속한 모든 사례의 점수를 합하여 전체 사례수로 나눈 값으로, 주로 등간 및 비율변수에 사용되는 가장 기본적인 통계이다.
산포도
- 집중경향치를 중심으로 변수값들이 얼마나 밀집, 분산되어 있는가를 말하며, 산포도를 파악하기 위해 사용하는 통계로는 범위, 사분위범위, 변량(분산), 표준편차 등이 있다.
- 범위: 어떤 한 변수의 최저값과 최대값의 차이를 말하는 것으로, 계산이 쉬운 것이 장점이나 극단치가 존재할 경우 의미 있는 수치를 제공해주지 못하는 단점이 있다.
- 사분위범위: 분포에서 하위 25%와 75%에 해당되는 값의 차이로, 중앙 50%의 분포에 초점을 두고 있기 때문에 양쪽 극단치의 영향을 배제할 수 있다.
- 변량(분산): 변수의 각각의 값에서 평균을 뺀 값을 제곱하여 합한 것을 다시 사례수로 나눈 것으로, 변수의 값들이 평균으로부터 얼마나 떨어져 있는가를 알아보기 위한 통계이다.
- 표준편차: 변량(분산)의 제곱근으로 변량(분산)을 구하는 과정 중 제곱으로 인해 왜곡된 수치를 원래의 상태로 환원하여 평균에서 떨어진 거리의 개념을 명확히 한다는 의미에서 의의가 있다.
정규분포곡선
- 무한히 큰 표본을 선정하여, 그 표본의 어떤 특성의 분포를 나타낸 형태의 곡선을 정규분포곡선이라고 한다.
- 정규분포곡선은 좌우대칭형이고, 종모양이다.
- 정규분포곡선은 평균과 중앙값, 최빈치가 분포의 중앙에서 일치하고, 면적의 합은 1이며, 평균선은 종 모양의 분포를 완전히 절반으로 나눈다는 특징이 있다.
- 정규분포곡선이면서 평균이 0이고, 표준편차가 1인 곡선을 특별히 표준정규분포곡선이라고 부른다.