본문 바로가기

통계9

클러스터링 분석 - (2) 결측값 클러스터링 분석 두 번째 시간, 결측값(missing value) 처리 방법에 대한 이야기입니다. 클러스터링 분석을 위한 변수의 조건 지난 시간에 클러스터링 분석(Distance-based Method를 활용할 경우에 한 함)을 위해서는 개체 특성 간의 차이 계산이 가능하도록 변수가 연속형 변수의 형태를 띄고 있어야 한다는 이야기를 했습니다. 그런데 차이 계산을 위해서는 변수의 값들이 크기를 가진 숫자 형태라는 조건 말고 또 다른 조건이 필요해요. 그것은 바로 개체들이 빠짐없이 값을 갖고 있어야 한다는 점입니다. 예를 들어 어떤 변수(특성)를 고객을 구분하는 중요한 단서 중 하나로 사용하려고 하는데, A라는 고객은 그 변수(특성)에 해당하는 값을 가지고 있지만, B라는 고객은 값을 가지고 있지 않다면 어.. 2021. 12. 19.
채용시장 규모, '일자리행정통계'로 엿보기 '평생 직장' 개념이 사라지는 시대. 그렇다면 얼마나 많은 사람들이 직장을 옮기거나 새로 찾고 있을까요? 지난 12월 7일 통계청이 발표한 ‘일자리행정통계’에서 답을 찾을 수 있습니다. 일자리행정통계란? 일자리의 규모와 증감을 기업 특성별로, 또 근로자 특성별로 볼 수 있도록 매년 작성되며, 고용 및 일자리 관련 정책 수립에 활용되는 통계 자료입니다. 이것은 설문조사를 통해 결과를 수집하는 전수조사, 표본조사와는 달리, 사회보험, 과세자료 등의 행정자료를 통해 작성되기 때문에 '가공통계'의 성격을 갖습니다. 일자리행정통계 통계설명자료 2020년 일자리행정통계 결과 이직시장, 채용시장의 규모 아래 그림을 보시면 이직, 신규 채용을 포함한 국내 채용시장의 크기를 확인해 볼 수 있습니다. 2020년 일자리는 .. 2021. 12. 16.
반응형