본문 바로가기

카테고리58

클러스터링 분석 - (1) 범주형 변수 클러스터링(군집) 분석을 하면서 고민했던 부분들을 조금씩 정리해 보려고 합니다. 분석 기법에 대한 이야기보다는 실무에서 클러스터링 분석을 진행하면서 고려할 부분이나 미리 염두에 두면 좋을 부분들에 대한 이야기가 주가 될 것 같습니다. 오늘은 그 첫 번째 시간으로 범주형 변수(categorical variables)에 대한 이야기를 해볼께요. 범주형 변수 이야기를 하기에 앞서 클러스터링 분석을 위한 방법론은 다양하지만, 잘 알려지고, 또 흔히 많이 사용되는 방식은 ‘거리’를 이용한 방식(Distance-Based Methods)입니다. 클러스터링은 쉽게 말하자면 유사한 것끼리 묶어주는 작업을 의미합니다. 여기서 이 유사한 정도를 계산하기 위한 단위로 ‘거리’를 사용한다는 의미죠. 이 ‘거리’라는 것은 짝지.. 2021. 12. 18.
채용시장 규모, '일자리행정통계'로 엿보기 '평생 직장' 개념이 사라지는 시대. 그렇다면 얼마나 많은 사람들이 직장을 옮기거나 새로 찾고 있을까요? 지난 12월 7일 통계청이 발표한 ‘일자리행정통계’에서 답을 찾을 수 있습니다. 일자리행정통계란? 일자리의 규모와 증감을 기업 특성별로, 또 근로자 특성별로 볼 수 있도록 매년 작성되며, 고용 및 일자리 관련 정책 수립에 활용되는 통계 자료입니다. 이것은 설문조사를 통해 결과를 수집하는 전수조사, 표본조사와는 달리, 사회보험, 과세자료 등의 행정자료를 통해 작성되기 때문에 '가공통계'의 성격을 갖습니다. 일자리행정통계 통계설명자료 2020년 일자리행정통계 결과 이직시장, 채용시장의 규모 아래 그림을 보시면 이직, 신규 채용을 포함한 국내 채용시장의 크기를 확인해 볼 수 있습니다. 2020년 일자리는 .. 2021. 12. 16.
반응형