본문 바로가기

IT Story/SQL Story

국가 통계 데이터 분석하기: 행정 구역별 인구 분석하기

kosis.kr에 접속

01. 행정 구역별 인구 데이터 내려받기

-csv 형태로 저장된 데이터 파일 확인하기

 

02. SQL Server로 데이터 가져오기 전에 사전 작업하기

- 데이터를 가져오는 작업을 ETL이라 한다. 다운로드한 파일을 열고 다른 이름으로 저장한다[Excel97-2003 통합문서(*.xls)]

 

03. SSMS에서 엑셀 파일을 읽어 데이터베이스로 가져오기

 

04. TOP N문으로 상위 10개 데이터 확인하기

SELECT TOP 10 * FROM census_2015_2020

 

05. 행정구역 정의 확인하기

SELECT

     [C행정구역별(읍면동)],        --한글이므로 대괄호 사용

     [행정구역별(읍면동)]

FROM census_2015_2020

GROUP  BY   [C행정구역별(읍면동)],  [행정구역별(읍면동)]

결과

C행정구역별(읍면동) 행정구역별(읍면동)
00                                 전국
03                                 동부
04                                 읍부
05                                 면부
11                                  서울특별시
11010                           종로구

 

06. 행정구역별 데이터 개수 확인하기

SELECT

    LEN ([C행정구역별(읍면동)]), COUNT(*) AS CNT

FROM census_2015_2020

GROUP  BY   LEN([C행정구역별(읍면동)])

결과

(열 이름 없음) CNT
7                       6982
5                        1821
2                        126

행정 코드에 따라 2,5,7 자릿수를 가지며 행수는 코드가 낮을수록 적다. 이를 통해 코드 자릿수가 낮은 지역이 상위 행정구역임을 알 수 있다.

 

07. 행정 코드 자릿수를 이용해 행정 구역 범위 살펴보기

SELECT

     [C행정구역별(읍면동)],  [행정구역별(읍면동)]

FROM census_2015_2020

WHERE LEN ([C행정구역별(읍면동)]) = 2

GROUP  BY   [C행정구역별(읍면동)],  [행정구역별(읍면동)]

결과

C행정구역별(읍면동)   행정구역별(읍면동)
00                                    전국
03                                    동부
04                                    읍부
05                                    면부
11                                    서울특별시
21                                    부산광역시
22                                    대구광역시

0X는 전국, 1X~3X는 각 광역시와 도의 행정구역이다.