저번에 만들어놓은 컨텐츠의 양이 장난 아니다라는 얘기가 있었다.


연구실 영민님의 개인 블로그에서도 얘길 하지만 그냥 다짜고짜 시작하는게 맞지 않겠느냐? 실제로 우리가 진행하면서 시행착오를 쓰는게 더 낫지 않겠느냐? 동영상을 하는게 낫지 않겠느냐의 의견도 주고 받앗다.  > 영민님 블로그 (클릭)


고민하다가 그냥 글로 남기는게 좋겠다라는 생각이 들어서 목차를 바꿀까 한다. (바꿀까?)


일단 기본 공간정보를 다루는것은 중요한 일이기 때문에 이부분은 그대로 진행하는걸로 한다.



공간정보의 세세한 설명보다는 이 글을 읽는 사람은 어느정도의 공간데이터를 다루는 지식이 있다고 가정하고 진행하겠다. (즉, shp이뭔지, dbf가 뭔지 shx가 뭔지 prj가 뭔지..)


대부분 대학원생 및 연구원들의 한계는 이 데이터를 어디서 구하느냐이다.



정부 3.0 이다 뭐다 한국형 오픈 어쩌고 해서 최근 공공데이터가 많이 공개되었다.

기본적으로 내가 개인적으로 많이 이용하는 데이터는 국토부와 통계청이다. (링크 걸어놓음)



국가공간정보포털

통계청

국토지리정보원


이 정도인것 같다.


그리고 민간?업체의 경우 비즈지아이에스 가 있을테고

그밖의 원하는 자료는 Crawling 하거나, 아름아름 구해보기도하고, 만들어보기도 한다.

여기서 Crawling이나 Editing을 가르쳐주는것은 힘들것 같다. 그래서 위 데이터를 어떻게 지지고 볶아야 하는지에 대해서 설명할까 한다.



자 일단 그러면 통계청 데이터를 사용해보자.


통계청데이터는 굉장히 여러가지가 있다. 그중에서 내가 갖고 있는건 뭐 사업체, 인구총괄, 뭐 교육별, 산업분류별 등등 다양하다 (이들은 속성이고)

도로경계, 집계구경계 등 다양한 형태의 shp 도 제공한다.





그러나 통계청은 집계구 경계가 큰 의미를 갖는다고 할 수 있다.

한편 txt 파일로 제공해주는 속성도 양이 어마어마 하다. 어머어마 한 만큼 데이터를 보면 편집하기 까다롭다.



필드명은 없고 첫 컬럼은 년도, 두번째 컬럼은 집계구 번호, 3번은 속성의 종류? 4번은 속성값이다.

여기서 나는 성연령별 인구기 때문에 각 집계구에 001~054까지의 해당하는 속성값이라고 이해하면 될 것이다.

그럼 집계구 shp과 위 데이터를 ArcMap에서 한번 확인해보자. (언제나, 배경은 서울대를..)



그런데 저렇게 되있으면 못쓴다.

그래서 나는 일반적으로 속성 데이터의 경우 QGIS에서 구분자를 넣어서 dbf로 만든다음 ArcMap으로 불러와서 사용한다.


이렇게

변환이 되지롱~


그리고 Field_3의 QUERY를 통해 원하는 정보를 뺀다음 이를 집계구 shp 과 join 하면 된다.


그럼 in_age_***이 무엇인가?

통계청의 자룐 이렇게 말하고 있다.


그렇기에 내가 만약에 4세 이하의 인구를 뽑고 싶다라고 하면

"field_3" = 'in_age_001' 이렇게 날린 후 집계구 shp과 join을 하면 완성 된다. 이를 여러번 (54번) 하면 집계구 shp 은 다음과 같은 속성을 갖을 수 있다.



물론 저걸 노가다 할 수 있지만 노가다 하면 안되니까 자동화 하면 된다.

그 방법은 연구실을 떠나기전 후배들에게 전수하고 갈려고 한다.
조금 있다가 후배들이랑 공동 연구 하러 갈꺼라서 여기 까지 쓸란다.

결론, 통계청 데이터는 저렇게 쓰시면 됩니다~


반응형

+ Recent posts