2014년 8월 12일 화요일

수도권 지하철 역별 시간대별 혼잡도 Visualization (1)

R의 Data Visualization 관련 기능들 공부도 할겸, 매일 매일 지겹게 이용하는 지하철과 관련하여 무언가 해보기로 했다.

이용한 데이터는 서울 열린 데이터 광장 (http://data.seoul.go.kr/openinf/sheetview.jsp?infId=OA-2731)에서 얻을 수 있다.

y축의 수치가 의미하는 바는 아래와 같이 %이며, 이는 열차 1량의 정원 160명을 100으로 두고 상대적으로 얼마나 많이 탔는지를 나타낸다.
(80% 정도만 되어도 복잡하고 쾌적하지 못한 느낌이 된다.)

지하철의 혼잡도에 대한 부가적인 설명은
http://urban.seoul.go.kr/4DUPIS/wordsearch/content_word.do?iword_no=1143 참조.

중앙에 3열로 빽빽하게 서있고, 출입문에 10명 정도가 서있는 경우가 200% 즉 320명이 되는, 힘빼고 서있어도 안넘어질 상태가 된다. -_-;;
8시~9시 사이의 사당 -> 강남 방향 평균이 185% 이니 이와 비교해서 상상하시면 될것 같다. 1시간 동안의 평균 수치라는데서 좀 조심해야 할 수도 있지만, 다녀본 사람은 알듯이 사당~강남 8~9시는 거의 균일하게 hell이다.

결과물은 아래. (그래프는 클릭하면 커짐)
그래프에 종점과 베드타운, 밤문화가 발달한 번화가 등에 따른 혼잡도 패턴이 확연히 나타난다. 평일 데이터만 분석했는데 주말 데이터도 분석하면 재미있는 결과가 나올것 같다.

googleVis 라이브러리를 사용해서 시간대에 따라서 움직이는 형태를 만들어보려 했지만,
역이 너무 많아서 gg치고 그냥 ggplot으로 적당히 마무리했다.
분석을 위해선 데이터를 원하는 형태로 cleansing하는 시간이 제일 많이 걸린다는 것을 느낀 작업.

14.08.16 역별 특성 클러스터링 결과는 여기에.
수도권 지하철 역별 시간대별 혼잡도 Visualization (2)











댓글 없음:

댓글 쓰기