본문 바로가기

공공데이터

(5)
[All about 따릉이 EDA, 번외] 데이터에 없는 따릉이 대여소의 지역구 데이터 얻기 이번 글에서는, 데이터에는 없는 지역구에 대한 데이터를 얻는 방법을 다룬다. 기본적으로, 대여소명을 활용하고, 다음의 과정을 거친다. 공개된 대여소 데이터로 지역구 데이터를 얻는다. 대여소명과 카카오맵 rest api를 통해 얻는 방법에 대해 다룬다. 이 과정 중에, 카카오맵 rest api 사용법도 간략히 살펴보게 된다. 결과적으로 {대여소 이름: 지역구} 인 dictionary를 얻는다. 예를 들어 아래와 같다. {'MCM 본사 직영점 앞': '강남구', '교보타워 버스정류장(신논현역 3번출구 후면)': '강남구', '논현역 7번출구': '강남구', '신영 ROYAL PALACE 앞': '강남구', '압구정 한양 3차 아파트': '강남구', '압구정역 2번 출구 옆': '강남구', '압구정파출소 앞'..
[All about 따릉이 EDA, 4편] 따릉이, 유저 분석해보기 따릉이를 주로 타는 사람들은 과연 누구일까?? 남자일까? 여자일까? 또, 20대가 주로 탈까? 50대 이상은 잘 타지 않을까? 한편, 따릉이로 장거리 주행하는 사람들은 대체 누굴까?? 이번 글에서는, 이러한 호기심을 바탕으로, 따릉이 이용자에 대한 분석을 해본다. 데이터는 2017년 1월 ~ 2018년 12월 따릉이 데이터를 사용한다. 1. 성별로 나누어 살펴보기 1.1. 남자와 여자, 둘 중에 누가 더 많이 사용할까? 2년 동안의 남녀 이용량과 이용비율을 시각화 해서 보자. 너무나 직관적으로 다음과 같이 말할 수 있다. 남자가 더 많이 사용했고, 남성 이용자가 전체의 62.4% 다. 한편, 덧붙이면, 남자가 여자보다 65%(여자 이용기준) 더 많이 이용한다. 1.2. 년, 월별로 이용자의 남녀 비율 변..
[All about 따릉이 EDA, 3편] 따릉이 이용량 더 자세하게 살펴보기 이전 글에 이어, 이번에는 좀 더 딥하게 탐색해보기로 한다. 이전에는 15년 9월 - 18년 11월의 일일 데이터를 다루었다면, 이번에는 가장 최근에 이용량이 많았던 18년 9월 시간별 데이터만 보기로 한다. 이제부터는 요일, 시간 단위의 데이터를 볼 수 있다. 덧붙여, 아무래도 이전 글과 다른 데이터라, 별도로 글을 나누어 써본다. 1. 어떤 요일, 시간에 이용량이 많았을까? 가장 쉽게 떠오를 수 있는 질문이다. 요일, 시간, 그리고 지역별로 하나씩 살펴보자. 1.1. 요일별 이용량 평일보다 주말 이용량이 더 많은 것을 알 수 있다. 또, 평일 중엔 화요일 수요일이. 주말에는 토요일 이용량이 많다. 1.2. 시간별 이용량 평일과 주말에 따라 패턴이 다를 듯하여, 두 경우로 나누어 시각화 해보았다. 다음..
[All about 따릉이 EDA, 2편] 따릉이, 이용량은 얼마나 변했을까? 이번에 알아보려고 하는 것은, 2015년 9월 - 2018년 11월까지의 따릉이 사용량에 대한 이야기다. 즉, 이전에 없던 시간의 개념이 분석에 더해진다. 년도, 월에 따라 사용량이 어떻게 달라지는지. 각 지역별로 차이가 있는지 등, 시간에 따라 사용량이 어떻게 달라지는지, 세세히 살펴보자. 여기서 사용량은 대여량 + 반납량을 말한다. 1. 연, 월 기준 사용량은 어떨까? 먼저 연, 월 기준으로 막대그래프를 그려보자. 확실히 해가 지날수록, 사용량이 많이 늘고있음을 알 수 있다. 다음으로 월 기준으로 보면, 여름 전후인, 5월 그리고 9, 10월에 피크를 찍고, 가장 사용량이 많은 달은 9월이다. 추운 겨울과, 더운 여름에는 사용량이 줄어드는 듯 보인다. 무엇보다, 1년을 주기로 이러한 패턴을 보인다. ..
[All about 따릉이 EDA, 1편] 대여소 살펴보기 짧은 서론. 무엇을 왜 하는가? 서울시에서 최근 계속해서 공공데이터를 많이 개방하고 있다. 그 중 가장 친숙하고도 대표적인 데이터는 '서울시 공공자전거', 일명 '따릉이' 데이터라는 생각이 든다. 이젠 정말 길거리에서 흔하게 볼 수 있는 따릉이. 이 글 시리즈에서는, 공개된 데이터를 통해 따릉이 이용과 사용 현황을 살펴보고자한다. 즉, 데이터를 다양하게 시각화 해보며, 해석해보는 EDA 를 해보고자 하는 것이다. 그럼 이걸 왜하느냐? 별 이유는.. 없다. 그냥 재밌을 것 같다. 하다보면 몰랐던 사실들도 알게될 수도 있을 것이고, 그냥 소소한 상식으로 쌓아갈 수 있지 않을까? 일단 무작정 데이터 속으로 들어가보자. 데이터는 2018년 11월 29일자 데이터다. 서울시내 따릉이 대여소 살펴보기. 이번 편에서..