[All about 따릉이 EDA, 번외] 데이터에 없는 따릉이 대여소의 지역구 데이터 얻기
이번 글에서는, 데이터에는 없는 지역구에 대한 데이터를 얻는 방법을 다룬다. 기본적으로, 대여소명을 활용하고, 다음의 과정을 거친다. 공개된 대여소 데이터로 지역구 데이터를 얻는다. 대여소명과 카카오맵 rest api를 통해 얻는 방법에 대해 다룬다. 이 과정 중에, 카카오맵 rest api 사용법도 간략히 살펴보게 된다. 결과적으로 {대여소 이름: 지역구} 인 dictionary를 얻는다. 예를 들어 아래와 같다. {'MCM 본사 직영점 앞': '강남구', '교보타워 버스정류장(신논현역 3번출구 후면)': '강남구', '논현역 7번출구': '강남구', '신영 ROYAL PALACE 앞': '강남구', '압구정 한양 3차 아파트': '강남구', '압구정역 2번 출구 옆': '강남구', '압구정파출소 앞'..
[All about 따릉이 EDA, 5편] 마포구, 따릉이는 얼마나 어떻게 이용되고 있을까?
이번 글에서는, 서울 시내 지역구 중, 15년도부터 꾸준하게 따릉이 이용률이 높았던 지역인 마포구에 대해 좀 더 자세히 알아보려 한다. 저번과 마찬가지로 18년 9월 데이터를 통해 살펴본다. (*9월은 1년 중, 따릉이 이용량이 가장 높은 달이다. 대표적인 패턴을 가장 잘 보여줄 수 있는 기간이라 생각하여 9월 한 달만을 표본으로 선택하였다.) 1. 이용 수치량 살펴보기 가장 먼저, 수치적으로 쉽게 살펴볼 수 있는 것부터 보자. 시간에 따른 이용량 패턴, 이용거리, 시간 등이다. 1.1. 시간대별 사용량 평일의 경우, 아침 8시와 저녁 18시에 고점을 찍는 패턴은,일반적인 서울시 따릉이 패턴과 같다. **한편, 아침 8시엔 반납량이 대여량보다 더 많고, 저녁 18시에는 대여량이 더 많은 걸로 보아서, 마..
[All about 따릉이 EDA, 4편] 따릉이, 유저 분석해보기
따릉이를 주로 타는 사람들은 과연 누구일까?? 남자일까? 여자일까? 또, 20대가 주로 탈까? 50대 이상은 잘 타지 않을까? 한편, 따릉이로 장거리 주행하는 사람들은 대체 누굴까?? 이번 글에서는, 이러한 호기심을 바탕으로, 따릉이 이용자에 대한 분석을 해본다. 데이터는 2017년 1월 ~ 2018년 12월 따릉이 데이터를 사용한다. 1. 성별로 나누어 살펴보기 1.1. 남자와 여자, 둘 중에 누가 더 많이 사용할까? 2년 동안의 남녀 이용량과 이용비율을 시각화 해서 보자. 너무나 직관적으로 다음과 같이 말할 수 있다. 남자가 더 많이 사용했고, 남성 이용자가 전체의 62.4% 다. 한편, 덧붙이면, 남자가 여자보다 65%(여자 이용기준) 더 많이 이용한다. 1.2. 년, 월별로 이용자의 남녀 비율 변..
[All about 따릉이 EDA, 3편] 따릉이 이용량 더 자세하게 살펴보기
이전 글에 이어, 이번에는 좀 더 딥하게 탐색해보기로 한다. 이전에는 15년 9월 - 18년 11월의 일일 데이터를 다루었다면, 이번에는 가장 최근에 이용량이 많았던 18년 9월 시간별 데이터만 보기로 한다. 이제부터는 요일, 시간 단위의 데이터를 볼 수 있다. 덧붙여, 아무래도 이전 글과 다른 데이터라, 별도로 글을 나누어 써본다. 1. 어떤 요일, 시간에 이용량이 많았을까? 가장 쉽게 떠오를 수 있는 질문이다. 요일, 시간, 그리고 지역별로 하나씩 살펴보자. 1.1. 요일별 이용량 평일보다 주말 이용량이 더 많은 것을 알 수 있다. 또, 평일 중엔 화요일 수요일이. 주말에는 토요일 이용량이 많다. 1.2. 시간별 이용량 평일과 주말에 따라 패턴이 다를 듯하여, 두 경우로 나누어 시각화 해보았다. 다음..