본문 바로가기

프로젝트들

[All about 따릉이 EDA, 5편] 마포구, 따릉이는 얼마나 어떻게 이용되고 있을까?

이번 글에서는, 서울 시내 지역구 중, 15년도부터 꾸준하게 따릉이 이용률이 높았던 지역인 마포구에 대해 좀 더 자세히 알아보려 한다.
저번과 마찬가지로 18년 9월 데이터를 통해 살펴본다.
(*9월은 1년 중, 따릉이 이용량이 가장 높은 달이다. 대표적인 패턴을 가장 잘 보여줄 수 있는 기간이라 생각하여 9월 한 달만을 표본으로 선택하였다.)


1. 이용 수치량 살펴보기

가장 먼저, 수치적으로 쉽게 살펴볼 수 있는 것부터 보자.
시간에 따른 이용량 패턴, 이용거리, 시간 등이다.

1.1. 시간대별 사용량

왼쪽은 평일, 오른쪽은 주말의 평균 사용량을 나타낸다.

평일의 경우, 아침 8시와 저녁 18시에 고점을 찍는 패턴은,일반적인 서울시 따릉이 패턴과 같다.
**한편, 아침 8시엔 반납량이 대여량보다 더 많고, 저녁 18시에는 대여량이 더 많은 걸로 보아서,
마포구가 아닌 다른
지역에서 마포구로 출퇴근하는 사람들이 많다는 걸 짐작**할 수 있다.

주말의 경우, 전 시간대에서 대여/반냡량이 비슷함을 알 수 있다.

1.2 시간대별 이용거리, 이용시간

왼쪽은 시간대별 이용거리 중간값, 오른쪽은 이용시간 중간값을 나타낸다.

먼저 이용거리, 이용시간 둘다평일과 주말의 패턴이 크게 다르지 않음을 알 수 있다.
전체적인 량으로 보면, 주말이 높다. 이는 서울시 전체 따릉이 패턴과 동일하다.
또한, 평일과 주말 모두 다, 16시 - 22시 사이에 이용량이 많은걸 볼 수 있다.


2. 주로 어떤 사람들이 이용했을까?

이번에는 유저 분석이다.
이전 포스팅과 같이 기준을 성별, 연령대 순으로 살펴본다.

2.1. 성별 기준

남자 이용량이 훨씬 많은 건, 서울시 전체 패턴과 동일하다.
다만, 이용비율을 보면 남녀 비율이 59:41로,
서울시 전체에서는 62:37 이었던 것과 비교해보면, 다른 지역구보다 여성비율이 조금 더 많은 편(4% 정도)이다.

2.2. 연령대 기준

전체적인 패턴은 서울시 전체 패턴과 다를 게 없고, 연령대별 비율에서 조금 차이가 내보인다.
굳이 시각화해서 보자면, 다음과 같다.

차이가 큰 순으로 정렬

가장 크게 차이 나는 건 20대인데, 그래 봐야 약 2% 차이밖에 안 났다.
나머지 연령대는 1% 미만이므로, 그다지 유의미한 차이는 아니라고 본다.
즉, 서울시 전체 비율과 거의 같다고 볼 수 있다.


3. 대여소 별로 사용자들이 다를까?

이번에는 대여소 단위로 볼까 한다.
살펴보고자 하는 것은, 남녀 이용자 비중이 크게 다른 대여소가 있는지,
혹은 연령별로 주로 어디 대여소를 사용하고, 연령별로 차이가 있는지 등을 살펴본다.

3.1. 대여소 별로 남녀비율이 많이 다를까?

이를 위해, 대여소별 이용량을 남녀 기준으로 나눠서 시각화해보자.

가운데 회색선은 마포구 전체 이용 성별비율 기준 선(0.41)이다.

아까 전, 위 '2.1 성별비율' 에서, 마포구 따릉이 이용의 성별 비율은 남:녀 = 59:41 이라고 했다.
가운데 회색선은 이 41을 나타낸다. 즉, 이 선이 일반적인 남녀 비율의 평균(기준)이 된다.

이 선(값 0.41)을 기준으로 오른쪽으로 넘어간 빨간색 막대들 (여성 비율이 0.41 이상인 대여소)은 여성비율이 조금 더 많은 곳들이다.
반대로, 이 선을 기준으로 왼쪽으로 넘어간 파란색 막대들 (남성 비울이 0.59 이상인 대여소)은 남성 비율이 더 많은 곳들이다.

한편, 이 선을 기준으로 위 조건에 해당하는 막대들은 정규분포 모양을 하고 있음을 짐작할 수 있다.

회색선(0.41)을 기준으로 각 대여소별 비율 차이 분포

단순히 0.41을 조금 넘는다고 이 대여소는 남녀 비율 차이가 있다! 라고 말하기는 좀 오버스러운 거 같으니,
0.41과의 차이 즉, 편차가 2배 이상 차이가 나는 대여소들만 비율 차이가 있다고 해석해보자.

이렇게 2배이상 차이나는 대여소들은 다음과 같았다.

여자 비율이 유의미하게 더 높은 대여소들 (괄호 안의 값은 0.41 기준과의 차이)
- 상암 월드컵파크 9단지 앞 (0.20)
- 망원초록길 입구 (0.16)

남자 비율이 유의미하게 더 높은 대여소들
- 서강대 남문 옆 (0.18)
- DMC빌 앞 (0.16)
- 서강대 정문 건너편 (0.15)

굳이 해석을 하자면, 서강대학교 근처 대여소들은 남자들이 더 많이 탄다는 정도?
전체 73개의 대여소 중, 5개의 대여소만 유의미했으므로 (전체의 6%),
일반적으로 대여소 별 남녀 이용자 비율이 유의미하게 다르다고 보긴 힘들듯 하다.

3.2. 대여소 별로 연령대 비율이 많이 다를까?

이번엔 연령대 기준으로 모든 대여소를 살펴본다.
만약, 유의미하게 다르다면, 각 연령대별 사용비율이 높은 대여소들이 어딘지 살펴볼 수 있을 것이다.

대여소 순서는 이용 비율이 제일 많은 20대 기준으로 정렬하였다.
일단 이렇게 보니, 대여소 별 연령대 비율은 달라 보이긴 한다.
아무래도, 성별은 전체량을 나누는 카테고리가 2개였고, 연령대는 7개이다 보니, 변동 폭도 훨씬 커 보인다.

위 그래프는 마포구의 모든 대여소의 연령대 비율을 정규화한 분포를 나타낸 것이다.
즉 x축에 있는 값 하나가, 한 대여소에서의 해당 연령의 비율을 나타낸다.
(여기서는 물론 정규화해서 값 자체로는 의미가 없다. 여기서는 연령대별 분포 비교에 의미를 둔다.)

보면, 20대의 경우 정규분포를 제일 정확히 그리고 있으며,
10대, 40~60대의 경우 거의 같은 분포를 그린다.
60대의 경우, 편차가 제일 적었다.

즉, 20대는 대여소간에 편차가 좀 있다는 거고,
70대~의 경우, 대여소간 편차가 별로 없다는 말이다. (즉 다 비율이 다 고만고만하다는 뜻)

하지만, 아래 rug 를 보면, 70대에 속한 값 하나가 매우 극단적으로 높은 걸 알 수 있는데, 이는 특정 대여소가 다른 대여소들보다 압도적으로 사용되고 있음을 말한다.

이렇게만 봐서는 뭐가 얼마나 어떻게 다른지 직관적으로 해석이 잘 안된다.
또, 특정 연령대 비율이 높은 대여소가 어딘지 알 수가 없다.
따라서, 연령대별로 비율이 높은 대여소들을 지도에 직접 시각화해서 봐보자.

아래 시각화한 지도는 다음과 같이 보면 된다.

1. 각 포인트는 대여소를 나타낸다.
2. 색이 진할수록 이용비율이 높고, 옅을수록 낮음을 나타낸다.

- 10대

색이 진할수록 이용비율이 높은 것이다.

10대의 경우, 특정 스팟 몇 군데가 주로 비율이 높다.
다음과 같은 스팟들이다. (괄호 안의 값은 기존 연령별 이용 비율을 0~1로 정규화한 값)

1. 공덕역 2번 출구 (1.00)
2. 마포구청역 (0.90)
3. 마포 신수 공원 앞 (0.87)
4. 상암 월드컵파크 1단지 교차로 (0.84)

이런 곳이 ~10대들이 이용하는 대여소 중, 인기가 있는 곳이라 할 수 있겠다.
이 외, 그렇다 할 눈에 띄는 패턴은 보이지 않는다.

- 20대

20대의 경우, 확연히 신수동, 상수동, 그리고 신촌 쪽에 이용 비율이 높은 것을 알 수 있다.
모두 대학가 및 대학생들의 주 활동지 역임을 생각해보면, 상식적으로 이해가 간다.

- 30대

30대의 경우, 20대에게 인기가 많았던 대학가 쪽을 제외한 전 지역에 골고루 이용 비율이 비슷함을 보인다.
DMC, 망원동, 공덕동쪽이 대표적인 곳들이다.
20대와는 전혀 다른 패턴을 보이는 게 재밌는 포인트다.

- 40대

40대의 경우, 패턴이 확실하다.*_DMC쪽에 대부분의 사용이 몰려있다.
*_한편, 망원동, 신수동 등 20-30대들의 주 플레이스였던 곳에는 눈에 띄게 사용비율이 적음을 알 수 있다.

- 50대

50대의 경우, 40대의 패턴이 비슷해 보인다. 즉, DMC 쪽으로 이용 비율이 쏠려있다.
다만, 40대에서 높았던 몇 군데의 대여소의 이용비율이 조금 줄고, 공덕동 쪽에 40대보다 조금 더 많은 이용 비율을 보인다.

- 60대

60대의 경우, 마포구청 일대 그리고 창천동 일대에 주로 사용비율이 쏠려있다.
아무래도 주택 주거지가 많은 지역들이다.

- 70대~

70대의 경우도, 패턴이 확실하다. DMC, 그것도 DMC 내 특정 지역에 몰려있다.
나머지 대여소들의 이용 비율은 고만고만하다.
다른 패턴들에 비해 매우 뚜렷해서 인상적이다.


4. 어느 대여소간 따릉이 이동이 많을까?

이번에는, 따릉이의 구체적인 트래픽에 대해 살펴본다.
정말 구체적인 따릉이가 지나온 경로 데이터까지 있으면 좋겠지만, 아쉽게도 구체적인 경로는 없고,
다만 어느 대여소에서 어느 대여소로 이동했는지 정도는 데이터에 있다.

이를 러프하게 시각화하면 대략 다음과 같다.

언뜻 뭔가 보이기는 하지만, 선도 너무 많고 해석하기 힘든 시각화이므로, 다음을 기준으로 시각화해보려 한다.

1. 대여소는 점으로 표시한다.
2. 대여소의 이용량(대여+반납량)은 투명도로 표현한다.
3. 대여소 -> 대여소의 경로는 선으로 표현한다.
4. 해당 경로를 이용한 량은 선의 투명도로 표현한다. 즉 짙으면 이용량이 많다는 뜻이다.
5. 어느정도 이용량이 많은 경로(선)는 해당 경로의 방향을 표시한다. (이는 모든 경로에 화살표를 그리면 제대로 보기 힘들기 때문이다)
6. 평일만 살펴본다. (주말은 제외)
7. 시간 순으로 살펴볼 것인데, 모든 시간대를 다 그려서 포스팅하면, 너무 많으므로, 나름 의미를 부여한 시간순으로 살펴볼 것이다.

이제 본격적으로 시간에 따라 살펴보자.

4.1. 출근 시간대(7시~10시 사이)

DMC, 홍대입구역 2번 출구 쪽 트래픽 활성화

눈에 띄게 이동량이 많은 경로는 다음과 같았다.

  • (연남동 쪽 아파트 / 연희삼거리) -> 홍대입구역 2번 출구
  • DMC역 9번 출구 앞 -> (누리꿈 스케어 옆 / DMC산학협력 연구센터 옆)

별다른 설명 없이, 위 시각화만 보고도, 출근시간 대에 주로 자전거 이동이 어떻게 움직이는지 알 수 있다.
압도적인 출근지점은 홍대입구역과 DMC역 근처 일터라고 볼 수 있다.

4.2. 낮 시간대 (10시~17시 사이)

홍대입구역 2번 출구 외 전체 트래픽 활성화

출근 시간대보다 전반적인 대여소들이 비교적 활성화된 것을 알 수 있다.
이동경로를 보면, (연남동 쪽 아파트 <-> 홍대입구역 2번 출구) 이 제일 활발한 것을 알 수 있고,
다른 경로들도 평균적으로 많이 활발해진 것을 알 수 있다.

4.3. 퇴근 시간대 (17시~20시 사이)

망원동, 합정동, 홍대입구역 2번 출구 쪽 트래픽 활성화

한강 바로 위에 있는 망원동-합정동 라인의 대여소들이 유독 활발해졌다.
한편, 화살표가 뜬 이동경로를 살펴보면, 출근했던 방향의 반대 방향으로 트래픽이 증가함을 알 수 있다.

4.3. 저녁 시간대 (20시~24시 사이)

망원동, 홍대입구역 2번 출구 쪽 트래픽 활성화

망원동 쪽 대여소(마포구민 체육센터 앞)의 이용량이 지금까지 이용량 1위였던 홍대입구역을 제쳤다.
이동경로는 이전만큼 뚜렷치 않다.

아래 그래프는, 시간에 따른 대여소 이용량 분포를 정규화한 분포다.
즉, x 축 값 하나하나는 해당 시간대의 한 대여소의 이용량을 나타낸다. (정규화하여 수치는 의미 없음.)

먼저, 이 그래프를 통해서 대여소의 이용량이 전체적으로 어떻게 바뀌어나가는지 알 수 있다.

이 분포는 0~1로 정규화되어있다. 각 시간대별로 항상 0과 1이 기준이 되는 값들이 존재하고 그 사이에 분포가 어떻게 형성되어있는지를 알아보려는 것이다. 한편, 대여소의 이용량 분포를 통해, 트래픽이 어떻게 형성되어있는지 짐작할 수도 있다.

먼저, 출근시간대(7시~10시)를 보면, 왼쪽으로 굉장히 skewed 하다. 즉, 이용량이 몇몇 대여소로 쏠려있다는 것을 말한다.
위에서 살펴봤던 대로, '홍대입구역 2번 출구 앞' 대여소나, 'DMC역' 대여소가 이렇게 사용량이 쏠려있는 대여소다.
이 몇몇 대여소의 사용량이 다른 대여소의 사용량보다 압도적임을 나타낸다.
트래픽 역시, 이 대여소들로 쏠려있음을 짐작할 수 있다.

한편, 10시-17시 사이가 되면 이런 skewed 가 조금 덜 해진다.
즉 이전 시간대보다 몇몇 대여소의 사용량이 압도하는 현상이 줄어들었다는 것이다.
위 시각화된 지도에서 보면, 대여소들의 전반적인 트래픽이 활성화되었는데, 이와도 일맥상통한다고 볼 수 있다.
이와 비슷한 현상은 20-24시에도 동일하게 등장하고, 나머지 시간대도 비슷하다고 볼 수 있다.

혹시나 놓치는 부분이 있을까봐, 각 대여소 별 이용량 히트맵도 시각화해본다.
굳이 해석하진 않고, 다르게 시각화하여도 위에서 해석한 내용과 일치한다는 것을 보여주기 위한 일종의 참고자료로 남겨둔다.


5. 어느 지역으로 유입/유출이 많을까?

마포구로 들어오고 나가는 따릉이들 중, 어느 지역과 가장 트래픽량이 많을까?

유출-유입이 선형적인 관계에 있음을 알 수 있다. 즉, 유출이 많은 지역이 유입도 많다.
한편, 상식적인 얘기겠지만, 역시나 인근 지역으로의 트래픽이 많다.
서대문 > 영등포 > 은평구 > 영등포 순이고, 모두 마포구를 둘러싸고 있는 인근 지역들이다.

지도로 시각화하면 다음과 같다.

왼쪽은 유출량이고, 오른쪽은 유입량이다.


정리

사용량이 가장 많은 지역 중 하나인 마포를 살펴보았다.
발견한 내용을 하나씩 정리하면,

  • 근처 지역에서 출퇴근이 어느 정도 활발한 지역이다.
  • 출근 시간에, 외부 유입이 약 30-35% 정도, 퇴근 시간에는 외부 유출이 25-30% 정도 된다.
  • 출퇴근 시간에 DMC역, 연남동, 홍대입구역을 중심으로 트래픽량이 활발하다.
  • 저녁 시간대에는 한강을 끼고 있는 망원동을 중심으로 트래픽이 활성화된다.
  • 모든 시간 통틀어, 아무래도 번화가의 중심지인 홍대입구역 앞이 압도적으로 활발하긴 하다.
  • 한편, 이동경로가 핫한 곳은 2~3군데로 고정되어 있다.
  • 외부 트래픽은 서대문 > 영등포 > 은평구 > 영등포 순으로 활발하고, 모두 이웃 지역이다.

데이터 출처 및 참고