본문 바로가기

시각화

(3)
데이터로 내 티스토리 블로그 EDA 하기 요즘에 좀 여유가 생겨, 이번 기회에 평소에 해보고 싶었던 내 블로그 분석글을 올려본다. 사실 분석이라고 하기엔 좀 거창하고 그냥 EDA 정도가 될 거 같다. 데이터 및 활용 도구는 티스토리 REST API 와 구글 애널리틱스를 사용했다. 어떤 사람들이 내 블로그에 왔을까? 아마 블로그 하는 사람들이 은근 신경 쓰게 되는 것이 하루 방문자 수이지 않을까 싶다. 마치, 예전 싸이월드 미니홈피의 TODAY 수랑 비슷한 느낌이라고 생각하면 된다. 특히 블로그인 만큼 내가 올린 포스팅에 대한 어떤 보상이자, 내 블로그가 성장(?)하고 있음을 직접적으로 느끼게 해주는 지표라고 생각한다. 그리고 무엇보다 블로그 관리자 대시보드에 들어가면 제일 잘 보이는 곳에 위치해있다. 그래서 내 블로그를 들어오는 사람들에 대한 ..
[All about 따릉이 EDA, 4편] 따릉이, 유저 분석해보기 따릉이를 주로 타는 사람들은 과연 누구일까?? 남자일까? 여자일까? 또, 20대가 주로 탈까? 50대 이상은 잘 타지 않을까? 한편, 따릉이로 장거리 주행하는 사람들은 대체 누굴까?? 이번 글에서는, 이러한 호기심을 바탕으로, 따릉이 이용자에 대한 분석을 해본다. 데이터는 2017년 1월 ~ 2018년 12월 따릉이 데이터를 사용한다. 1. 성별로 나누어 살펴보기 1.1. 남자와 여자, 둘 중에 누가 더 많이 사용할까? 2년 동안의 남녀 이용량과 이용비율을 시각화 해서 보자. 너무나 직관적으로 다음과 같이 말할 수 있다. 남자가 더 많이 사용했고, 남성 이용자가 전체의 62.4% 다. 한편, 덧붙이면, 남자가 여자보다 65%(여자 이용기준) 더 많이 이용한다. 1.2. 년, 월별로 이용자의 남녀 비율 변..
folium 의 plugins 패키지 샘플 살펴보기 지리 데이터 시각화 라이브러리인 folium 쓰다가, 공식 도큐먼트를 보고 조금 놀랐다. documentation을 비롯한 examples 들이 생각보다 잘 정리되었기 때문… 정말 이래야 쓸 맛이 난다. Folium, 지리 데이터 시각화 라이브러리 folium 은 leaflet.js 를 파이썬 + 쥬피터에서 쓸 수 있게 만들어놓은 라이브러리다. 이전에 웹에서 지도를 그려본 사람이라면 leaflet 을 알텐데, 뭐 여하튼 경량화 되어있고, 모바일에도 최적화되어있는 유명한 라이브러리다. 아무튼, 이런 라이브러리를 파이썬에서 사용할 수 있는건, 꽤나 강력하다는 생각이 든다. folium 공식 깃허브 https://github.com/python-visualization/folium folium 공식 docum..