본문 바로가기

프로젝트들

(12)
[DND 4기] 서버 개발 회고 1 - 서비스 소개 및 개요 최근에 약 두 달여간 참여했던 DND 4기 활동을 마무리하며 지난 웹 백엔드 개발 과정을 회고해보려 한다. 백엔드 개발을 진행하며 했던 고민, 선택과 해결 과정, 그리고 좋았던 것과 아쉬웠던 것 등 위주로 적어볼 계획이다. DND 활동 자체에 대한 것이나 서비스 기획 단계, 디자인이나 브랜딩에 대한 것들은 여기서는 다루지 않는다. (다만 이번 글에서만 짧게 소개한다.) 하나의 글에 다 풀어내 볼까 생각했으나, 이전에 감명 깊게 읽은 백엔드가 이정도는 해줘야 함 시리즈 처럼 프로젝트 진행 순에 맞추어 글 하나에 주제를 하나씩 두어 써나가도 좋을 거 같단 생각이 들었다. 이래야 나도 안 지치고 글을 쓸 거 같고... 시간 나는 대로 주말에 틈틈이 써볼 예정이다. 이번 글에서는 만들고자 했던 서비스와 앞으로 ..
데이터로 내 티스토리 블로그 EDA 하기 요즘에 좀 여유가 생겨, 이번 기회에 평소에 해보고 싶었던 내 블로그 분석글을 올려본다. 사실 분석이라고 하기엔 좀 거창하고 그냥 EDA 정도가 될 거 같다. 데이터 및 활용 도구는 티스토리 REST API 와 구글 애널리틱스를 사용했다. 어떤 사람들이 내 블로그에 왔을까? 아마 블로그 하는 사람들이 은근 신경 쓰게 되는 것이 하루 방문자 수이지 않을까 싶다. 마치, 예전 싸이월드 미니홈피의 TODAY 수랑 비슷한 느낌이라고 생각하면 된다. 특히 블로그인 만큼 내가 올린 포스팅에 대한 어떤 보상이자, 내 블로그가 성장(?)하고 있음을 직접적으로 느끼게 해주는 지표라고 생각한다. 그리고 무엇보다 블로그 관리자 대시보드에 들어가면 제일 잘 보이는 곳에 위치해있다. 그래서 내 블로그를 들어오는 사람들에 대한 ..
스프링 부트를 활용한 간단한 웹 사이트 최근 약 한 달 동안 아래 두 강의를 들었다. 네이버 부스트 코스 백엔드 편 백기선님의 스프링 부트 아무래도 따라하고 기록만 하다보니 뭔가 완전히 체득이 안 된 느낌이 들어, CRUD 게시판 이라도 하나 만들어야겠다는 생각이 들었다. 그런데 또 게시판만 만들자고 하니, 좀 재미가 없을거 같아 간단한 홈페이지를 만들어보게 되었다. 개발 기간은 대략 일주일. 그동안 배운거 복습한다는 느낌으로 만들었고, 만들어가며 있었던 과정과 작은 이슈들을 틈틈히 메모하여 여기에 기록한다. 결과물 스프링 부트 + Mustache + MySQL 로 만든 그냥 간단한 웹 페이지다. 아래는 홈페이지 일부 모습. 코드랑 Readme 는 깃허브에 올려놨다. heumsi/springboot-sample-webpage Contribut..
[All about 따릉이 EDA, 번외] 데이터에 없는 따릉이 대여소의 지역구 데이터 얻기 이번 글에서는, 데이터에는 없는 지역구에 대한 데이터를 얻는 방법을 다룬다. 기본적으로, 대여소명을 활용하고, 다음의 과정을 거친다. 공개된 대여소 데이터로 지역구 데이터를 얻는다. 대여소명과 카카오맵 rest api를 통해 얻는 방법에 대해 다룬다. 이 과정 중에, 카카오맵 rest api 사용법도 간략히 살펴보게 된다. 결과적으로 {대여소 이름: 지역구} 인 dictionary를 얻는다. 예를 들어 아래와 같다. {'MCM 본사 직영점 앞': '강남구', '교보타워 버스정류장(신논현역 3번출구 후면)': '강남구', '논현역 7번출구': '강남구', '신영 ROYAL PALACE 앞': '강남구', '압구정 한양 3차 아파트': '강남구', '압구정역 2번 출구 옆': '강남구', '압구정파출소 앞'..
[All about 따릉이 EDA, 6편] 대여소별 따릉이 대여건수 예측 이번 편에서는, 이전에 해볼만하다고 느꼈던 시간에 따른 따릉이 대여건수 예측을 해본다. 어떻게 따릉이 대여건수를 예측할 것이냐. 기본 아이디어는 Kaggle의 유명한 Competition 이었던, Bike sharing demand 문제해결과 동일하다. 즉, 한마디로 말해, 기본 자전거 이용량 데이터 + 날씨 데이터 로 대여건수를 예측한다. 한 시간뒤의 대여건수를 명확히 알 수는 없으나, 한 시간뒤의 날씨 데이터는 비교적 명확히 알 수 있고, 기상청에서 미리 공개된다. 따라서, 미래의 대여건수를 날씨예보를 활용하여 어느정도 예측이 가능할 거란 이야기다. 이는 Bike sharing demand 문제에서도 해결한 방식이다. 우리가 풀어야하는 문제는 회귀(Regression) 문제이다. 빠르게 만드는게 목적..
[All about 따릉이 EDA, 5편] 마포구, 따릉이는 얼마나 어떻게 이용되고 있을까? 이번 글에서는, 서울 시내 지역구 중, 15년도부터 꾸준하게 따릉이 이용률이 높았던 지역인 마포구에 대해 좀 더 자세히 알아보려 한다. 저번과 마찬가지로 18년 9월 데이터를 통해 살펴본다. (*9월은 1년 중, 따릉이 이용량이 가장 높은 달이다. 대표적인 패턴을 가장 잘 보여줄 수 있는 기간이라 생각하여 9월 한 달만을 표본으로 선택하였다.) 1. 이용 수치량 살펴보기 가장 먼저, 수치적으로 쉽게 살펴볼 수 있는 것부터 보자. 시간에 따른 이용량 패턴, 이용거리, 시간 등이다. 1.1. 시간대별 사용량 평일의 경우, 아침 8시와 저녁 18시에 고점을 찍는 패턴은,일반적인 서울시 따릉이 패턴과 같다. **한편, 아침 8시엔 반납량이 대여량보다 더 많고, 저녁 18시에는 대여량이 더 많은 걸로 보아서, 마..
[All about 따릉이 EDA, 4편] 따릉이, 유저 분석해보기 따릉이를 주로 타는 사람들은 과연 누구일까?? 남자일까? 여자일까? 또, 20대가 주로 탈까? 50대 이상은 잘 타지 않을까? 한편, 따릉이로 장거리 주행하는 사람들은 대체 누굴까?? 이번 글에서는, 이러한 호기심을 바탕으로, 따릉이 이용자에 대한 분석을 해본다. 데이터는 2017년 1월 ~ 2018년 12월 따릉이 데이터를 사용한다. 1. 성별로 나누어 살펴보기 1.1. 남자와 여자, 둘 중에 누가 더 많이 사용할까? 2년 동안의 남녀 이용량과 이용비율을 시각화 해서 보자. 너무나 직관적으로 다음과 같이 말할 수 있다. 남자가 더 많이 사용했고, 남성 이용자가 전체의 62.4% 다. 한편, 덧붙이면, 남자가 여자보다 65%(여자 이용기준) 더 많이 이용한다. 1.2. 년, 월별로 이용자의 남녀 비율 변..
[All about 따릉이 EDA, 3편] 따릉이 이용량 더 자세하게 살펴보기 이전 글에 이어, 이번에는 좀 더 딥하게 탐색해보기로 한다. 이전에는 15년 9월 - 18년 11월의 일일 데이터를 다루었다면, 이번에는 가장 최근에 이용량이 많았던 18년 9월 시간별 데이터만 보기로 한다. 이제부터는 요일, 시간 단위의 데이터를 볼 수 있다. 덧붙여, 아무래도 이전 글과 다른 데이터라, 별도로 글을 나누어 써본다. 1. 어떤 요일, 시간에 이용량이 많았을까? 가장 쉽게 떠오를 수 있는 질문이다. 요일, 시간, 그리고 지역별로 하나씩 살펴보자. 1.1. 요일별 이용량 평일보다 주말 이용량이 더 많은 것을 알 수 있다. 또, 평일 중엔 화요일 수요일이. 주말에는 토요일 이용량이 많다. 1.2. 시간별 이용량 평일과 주말에 따라 패턴이 다를 듯하여, 두 경우로 나누어 시각화 해보았다. 다음..