본문 바로가기

분류 전체보기

(249)
[All about 따릉이 EDA, 1편] 대여소 살펴보기 짧은 서론. 무엇을 왜 하는가? 서울시에서 최근 계속해서 공공데이터를 많이 개방하고 있다. 그 중 가장 친숙하고도 대표적인 데이터는 '서울시 공공자전거', 일명 '따릉이' 데이터라는 생각이 든다. 이젠 정말 길거리에서 흔하게 볼 수 있는 따릉이. 이 글 시리즈에서는, 공개된 데이터를 통해 따릉이 이용과 사용 현황을 살펴보고자한다. 즉, 데이터를 다양하게 시각화 해보며, 해석해보는 EDA 를 해보고자 하는 것이다. 그럼 이걸 왜하느냐? 별 이유는.. 없다. 그냥 재밌을 것 같다. 하다보면 몰랐던 사실들도 알게될 수도 있을 것이고, 그냥 소소한 상식으로 쌓아갈 수 있지 않을까? 일단 무작정 데이터 속으로 들어가보자. 데이터는 2018년 11월 29일자 데이터다. 서울시내 따릉이 대여소 살펴보기. 이번 편에서..
[프로그래머스] 가장 큰 수 문제 가장 큰 수 (https://programmers.co.kr/learn/courses/30/lessons/42746) 풀이 1. 초기 접근 조합을 이용하여 완전 탐색. 가장 먼저 떠오르는 직관적인 방법은, numbers 에 있는 모든 변수들을 조합하여 만든 수들 중, 가장 큰 값을 반환하는 것이다. 이럴 경우, 조합하는 시간은 약 O(len(numbers)!) 이다. 그런데, 조건에 보면, 1 < numbers < 100,000 이란다. O(100000!) 은 절대 1초 내로 안들어오므로, 이 알고리즘은 사용할 수 없다. number 를 정렬한다거나, 탐색할 때, O(n log n) 안으로 해결 해야 한다는걸 늘 생각해야 한다. 보통, 이렇게 루프로 시간문제가 걸리는 경우, 배열 내 아이템을 &#3..
티스토리에 Full-Width 이미지 쉽게 넣기 요즘 티스토리가 아니라, 브런치에 글을 쓰면서 느낀건데. 브런치, 글이 참 이쁘게 나온다. 가장 맘에 들었던 부분은 Full-width image 를 브런치에서는 제공한다는건데, 좀 커다란 그림을 넣고싶을 때, 매우매우 유용하고 이쁘다. 그래서 이를, 티스토리에 적용해보기로 했다. 1. 일반적인 티스토리 사진 일반적으로 티스토리 에디터에 사진을 넣으면 아래와 같이 포스팅 된다. 글 container-width 에 맞춰진다. 일반적이다. 2. Full-Width 이미지 이제 하려고 하는 Full-Width 는 아래와 같이 업로드 된다. 적용하는 방법은, 아래와 같다. 티스토리 관리자 화면 -> 스킨편집 -> CSS 로 들어간뒤, 아래 코드를 추가한다. (어느 위치에 넣든 상관 없음.) .entry-cont..
pandas, bar 그래프(plot) 이쁘게 그리기 이 글의 결과물은 쥬피터에서 아래와 같은 그래프를 그리는 것이다. 이쁘게 그린다고 적어놓긴 했지만, 실제로 다루는 내용은 다음과 같다. 수직, 수평 막대 그래프 위에 값 표시(annotation)하기 수직, 수평 막대 그래프 안에 값 표시하기 그래프 figure 박스 제거 pandas 데이터프레임으로 그래프를 그리는 방법은, matplotlib.pyplpot, pandas.plot(), seaborn 등이 있지만, 여기서는 pandas.plot() 을 기본으로 사용한다. 수직, 수평 막대 그래프 위에 값 표시(annotation)하기 아래 그래프부터 그려보자. 먼저 데이터 프레임부터 보면, print(df) 년 2017 2018 성별 F 1789522 2655864 M 2852440 4467147 이를 ..
pyplot 그래프의 범주박스 위치 변경하기 matplotlib.pyplot 그래프에서 범주(legend) 의 위치를 조정하고 싶을 때가 있다. 일반적으로, 범주는 다음과 같이 그린다. print(df) 성별 F M 년 2017 0.380887 0.619113 2018 0.372857 0.627143 df.plot(kind='barh', stacked=True, title="년도별 남녀 이용비율", rot=0, ax=axes[0], colors=['C1', 'C0']) plt.show() 데이터의 프레임의 열(column) 에 맞춰 라벨(label)이 생기고, 별도로 옵션을 지정해주지 않으면 dataframe.plot() 은 알아서 그려준다. 문제는, 저 범주 박스를 내가 좀 커스터마이징해서, 좀 이쁘게하고 싶은데 어떻게 건드릴 수 있냐는 것이다...
네이버 커넥티드 연수원 간다~! 이번주 면접갔다가, 엄청 죽쒀서 별로 기대 안했는데, 쩌도보니 붙었다. 뭐 암튼 좋다. 커넥티드 연수원 작년 5월에 가보고, 다시 또 가보게 되었다~! 시각화나 분석, 전달에 대한 고민과 이슈들을 가지고 있었는데, 이번 기회로 좀 제대로 알게되었음 좋겠다. 암튼 갔다와서 후기 남겨야지.
folium 의 plugins 패키지 샘플 살펴보기 2 저번 포스팅에 이어, examples 에 있는 plugins 관련된 기능들을 좀 더 살펴보려 한다. DualMap This plugin is using the Leaflet plugin Sync by Jieter: https://github.com/jieter/Leaflet.Sync The goal is to have two maps side by side. When you pan or zoom on one map, the other will move as well. import folium import folium.plugins The DualMap class accepts the same arguments as the normal Map class. Except for these: &#39;width..
folium HeatMapWitheTime 쓸 때 좀 빡치는거. 1. 디스플레이 인덱스가 1부터 시작한다. 이 녀석의 사용 새부터 잠깐 살펴보자. HeatMapWithTime(data, index=None, name=None, radius=15, min_opacity=0, max_opacity=0.6, scale_radius=False, gradient=None, use_local_extrema=False, auto_play=False, display_index=True, index_steps=1, min_speed=0.1, max_speed=10, speed_step=0.1, position='bottomleft', overlay=True, control=True, show=True) 요렇게 되어있다. 뭐 간단히 예시를 들면, 아래와 같이 사용한다. map = fo..