본문 바로가기

파이썬 활용/그래프 시각화

(8)
판다스를 이요한 전처리과정 본 노트북에서 사용할 도구들입니다. In [1]: import pandas as pd import matplotlib.pyplot as plt import numpy as np 코랩 환경에서는 아래 코드를 실행시켜 동봉된 파일들을 불러올 수 있습니다. In [ ]: # from google.colab import files # files.upload() 첫째마당 기온 공공 데이터¶ Unit 2. 서울의 기온 데이터 분석하기¶ Unit 2의 데이터 불러오기는 아래와 같은 단순한 코드를 통해 구현할 수 있습니다. In [2]: data_unit2 = pd.read_csv('seoul.csv', encoding = 'cp949') data_unit2 Out[2]: 날짜 지점 평균기온(℃) 최저기온(℃) 최고기..
NUMPY를 이용한 지역별 인구분포도 In [2]: import numpy as np import csv import pandas as pd 넘파이를 이용한 지역인구¶ In [3]: f = open('age.csv') data = csv.reader(f) next(data) Out[3]: ['행정구역', '2019년02월_계_총인구수', '2019년02월_계_연령구간인구수', '2019년02월_계_0세', '2019년02월_계_1세', '2019년02월_계_2세', '2019년02월_계_3세', '2019년02월_계_4세', '2019년02월_계_5세', '2019년02월_계_6세', '2019년02월_계_7세', '2019년02월_계_8세', '2019년02월_계_9세', '2019년02월_계_10세', '2019년02월_계_11세', '..
특정지역 성별 인구통계를 통한 점 그래프 활용 In [1]: import csv f = open('gender.csv') data = csv.reader(f) m = [] f = [] name = input('궁금한 동네를 입력해주세요 : ') for row in data : if name in row[0] : for i in range(3,104) : m.append(int(row[i])) f.append(int(row[i+103])) break import matplotlib.pyplot as plt plt.plot(m, label = 'Male') plt.plot(f, label = 'Female') plt.legend() plt.show() 궁금한 동네를 입력해주세요 : 제주특별자치도 In [2]: import csv f = open('gen..
아주 유용 1.지역별 인구 통계 분석 2. 서울 지하철 노선별 시간별 사용 전국 지역별 인구 시각화¶ In [3]: import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import csv In [4]: f= open('age.csv', 'r', encoding='cp949') data = csv.reader(f,delimiter=',') f.close() In [ ]: In [25]: f= open('age.csv', 'r', encoding='cp949') data = csv.reader(f,delimiter=',') age=[] age_ok=[] sinlim=[] for row in data: if '송하동' in row[0]: for i in row[3:]: ..
기온 데이터 분석_문자열 함수로 전처리 후 시각화 In [2]: import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import csv In [4]: f= open('work.csv', 'r', encoding='cp949') data = csv.reader(f,delimiter=',') for row in data: print(row) f.close() ['국가별', '1995', '1995', '1995', '1996', '1996', '1996', '1997', &#..
seaborn을 활용한 시각화_펭귄종류에 대한 신체정보 데이터셋 Seaborn이란?¶ matplotlib을 기본으로 다양한 시각화 기법을 제공하는 라이브러리. 엄청나게 화려한 시각화 기법들을 제공하며, 기본적으로 이쁩니다. histplot, kdeplot, jointplot, Facetgrid, ... pandas DataFrame과 매우 호환이 잘 됩니다. e.g. sns.xxxplot(data=df)
타이타익 데이터셋을 통한 상관분석 시각화하기(다양한 그래프 활용) 타이타닉 데이터세트 로딩하기¶ In [2]: import pandas as pd titanic_df = pd.read_csv('titanic_train.csv') titanic_df.head(5) Out[2]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 0 PC 17599 71.2833 C85 C 2 3 1 3 Heikkinen, Miss. Laina fem..
8.4일 GDP 프로젝트 CSV 데이터 읽어오기¶ In [1]: import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import csv In [2]: # df = pd.read_csv('GDP2.csv', encoding = 'cp949') df.head(100) df= df.dropna(axis=1) df.head() Out[2]: 시점 대한민국 아프가니스탄 아르메니아 아제르바이잔 바레인 방글라데시 부탄 브루나이 캄보디아 ... 뉴칼레도니아 뉴질랜드 북마리아나제도 팔라우 파푸아뉴기니 사모아 솔로몬제도 통가 투발루 바누아투 0 1995 9.6 - 6.9 -11.8 3.9 5.1 7.1 4.5 9.9 ... 5.9 4..