본문 바로가기

파이썬 활용/전처리 모음집

(5)
인구통계분석_학교 수업 때 배운 부분 In [ ]: !sudo apt-get install -y font-nanum Reading package lists... Done Building dependency tree Reading state information... Done E: Unable to locate package font-nanum In [ ]: !sudo fc-cache -fv /usr/share/fonts: caching, new cache contents: 0 fonts, 1 dirs /usr/share/fonts/truetype: caching, new cache contents: 0 fonts, 2 dirs /usr/share/fonts/truetype/humor-sans: caching, new cache content..
브라질 이커머스 쇼핑몰 매우 큰 데이터 셋으로 전처리 후 분석 해보기 데이터 브라질에서 가장 큰 백화점의 이커머스 쇼핑몰 (https://olist.com/solucoes/distribuidoras-e-lojas-de-bebidas/) 2016년도부터 2018년도 100k 개의 구매 데이터 정보 구매 상태, 가격, 지불수단, 물류 관련, 리뷰관련, 상품 정보, 구매자 지역 관련 정보
코로나 년도별 데이터 셋에서 확진자 회복자 사망자별 분류 전처리 In [17]: import pandas as pd years=['2020','2021','2022'] df_year=[] for year in years: path= 'final_covid_data_for_Recovered_%s.csv' %year covid_df= pd.read_csv(path, encoding='utf-8-sig',index_col=0) df_year.append(covid_df) covid_df=pd.merge(df_year[0],df_year[1], on='Country_Region') covid_df=pd.merge(covid_df,df_year[2], on='Country_Region') cols_covic = covid_df.columns.tolist() cols_covic..
코로나 년도별 확진자수 분석 전처리 In [17]: import pandas as pd years=['2020','2021','2022'] df_year=[] for year in years: path= 'final_covid_data_for_Recovered_%s.csv' %year covid_df= pd.read_csv(path, encoding='utf-8-sig',index_col=0) df_year.append(covid_df) covid_df=pd.merge(df_year[0],df_year[1], on='Country_Region') covid_df=pd.merge(covid_df,df_year[2], on='Country_Region') cols_covic = covid_df.columns.tolist() cols_covic..
데이터 전처리 판다스 병합, 분할, 특정 조회, csv로 저장 PANDA ~ 1.pdf¶ In [44]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [45]: data = pd.read_csv("kaggle_survey_2020_responses.csv") data.columns #4, 6,7 , 10 .15,20,26,36,39 C:\Users\82105\AppData\Local\Temp\ipykernel_1064\4007746332.py:1: DtypeWarning: Columns (0) have mixed types. Specify dtype option on import or set low_memory=False. data = pd..