본문 바로가기

파이썬 활용/문자열

(6)
문자열 함수 모음집 문자열 관련 함수 알아보기¶ 문자열에 있는 특정 문자 갯수 세기 (count 함수)¶ In [1]: data = 'Dave David' data.count('D') # 문자열에 D 가 몇 번 나올까요? 대소문자도 구별함 Out[1]: 2 간단 연습: string에 v 는 몇 번 나올까? 간단 연습: string에 vid 는 몇 번 나올까? (꼭 문자 하나만 되는 것이 아니라, 연결된 문자열도 가능) 문자열에 있는 특정 문자의 위치 알려주기¶ index 함수¶ In [7]: string = 'Dave ID is dave' string.index('i') # 맨 앞 자리부터 0, 1, ... 순으로 위치를 표시 Out[7]: 8 간단 연습: string에 있는 D의 위치 확인하기 (가장 먼저 나오는 위치를 ..
지하철 사용 빈도 알아보기 2 시계열 문자열 활용 전처리와 시각화가 합쳐졌기 떄문에 다양한 전처리 과정을 볼수 있습니다. In [7]: import pandas as pd 넷째마당 대중교통 데이터 프로젝트¶ Unit 11. 대중교통 데이터 시각화하기¶ In [5]: subway_data = pd.read_csv('subwayfee.csv', encoding = 'cp949') subway_data Out[5]: 사용월 호선명 역ID 지하철역 유임승차 유임하차 무임승차 무임하차 0 2019-01 1호선 150 서울역 1516452 1400464 221180 211764 1 2019-01 1호선 151 시청 676932 676266 102388 101033 2 2019-01 1호선 152 종각 1240810 1177643 162410 152062 3 201..
CSV파일 불러온 후 문자열함수를 활용하여 전처리 하기 In [1]: import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import csv In [5]: data_unit2 = pd.read_csv('seoul.csv', encoding = 'cp949') data_unit2 Out[5]: 날짜 지점 평균기온(℃) 최저기온(℃) 최고기온(℃) 0 1907-10-01 108 13.5 7.9 20.7 1 1907-10-02 108 16.2 7.9 22.0 2 1907-10-03 108 16.2 13.1 21.3 3 1907-10-04 108 16.5 11.2 22.0 4 1907-10-05 108 17.6 10.9 25..
text파일을 통한 자연어 처리 빈도 분석(Okt, wordcloud) In [2]: import pandas as pd import numpy as np from konlpy.tag import Okt from wordcloud import WordCloud import seaborn as sns import datetime from PIL import Image from collections import Counter import matplotlib.pyplot as plt In [3]: #한글 자연어 처리 라이브러리 (konlpy) 형태소 분석기(Hannanum, kkma, koran, mecab, okt) In [4]: okt=Okt() okt.morphs('월드컵 출전횟수가 1회뿐인 선수들이 가장 많은 나라는 어디인가?') Out[4]: ['월..
월드컵 명단을 통한 문자열 함수 이용 In [1]: import pandas as pd import numpy as np from konlpy.tag import Okt from wordcloud import WordCloud import seaborn as sns import datetime from PIL import Image from collections import Counter import matplotlib.pyplot as plt import folium --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) Input In [1], in () 8 fr..
문자열 이용해서 간단한 프로그램 만들기(주민번호) In [7]: a= input('주민번호 13자리 - 포함') a=a.replace('-','') lst = [int(a) for a in a] print(lst) 주민번호 13자리 - 포함980711-1722416 [9, 8, 0, 7, 1, 1, 1, 7, 2, 2, 4, 1, 6] In [9]: cob=[2,3,4,5,6,7,8,9,2,3,4,5] product = [x*y for x,y in zip(lst,cob)] print(product) [18, 24, 0, 35, 6, 7, 8, 63, 4, 6, 16, 5] In [18]: add_list = [lst[i] * cob[i] for i in range(len(cob))] print(add_list) print(sum(add_list)) [1..