본문 바로가기

파이썬 기본/정규화(문자열)

(3)
간단한 데이터 전처리 특정 행 조회 등등 In [256]: import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import csv In [257]: df = pd.read_csv('work.csv', encoding = 'cp949') df Out[257]: 국가별 1995 1995.1 1995.2 1996 1996.1 1996.2 1997 1997.1 1997.2 ... 2016.2 2017 2017.1 2017.2 2018 2018.1 2018.2 2019 2019.1 2019.2 0 국가별 전체 남자 여자 전체 남자 여자 전체 남자 여자 ... 여자 전체 남자 여자 전체 남자 여자 전체 남자 여자 1 아시아 NaN NaN Na..
문자열 함수 이용해보기 문자열 관련 함수 알아보기¶ 문자열에 있는 특정 문자 갯수 세기 (count 함수)¶ In [1]: data = 'Dave David' data.count('D') # 문자열에 D 가 몇 번 나올까요? 대소문자도 구별함 Out[1]: 2 간단 연습: string에 v 는 몇 번 나올까? 간단 연습: string에 vid 는 몇 번 나올까? (꼭 문자 하나만 되는 것이 아니라, 연결된 문자열도 가능) 문자열에 있는 특정 문자의 위치 알려주기¶ index 함수¶ In [7]: string = 'Dave ID is dave' string.index('i') # 맨 앞 자리부터 0, 1, ... 순으로 위치를 표시 Out[7]: 8 간단 연습: string에 있는 D의 위치 확인하기 (가장 먼저 나오는 위치를 ..
크롤링에서 정규화를 하는 이유(마음대로 문자 변경) 예제: 왜 정규표현식이 필요할까?¶ In [6]: from urllib.request import urlopen from bs4 import BeautifulSoup import re res = urlopen('https://davelee-fun.github.io/blog/crawl_test_css.html') soup = BeautifulSoup(res, "html.parser") data = soup.select('ul#dev_course_list li.course') for item in data: print (item.get_text()) (초급) - 강사가 실제 사용하는 자동 프로그램 소개 [2] (초급) - 필요한 프로그램 설치 시연 [5] (초급) - 데이터를 엑셀 파일로 만들기 [9] (초..