코딩 배우기 #10 : Python 크롤링과 엑셀저장

코딩 배우기 #10 : Python 크롤링과 엑셀저장
  • 기본은 템플릿에 맞추어 하면 되는 것 같은데, 조금만 벗어나도 많은 추가 작업이 필요하다.
  • 무작정 공부해서는 원하는 형태로 추출하거나 저장하기 쉽지 않을 것 같고, 가장 좋은 방법은 필요에 따라 여러번 해보는게 좋을 것 같다. 문제는 현재 크롤링이나 엑셀 저장을 활용해볼 일이 없다는 것이다.
  • 일단은 파이썬을 비롯해서 웹일반 전체 과정을 한번 훑고 나서 다시 돌아와서 살펴봐야겠다.

크롤링 기본

1
2
3
4
5
6
import requests # 라이브러리 가져오기
from bs4 import BeautifulSoup # 라이브러리에서 특정 함수만 가져오기
res = requests.get('주소') # 웹페이지 가져오기
soup = BeautifulSoup(res.content, 'html.parser') # 파싱
mydata = soup.find('title') # 데이터 추출
print(mydata.get_text()) # 앞뒤 태그 제외

엑셀저장

1
2
3
4
5
6
7
import openpyxl # 라이브러리 임포트
excel_file = openpyxl.Workbook() # Workbook() 으로 엑셀 파일 생성
excel_sheet = excel_file.active # 활성 시트 선택
excel_sheet.title = '리포트' # 활성 시트 명칭 변경경
excel_sheet.append(['data1', 'data2', 'data3']) # 데이트 추가하기
excel_file.save('excel.xlsx') # 엑셀 파일 저장
excel_file.close() # 엑셀 파일 닫기
이 글은 저작권자의 CC BY 4.0 라이센스를 따릅니다.