본문 바로가기

머신러닝 딥러닝 입문

[Jupyter Notebook / BeautifulSoup] 환률 정보 스크래핑 해보기

www.yes24.com/Product/Goods/42496558

 

파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문

BeautifulSoup, scikit-learn, TensorFlow를 사용하여 실무에 머신러닝/딥러닝을 적용해 보자!인공지능, 머신러닝, 딥러닝은 바둑, 의료, 자동차 등 이미 다양한 분야에서 성공적인 성과를 보여주고 있다.

www.yes24.com

블로그의 모든 내용은 해당 책을 읽고 포스팅하는 내용입니다!

 

실제 웹사이트를 스크래핑 해보자.

 

finance.naver.com/marketindex/

 

https://finance.naver.com/marketindex/

환전 고시 환율 2020.10.21 18:11 하나은행 기준 고시회차 274회

finance.naver.com

구글에 네이버 환률 정보라고 검색하면 나오는 사이트. 이 사이트를 이용해 원/달러 환율 정보를 추출해보자. 들어가서 F12를 누르면 html 정보를 확인 할 수 있다.

 

html 정보

우리가 필요한 정보인 미국USD 옆의 박스에 접근하기 위해, Elements 왼쪽 왼쪽 버튼을 누르고 1,133.00원에 가져다 대어보자. 그럼 오른쪽 html에서 해당 칸으로 이동한다.

 

접근!

그럼 select_one을 이용해 저 값을 추출해보자.

 

from bs4 import BeautifulSoup
import urllib.request as req
url = "https://finance.naver.com/marketindex/"
res = req.urlopen(url)
soup = BeautifulSoup(res, "html.parser")
price = soup.select_one("div.head_info > span.value").string
print("USD/KRW = "+price)

주목해야할 것은 select_one으로 저 값에 접근하는 방법이다. 제대로 실행되었다면 USD/KRW = 1,133.00 와 같이 출력되는 것을 확인 할 수 있다. select로 접근 한다면 해당 리스트에서 값을 출력할 수 있다.

 

두 메소드 실행 결과