네이버 뉴스와 이미지를 파이썬으로 웹 크롤링할 수 있는 소스입니다.
1) 네이버 뉴스를 웹크롤링하는 소스
urllib : 파이썬에서 웹과 관련된 데이터를 쉽게 이용할 수 있게 도와주는 라이브러리
urllib는 총 4개의 내부모듈이 존재한다. 그중에 하나는 웹을 열어 Data를 읽어오는 역할을 하는 request모듈이 있다.
import 모듈을 가져오는 것
from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen("https://news.naver.com")
bsObject=BeautifulSoup(html, "html.parser")
for link in bsObject.find_all('a'):
print(link.text.strip(), link.get('href'))
네이버 뉴스를 웹크롤링하는 소스
2) 네이버 뉴스 속 이미지를 웹 크롤링하는 소스
뉴스를 웹크롤링하는 소스에서 'a' >>> 'img', 'href' >>> 'src'로 바꿔서 파이썬(repl.it)을 써서 RUN 시키면 크롤링이 되네요. 신기합니다. 이걸 어디에 응용을 할 수 있을 것 같은데. 너무 아는 게 없어서... 일단 필요하신 분들을 위해서 소스를 직접 찾아서 올립니다.
from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen("https://news.naver.com")
bsObject=BeautifulSoup(html, "html.parser")
for link in bsObject.find_all('img'):
print(link.text.strip(), link.get('src'))
네이버 뉴스 속 이미지를 웹크롤링하는 소스
파이썬에서 웹크롤링 소스(네이버뉴스, 이미지 긁어오기)를 긁어오는 소스를 공유합니다. 감사합니다.
'코딩 배우기' 카테고리의 다른 글
두근두근 파이썬에서 웹크롤링 소스(네이버뉴스, 이미지 긁어오기) (1) | 2020.09.13 |
---|---|
코딩배우기 여섯번째_웹싸이트 만들어보자(css) (0) | 2020.08.19 |
코딩배우기 다섯번째_웹싸이트 만들어보자(html) (0) | 2020.08.15 |
코딩 배우기 네번째 반복문(for, while) (0) | 2020.08.02 |
코딩 배우기 세번째 (0) | 2020.08.02 |
코딩 빨리 배우기 (0) | 2020.07.30 |
감사합니다