Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 깊이 우선 탐색
- 이분 탐색
- 다이나믹 프로그래밍
- 18249
- 알고리즘
- meet in the middle
- 카드 놓기
- 공적 마스크
- image crawling
- 마스크 재고 확인
- 18248
- 18113
- 18114
- 3671
- BOJ
- 그르다 김가놈
- 산업 스파이의 편지
- 메일 전체 읽기
- 15486
- 단어 수학
- 18235
- 부루트 포스
- 9466
- 욱제가 풀어야 하는 문제
- 퇴사 2
- 냅색문제
- 18115
- 에라토스테네스의 체
- 9328
- 마스크 5부제
Archives
- Today
- Total
groti's blog
[python] BeautifulSoup을 이용한 네이버 이미지 크롤링 - naver image crawling 본문
프로그래밍 언어/python
[python] BeautifulSoup을 이용한 네이버 이미지 크롤링 - naver image crawling
groti 2020. 7. 8. 17:17조코딩 유튜브 채널을 통해 파이썬 언어를 공부하고 있는데요. 관련하여 BeautifulSoup을 이용한 네이버에서 이미지를 크롤링하는 코드를 작성해 보았습니다.
코드
from urllib.request import urlopen
from bs4 import BeautifulSoup as bs
from urllib.parse import quote_plus
from pathlib import Path
baseUrl = 'https://search.naver.com/search.naver?where=image&sm=tab_jum&query='
animal_list = ['dog', 'cat', 'bear']
keyword_list = [['박보검', '임시완'], ['강동원', '이종석'], ['조세호', '안재홍']]
idx = 0
for arr in keyword_list:
Path('./img/' + animal_list[idx]).mkdir(parents=True, exist_ok=True)
for keyword in arr:
Path('./img/' + animal_list[idx] + '/' + keyword).mkdir(parents=True, exist_ok=True)
print(keyword + ' 검색')
url = baseUrl + quote_plus(keyword)
html = urlopen(url)
soup = bs(html, "html.parser")
img = soup.find_all(class_='_img', limit=10)
n = 1
for i in img:
imgUrl = i['data-source']
with urlopen(imgUrl) as f:
with open('./img/' + animal_list[idx] + '/' + keyword + '/' + keyword + str(n)+'.jpg', 'wb') as h:
img = f.read()
h.write(img)
n += 1
idx += 1
print('다운로드 완료!')
- animal_list -> 동물상 카테고리
- keyword_list -> 각 동물상 카테고리에 포함되는 연예인
검색 결과
- keyword_list의 검색어가 하나씩 검색된 것을 볼 수 있습니다.
참고 사이트
유튜브 조코딩 - 완전 쉽게 파이썬으로 텍스트 및 이미지 크롤링하기 | 수익형 웹, 앱 만들기 1강
joyground.long - [조코딩] 완성형 서비스 만들기 - 1
Comments