본문 바로가기
컴퓨터이야기/파이썬(Python)

뉴스 크롤링(자동검색수집) 파이썬 프로그램

by 변화지시자 2025. 8. 11.
반응형

프로그램 실행 결과 화면

 

 

1. 사용 방법

알집으로 압축된 4개의 파일을 다운 받습니다.

news.vol1.egg
15.00MB
news.vol2.egg
15.00MB
news.vol3.egg
15.00MB
news.vol4.egg
3.42MB

 

2. 알집으로 압축 풀기

3개의 파일이 있습니다.

- keyword.xlsx(엑셀파일 : 검색어 입력용으로 사용)

- msedgedriver.exe(엣지드라이버 파일 : html 열기용)

- newscrawling2.exe(파이썬 프로그램 파일 : 이게 크롤링 프로그램 파일)

 

 

3. 압축을 푼후 3개을 파일을 c:\news 폴더에 저장

저장 위치가 [내컴퓨터] - [C드라이브] - [news]폴더 안에 파일 3개가 있어야 함

 

 

4. 엑셀 파일 실행후 검색어 입력(최대 20개 까지)

 

5. newscrawling2.exe 파일 실행

 

 

이렇게 생긴 아이콘 모양에 newscrawling2.exe 라고 되어 있음.

 

 

엑셀 파일에 입력된 검색어를 www.daum.net  뉴스에서 검색하여 그 결과를 html 파일로 저장해서 보여줌