본문 바로가기
Java/Java 활용 실습

[Java] 페이지 소스에서 원하는 부분 추출하기(Jsoup)

by ProSeraphina 2020. 7. 21.

1. try.jsoup.org 활용

 

 

Try jsoup online: Java HTML parser and CSS debugger

 

try.jsoup.org

class( . )는 중복 가능, id( # )는 중복 불가

 

***body부터 본문 시작

 


2. 라이브러리 Jsoup 활용

https://mvnrepository.com/ Jsoup 1.13 다운로드

Java Project 우클릭 후 Buildpath에서 Externer jars에서 Jsoup 1.13 추가

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document; 
import org.jsoup.select.Elements;
 
public class 영화제목_10개출력 {
    public static void main(String[] args) throws Exception {
        Document doc=Jsoup.connect("https://movie.daum.net/premovie/released").get();
        //System.out.println(doc);
        Elements title=doc.select("div.info_tit a.name_movie");
        Elements grade=doc.select("div.info_tit em");
        for(int i=0;i<10;i++) {
            System.out.println(title.get(i).text());
            System.out.println(grade.get(i).text());
        }
    }
}
cs

 

댓글