2018년 8월 21일 화요일

java HTML parsing

Document doc = Jsoup.connect(url).get();
Elements listE = doc.select("속성");
//속성이 class 이면 ".class"
//속성이 inner class 이면 ".class1 .calss2"

for(int i=0;i<listE.size();i++){
       Element nodeE = listE.get(i);
        String url = nodeE.getElementsByTag("a").attr("href");
        //getElementsByTag : 태그로 접근
        //attr : 그중에서 속성값
}