본문 바로가기
반응형

html2

HTML에서 데이터 추출 크롤링 핵심 가이드라는 책을 읽으면서 크롤링된 데이터에서 필요한 정보를 추출하는 '스크레이핑'에 대해 추출 방법을 정리해 본다. 정규표현식 html내부의 모든 a태그를 추출 하는 표현식 .*? 자바의 java.util.regex.Pattern클래스로 정규 표현식을 사용할 수 있다. String html = .... //a 태그를 추출하기 위한 정규 표현 Pattern regex = Patten.compile(".*?"); //Matcher 객체 생성 Matcher matcher = regex.matcher(html); //정규표현식에 일치하는 부분은 콘솔에 출력 while(matcher.find()) { System.out.println(matcher.group()); } XPath XPath는 XML의.. 2019. 1. 2.
기획자가 알아두면 좋은 구축 관련 용어 기획자가 알아두면 좋은 구축 관련 용어어제 이어 오늘도 기획자가 알아두면 좋을만한 용어들을 정리를 해봅니다. 처음부터 다시 배우는 웹 기획에 있는 자료를 옮겨 두는 것이므로 책이 궁금하신 분들은 예스24 eBook으로 구입해서 읽어 보시면 저렴하니 좋습니다. 한파가 몰아치고 북극의 제트기류가 중반구까지 내려와 초속 200km의 속도로 지구를 돌고 있어 지금 이렇게 추운 것이라고 합니다. 다들 감기 조심하시고 건강 잘 챙기시길 바래요 ^^ HTML(Hyper Text Markup Language) 웹 문서를 만들기 위하여 사용하는 기본적인 프로그래밍 언어의 한 종류로 하이퍼텍스트를 작성하기 위해 개발되었다. 문서의 글자 크기,글자색, 글 모양, 그래픽, 문서 이동(하이퍼링크) 등을 정의하는 명령어로서 홈페.. 2017. 12. 14.
반응형