스크래핑 편집하기

이동: 둘러보기, 검색

경고: 로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다. 로그인하거나 계정을 생성하면 편집자가 아이디(ID)으로 기록되고, 다른 장점도 있습니다.

편집을 되돌릴 수 있습니다. 이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 저장해주세요.
최신판 당신의 편집
18번째 줄: 18번째 줄:
 
스크래퍼의 구성에 따라 서버 기반(Server Base) 스크래핑과 클라이언트 기반(Client Base) 스크래핑으로 나눌 수 있다. 서버 기반 스크래핑은 스크래퍼를 서버 위치에 구성하는 방식으로, 사전에 동의를 받은 뒤 수집한 인증정보를 바탕으로 정보를 추출하여 제공한다. 클라이언트 기반 스크래핑은 사용자의 단말기에 스크래퍼를 구성하여 추출하는 모든 정보가 사용자의 단말기에 저장되도록 하는 방식이다.<ref name="두산백과"></ref>
 
스크래퍼의 구성에 따라 서버 기반(Server Base) 스크래핑과 클라이언트 기반(Client Base) 스크래핑으로 나눌 수 있다. 서버 기반 스크래핑은 스크래퍼를 서버 위치에 구성하는 방식으로, 사전에 동의를 받은 뒤 수집한 인증정보를 바탕으로 정보를 추출하여 제공한다. 클라이언트 기반 스크래핑은 사용자의 단말기에 스크래퍼를 구성하여 추출하는 모든 정보가 사용자의 단말기에 저장되도록 하는 방식이다.<ref name="두산백과"></ref>
  
== 스크래핑의 동작 유형 및 원리 ==
+
== 스크래핑의 동작 유형 및 원리  
 
=== 동작 유형 ===
 
=== 동작 유형 ===
 
* DOM Base: 'DIV'나 'TABLE, TR, TD'와 같은 태그(Tag)를 기준으로 정보를 추출한다.
 
* DOM Base: 'DIV'나 'TABLE, TR, TD'와 같은 태그(Tag)를 기준으로 정보를 추출한다.

해시넷에서의 모든 기여는 다른 기여자가 편집, 수정, 삭제할 수 있다는 점을 유의해 주세요. 만약 여기에 동의하지 않는다면, 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다 (자세한 사항은 해시넷:저작권 문서를 보세요). 저작권이 있는 내용을 허가 없이 저장하지 마세요!

취소 | 편집 도움말 (새 창에서 열림)