테스트 사이트 - 개발 중인 베타 버전입니다

그누보드5 robots.txt로 게시판 전체를 크롤링 못하게 하려면 (질문) 채택완료

그누초보다 9개월 전 조회 1,677

a게시판의 글쓰기 뷰페이지 리스트 모두를 크롤링 안되게 하고싶어요

댓글을 작성하려면 로그인이 필요합니다.

답변 2개

채택된 답변
+20 포인트
glitter0gim
9개월 전

robots.txt 파일을 통해 특정 게시판이나

전체 웹사이트를 검색 엔진의 크롤링에서 제외할 수는 있지만,

이것이 완벽하게 크롤링을 차단하는 방법은 아닙니다.

*robots.txt로 검색 엔진의 크롤링 요청을 우선 막습니다.

*서버 레벨에서 User-Agent와 IP 차단 규칙을 추가.

*중요한 데이터는 HTTP 인증이나 로그인으로 보호.

*메타 태그와 JavaScript 난독화를 보조적으로 사용.

 

"절대적으로 불가능"하게 만드는 것은 어렵기 때문에

보안과 프라이버시 수준에 따라 여러 계층의 방어를 조합하는 것이 최선입니다.

Ps) 악성 크롤러는

robots.txt 파일을 무시하거나 이를 우회하여 웹사이트를 크롤링할 가능성이 높습니다.

robots.txt는 기본적으로 크롤러에게 크롤링을 자제하라는 요청일 뿐

강제성을 가지지 않기 때문에 악성 크롤러에게는 무력합니다.

로그인 후 평가할 수 있습니다

댓글을 작성하려면 로그인이 필요합니다.

9개월 전

robots.txt 파일에 특정 게시판 경로를 차단하도록 규칙을 추가하시면 됩니다.

 

User-agent: *

Disallow: /board.php?bo_table=게시판아이디

 

로그인 후 평가할 수 있습니다

답변에 대한 댓글 2개

그누초보다
9개월 전
혹시 Disallow: /notice_only/ 이런식으로 해도 되나요?
그누도사
9개월 전
네 작성해주신 방법으로 해도 됩니다.

댓글을 작성하려면 로그인이 필요합니다.

답변을 작성하려면 로그인이 필요합니다.

로그인