nginx 에서 크롤러 봇(crawler bot) 막기
보통 웹사이트의 / 루트 디렉토리에 robots.txt 를 작성하면 크롤러가 잘 알아서 들어오던지, 피해가던지 해야 하는데 그런 기대를 하는 것은 무리인것 같습니다.
작성한대로 따라주지 않으니 방문자 확보에 도움이 안되고 무작정 퍼가기만 하는 크롤러는 막는게 서로(?)에게 좋습니다.
nginx 의 설정 파일에 다음과 같이 작성합니다.
그럼 robots.txt 를 무시하는 크롤러를 막을 수 있습니다.
map $http_user_agent $limit_bots {
default 0;
~*(bingbot|FeedDemon|GrapeshotCrawler|DuckDuckBot|MegaIndex) 1;
~*(VelenPublicWebCrawler|SimplePie|YandexBot|SCMGUARD|DotBot) 1;
~*(AhrefsBot|SemrushBot) 1;
}
server {
location / {
if ($limit_bots = 1) {
return 403;
}
}
location ~ \.php$ {
if ($limit_bots = 1) {
return 403;
}
}
# systemctl reload nginx
nginx 를 reload 한 후 log 를 살펴 보면
[2020-04-06T09:48:27+09:00] 200 - "GET /cma
[2020-04-06T09:48:29+09:00] 403 - "GET /qa/\compatible; SemrushBot/6~bl; +http://www.semrush.com/bot.html)" "-" "-"
[2020-04-06T09:47:58+09:00] 403 - "GET /ds_\ +http://yandex.com/bots)" "-" "-"
[2020-04-06T09:47:58+09:00] 403 - "GET /qa/\"-" "Mozilla/5.0 (compatible; DotBot/1.1; http://www.opensite
[2020-04-06T09:47:59+09:00] 403 - "GET /so_\0; +http://yandex.com/bots)" "-" "-"
[2020-04-06T09:48:00+09:00] 403 - "GET /qa/\Bot/6~bl; +http://www.semrush.com/bot.html)" "-" "-"
[2020-04-06T09:48:01+09:00] 200 - "GET /qa/
위와 같이 잘 막고 있는 것을 확인 할 수 있습니다.
댓글 5개
duckduck 이런덴 검색사이트로 아는데
검색엔진에 올라가 홍보에 도움주지않는가요?
구글도있는데 위에 운영자님께서 bot는 없는듯한데
그건 홍보에 도움 되서 뺀건가요??
게시판 목록
개발자팁
질문은 QA에서 해주시기 바랍니다.
| 번호 | 분류 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|---|
| 5396 | 기타 |
슈퍼스타맨
|
4개월 전 | 353 | |
| 5395 | PHP |
untitled
|
5개월 전 | 822 | |
| 5394 | MySQL |
선택과집중
|
6개월 전 | 599 | |
| 5393 | 웹서버 |
techstar
|
8개월 전 | 864 | |
| 5392 |
|
1년 전 | 1219 | ||
| 5391 | 10개월 전 | 1120 | |||
| 5390 | 10개월 전 | 906 | |||
| 5389 | 9개월 전 | 874 | |||
| 5388 | 9개월 전 | 976 | |||
| 5387 | 8개월 전 | 808 | |||
| 5386 | JavaScript |
nekoieye
|
8개월 전 | 972 | |
| 5385 | 웹서버 | 8개월 전 | 989 | ||
| 5384 | JavaScript |
|
9개월 전 | 820 | |
| 5383 | 기타 | 10개월 전 | 1130 | ||
| 5382 | 기타 |
|
10개월 전 | 579 | |
| 5381 | JavaScript | 10개월 전 | 910 | ||
| 5380 | 기타 |
|
10개월 전 | 696 | |
| 5379 | JavaScript | 10개월 전 | 693 | ||
| 5378 | 11개월 전 | 1199 | |||
| 5377 | 기타 |
|
11개월 전 | 761 | |
| 5376 | jQuery |
|
11개월 전 | 576 | |
| 5375 | jQuery |
techstar
|
11개월 전 | 730 | |
| 5374 | 기타 |
|
11개월 전 | 781 | |
| 5373 | MySQL |
|
12개월 전 | 812 | |
| 5372 | 기타 |
|
12개월 전 | 1014 | |
| 5371 | JavaScript |
|
12개월 전 | 728 | |
| 5370 | JavaScript |
|
12개월 전 | 731 | |
| 5369 | PHP |
|
12개월 전 | 1243 | |
| 5368 | PHP | 1년 전 | 1408 | ||
| 5367 | 기타 |
nekoieye
|
1년 전 | 1284 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기