Imperva Bad Bot Report 2026: bot-traffic = 50.2% всего web traffic (рекорд). Breakdown: 32% bad bots (scrapers, credential stuffing, DDoS), 18.2% good bots (Googlebot, monitoring, feeds). Крупнейший рост 2024-2026: AI scrapers — GPTBot, ClaudeBot, PerplexityBot, ByteSpider (13 → 28% of total bot traffic). Нишевый тренд: residential proxies + headless Chrome обходят WAF. Mitigations: Content-Signal (IETF), Cloudflare Bot Fight Mode, fingerprint-based JA3/JA4.
Ниже: подробности, пример, связанные, FAQ.
# robots.txt с Content-Signal (2026)
User-agent: *
Content-Signal: search=yes, ai-train=no, ai-search=yes
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
# nginx — rate-limit AI scrapers
map {
default 0;
~*(gpt|claude|perplexity|anthropic|cohere)bot 1;
}
limit_req_zone zone=aibots:10m rate=30r/m;
limit_req zone=aibots burst=10 nodelay if ();Нет. Googlebot, мониторинги, RSS feeds — legitimate. Проблема в malicious 32%.
User-Agent + reverse DNS + behavioral fingerprinting (JA3/JA4). Одни UA недостаточно (spoofable).
Зависит: для публикаций — блокировать (monetization protection). Для SaaS docs — allow (AI даёт traffic обратно через ссылки).