Если же у вас хостинг с ограниченными ресурсами и боты доставляют вам проблемы ну или вам просто не нравится огромное количество ботов в онлайне, то можно решить эту проблему достаточно просто.
Разделим ботов на хороших и плохих.
Под хорошими будем понимать ботов поисковых систем. Эти боты полезны. Они индексируют ваш сайт и приводят вам посетителей.
Под плохими будем понимать всяких маркетинговых ботов. Они никого вам не приводят, но создают нагрузку.
Вы можете заблокировать плохих ботов на уровне сервера, но можно сделать проще. Эти боты читают настройки в файле robots.txt и если в нем запретить им доступ, то они все таки слушаются.
Собрал тут конфиг для самых активных ботов:
User-agent: AhrefsBot
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: Riddler
Disallow: /
User-agent: BLEXBot
Disallow: /
User-agent: dotbot
Disallow: /
Этот конфиг можно дополнить другими ботами, которых вы возможно встретите на своем сайте.
От самых активных плохих ботов избавились, но полезные боты часто тоже доставляют неудобства.
Давайте немного ограничим им области индексации, чтобы они не индексировали то, что не несет никакой пользы и в индекс все равно не попадет.
User-agent: *
Disallow: /index.php/
Disallow: /redirect/*
Disallow: /mail/*
Disallow: /profile/*
Disallow: /registration/*
Disallow: /album/*
Disallow: /community/users/*
Disallow: /forum/*act=new
Disallow: /forum/*act=files
Disallow: /forum/*act=show_post
Disallow: /forum/*act=tema
Disallow: /forum/*act=filter
Disallow: /forum/*act=editpost
Disallow: /go.php*
Disallow: /forum/search.php*
И так в примере выше мы убрали некоторые закрытые разделы, ссылки на которые могут встречаться, но бот будет видеть только страницу с информацией о том, что доступ закрыт.
Так же в примере заблокированы некоторые страницы на которых контент по сути дублирует то, что есть на других страницах.
По этому примеру вы можете доработать конфиг для вашего сайта учитывая его структуру.
Что это даст?
Все это позволит снизить количество бесполезных страниц в индексе поисковиков, полезные страницы будут обходиться роботами быстрее, бесполезные страницы обходить не нужно и боты будут меньше сидеть на вашем сайте и нагрузка на сервер будет снижена.