Анализ логов сервера на старте проекта — насущная необходимость

Лог доступа показывает нам в реальном времени  как посетители и роботы взаимодействуют с сайтом. Изучаем его и ищем несоответствия, подозрительные записи. Например:

  • Посещение страниц, которых нет в карте сайта (а не мусорный ли это документ?).
  • Ошибки сервера, в первую очередь 404. На новом нормальном сайте им взяться неоткуда. Стоит проверить и редиректы (301,302).
  • Обращения с малым количеством отданных байт. Опять же подозрение на мусорный контент или некорректную работу скрипта, неполную загрузку.
  • Множество заходов с одного и того же IP (попытка взлома? парсинг контента?).

Источник