Анализ логов сервера на старте проекта — насущная необходимость
Лог доступа показывает нам в реальном времени как посетители и роботы взаимодействуют с сайтом. Изучаем его и ищем несоответствия, подозрительные записи. Например:
- Посещение страниц, которых нет в карте сайта (а не мусорный ли это документ?).
- Ошибки сервера, в первую очередь 404. На новом нормальном сайте им взяться неоткуда. Стоит проверить и редиректы (301,302).
- Обращения с малым количеством отданных байт. Опять же подозрение на мусорный контент или некорректную работу скрипта, неполную загрузку.
- Множество заходов с одного и того же IP (попытка взлома? парсинг контента?).