Что такое рефспам
Все пользователи Интернета знакомы со спамом: его приходится тоннами удалять из электронных ящиков, мобильных телефонов, аккаунтов аськи, дневников, блогов и т.д. Спам распространяется с целью рекламировать какой-либо продукт либо придать всеобщему порицанию чужой, также иногда для фишинга . Спам бывает разный: от разнообразных писем до спам атак по логам.
Одной из целей профессиональных спаммеров веб-ресурсов будет получение максимального числа беков (ссылок) на личный сайт для улучшения его позиций в различных рейтингах поисковиков (тематический индекс цитирования Яндекса или PageRank Google), независимо от постоянных изменений алгоритмов работы поисковиков с целью постоянно совершенствовать качество поисковой выдачи и игнорирования ссылок со спамных ресурсов.
Виды спама сайтов
Рекламный спам
Как правило, рассылка в кругу определенной аудитории с целью рекламирования определенного продукта либо услуги. Этот вид спама крайне популярен на форумах, в гостевых книгах, социальных сетях, где собирается трафик нужной тематики.
Спам в комментариях
Оставляется комментарий с обязательной ссылкой на свой ресурс. Обычное дело для блогов или дневников с плохой или полным отсутствием модерации, где внести свою лепту может абсолютно любой человек. Сейчас замаскированный спам можно распознать по универсальным комментариям типа «отличная статья, спасибо», «супер, это точно то, что нужно» и подобных.
Автопрогон
Как правило, используются блоги, доски объявлений, форумы, где есть возможность оставить некоторый текст со ссылкой на свой веб-ресурс. Очень часто ссылку делают совсем неприметной, например, в виде точки.
Рефспам
Автоматическое обращение к веб-ресурсу с последующей подстановкой нужного реферера. Ссылка на реферер, потом проявляется в логах статистических данных сайта.
Смайлспам
Автопрогон, в котором ссылочку маскируют под разными смайликами.
Теперь хотелось бы остановиться на рефспаме или так называемом спаме по логам более обстоятельно.
Спам по логам (рефспам)
Это понятие стало известно в мире Интернета еще с того времени, когда дорвейщики активно пытались найти эффективные методы добавления беков на свой ресурс и поднятия позиций в серпе. Так некоторые программы сбора статистики (WebAlizer, WebStat и др.) демонстрируют множество данных, полученных из запросов к веб-сайту. Среди полученных данных есть и источники трафика: рефереры, в порядке убывания от того, который привел максимальное количество трафика на сайт.
Найти веб-ресурсы, где уже установлены подобные программы сейчас не проблема. Для этого нужно просто ввести в строку поиска следующее: «Usage Statistics for” site:ru referer«. Известно более 50 тысяч сайтов, которые регулярно могут подвергнуться рефспаму, чем не без удовольствия пользуются разные злоумышленники.
Спам по логам сайта идет в абсолютно автоматическом режиме, съедая всего парочку килобайт от вашего веб-ресурса, или применяется функция fsockopen(открытое соединение) и не вытягивается ничего вообще.
Как бороться с рефспамом
Невзирая на малоубедительные заявления поисковиков Яндекс и Google о том, что они ссылки с подобных ресурсов давно игнорируют, рефспам не теряет популярности и все также надоедает владельцам сайтов. В первую очередь необходимо:
1. Поставить заслон появлению нежелательных ссылок на внешние ресурсы в программах, которые собирают статистику по вашему сайту.
2.Второй путь – это закрытие статистики от индексации ПС с помощью редактирования файла robots.txt .
User-Agent: *
Disallow: /webstat/
3. Запретить доступ в файл .htaccess для некоторых IP адресов или рефереров
Order allow,deny
Allow from all
Deny from 192.168.1.1/8
Deny from 192.172.0.1/16
Или же закрыть доступ с IP другим методом:
RewriteEngine On
%{REMOTE_ADDR} ^192\.168\.0\.1$
RewriteRule ^.*$ – [F]
Или полное закрытие доступа по рефереру:
RewriteEngine on
RewriteCond %{HTTP_REFERER} iaea\.org [NC]
RewriteRule ^.*$ – [F]
Всем удачи в борьбе со спамерами!
P.S. Готовый плагин wordpress рейтинг , для вывода рейтинга авторов в сайдбаре по количеству голосов за их статьи в сумме.