05 Август 2020

Алгоритм определения ботов и офферов во Вконтакте

616 раз

В этой статье не будет сложных замудренных терминов и формул. Здесь будут описаны основные признаки, по которым удобно искать ботов, и результаты фильтрации. Для чего это нужно? Посмотрев статистику еженедельного прибавления подписчиков сложно оценить количество реальных людей, подписанных на вас. Среди подписчиков могут быть забаненные администрацией аккаунты и боты.

На сегодняшний день существует много сервисов для проверки ботов среди подписчиков и их покупки на сайте. Причем как платных, так и бесплатных программ. Опробовав бесплатный сервис для фильтрации ботов  таргетхантер, выяснилось, что все равно остаются «липовые» аккаунты. А платить не хочется, тем более не понятно какой будет результат. Попробуем выяснить, как написать собственный фильтр.

Какие аккаунты и как планируем отфильтровать

Кроме реальных людей на сообщество могут быть боты, записанные скриптом, и офферы. Если с ботами все ясно, то офферы отличаются набором вручную, но это также нереальные люди. Основная идея нашего фильтра система оценки аккаунта по шкале от нуля до ста. У ботов по задумке получается около 100 баллов, а у реальных подписчиков остается значение максимально равное нулю. Правда бывает и люди набирают большое число баллов.

По каким же признакам оцениваем аккаунты? Основные из них:

  • Аккаунт забанен. Не понятно почему система их автоматически не удаляет через определенное время. Ведь обычный человек восстановит доступ к своему профилю, а фейки создают новые аккаунты.
  • Уникальная ссылка на страницу. При регистрации сервис Вк дает пользователю уникальную ссылку на страницу. Например, это id23543119. Это не прямо точный признак. Пользователи не всегда меняют эту ссылку, но у ботов они точно неизменны.
  • Отсутствует аватар. Тоже малозначимый признак. На сегодняшний день этот признак встречается и у фейков реальных, но ленивых людей.
  • Наличие ссылки на другие социальные сети. Такую ссылку обычно не делают для ботов, потому что это как минимум нужно зарегистрировать аккаунт в другой соцсети и привязать к профилю в Вконтакте. Это сильный признак для определения ботов.
  • Долгое отсутствие на странице. Если пользователь давно не выходил в сеть, это примечательный признак. Обычный человек проявляет хоть какую-то активность.
  • Подписка на большое количество сообществ.
  • Числится в группах по взаимной накрутке.
  • В сообществах группы о разных городах. Врядли обычный человек так быстро меняет местожительство или так много путешествует. Обычно пользователи интересуются новостями своего города.
  • Отметка на фото других пользователей. По этому признаку можно определить общение и дружеские отношения зарегистрированных в сети людей. Ботов отмечать никто не будет. Если вас отметили на публикациях с розыгрышами. Это чаще всего сделано ботом.
  • Друзей много, а просмотров записей нет. Это верный признак фейковой страницы.

Проверка фильтрации

В алгоритме был примененн метод wall.get для проверки записей со стены. У него есть конкретные ограничения. А именно 1000 вызовов в сутки, следовательно, это  скрипт может проверить до тысячи человек. Но впрочем, этого вполне хватит для оценивания качества подписчиков.

Результаты тестирования

Для сравнения выбрана программа таргетхантер и вышеописанный фильтр. Из 2935 человек сервис выявил 877 ботов. Алгоритм фильтрации по признакам распознал 1984 фейков. Однако, нельзя утверждать однозначно о преимуществе фильтра. Так как есть сомнительные аккаунты с репостами записей рекламы и розыгрышей. Некоторые из них могут быть ботами, а кто-то реальным человеком. Чтобы судить о эффективности предложенного алгоритма придется еще вручную проверять все отсеянные профили.

Предложенный алгоритм можно дополнить за счет расширения списка признака для поиска ботов. Но и на настоящий момент примененных признаков достаточно для нормальной работы.

You have no rights to post comments