Разработан алгоритм по выявлению групп "клакёров" в Сети

Опубликовано: 2012-04-17

Разработан алгоритм по выявлению групп клакёров в Сети

В Университете штата Иллинойс в Чикаго разработан новый алгоритм, который позволяет вычислять целые группы людей, занимающихся публикацией «проплаченных» комментариев о тех или иных компаниях или продуктах — в блогах, на форумах или в соответствующих секциях в интернет-магазинах.

Собственно, такие «подсадные» комментаторы ничем особо не отличаются от банальных спамеров. Исследование, получившее название «Выявление организованных групп рецензентов-фальсификаторов в секциях потребительских отзывов» частично спонсируется Google; один из авторов этого исследования и алгоритма GSRank (Group Spam Rank), созданного на его основе, — штатная сотрудница поисковой компании.

В принципе, у Google в имеется прямая заинтересованность в возможности идентифицировать (и отстреливать на дальних подступах) спам такого рода. А его в последнее время развелось много — особенно на фоне роста популярности таких социальных ресурсов, как Yelp и TripAdvisor, где большая часть контента — как раз отзывы, написанных рядовыми пользователями Сети. Ну, или не совсем рядовыми.

Алгоритм GSRank опирается на следующие параметры:

Временной промежуток — предполагается, что все члены группы «клакеров» свои отзывы разместят за очень ограниченный период
Предвзятость — насколько отзывы предполагаемых спамеров отличаются от «среднестатистических» рецензий
Сходство контента — есть все основания ожидать, что спамеры будут публиковать примерно одно и то же, в одних и тех же выражениях и ставить одни и те же оценки — максимальные или минимальные
Принцип «в первую голову» — спамеров, по мнению разработчиков алгоритма, выдаёт их стремление написать отзывы в первых рядах — особенно, если «работодатель» поставил задачу поднять или опустить рейтинг какой-либо продукции
Размеры предполагаемой группы «клакеров»
Повышенная групповая активность — спамеры будут бросаться всей кучей на ту продукцию или тот ресурс, за работу по которым им заплатили

GSRank не позволяет выяснить, действует ли именно группа накрутчиков (или «ронятелей») рейтингов той или иной продукции, или это один и тот же персонаж, меняя аккаунты, старается создать иллюзию «общественного мнения». Впрочем, это не так уж и важно: вопрос состоит в том, чтобы выявить определённые поведенческие паттерны, а не установить поимённо безобразничающих лиц.

Применение этого алгоритма чрезвычайно сильно не помешало бы некоторым сетевым изданиям в Рунете, где постоянно бесчинствуют тролли с активной гражданско-политической позицией. Другой вопрос, сколько этот алгоритм даёт «ложных срабатываний».

Источник: blogs.computerra.ru

Похожие новости:

Создан алгоритм для "наведения порядка" в социальных связях

Ученые из Стенфордского университета создали алгоритм, который способен автоматически выделять в социальных связях пользователя "круги" коллег, членов семьи или знакомых. Препринт работы доступен в архиве Корнельского университета, краткое ее содержание пересказывает блог Technology Review. В основе ..

2012-11-5 1805 0 Интернет, IT

Алгоритм определит правдивость твитов

Twitter остается интересной средой для практического применения математики. Не так давно мир увидел алгоритм, способный предсказывать тренды в этой соцсети. А на днях ученые представили программу, определяющую, содержится ли в твите достоверная информация. Необычный алгоритм использует для определения правдивости сообщения различные ..

2012-12-18 1843 0 Интернет, IT

Google и MIT разработали алгоритм удаления отражений при съемке через стекло

Компания Google и Массачусетский технологический институт (MIT) совместно разработали алгоритм, который позволяет удалять с фотографий отражение, возникающее при съемке через стекло. О задачах, поставленных перед командой исследователей, и принципах действия предложенной ими методики рассказывается в видеоролике, опубликованном ..

2015-08-13 2761 0 Интернет, IT

Google улучшает поиск и вводит новый алгоритм Hummingbi

В рамках празднования 15-летия Google компания объявила о переходе самого главного своего продукта — поисковика — на новый алгоритм под названием Hummingbird. На самом деле он начал действовать еще месяц назад, но рассказать о некоторых его достоинствах руководство корпорации решило ..

2013-10-1 1856 0 Интернет, IT

Facebook позволит обмениваться файлами

В социальной сети Facebook появилась функция обмена файлами. Она доступна только участникам групп. Максимальный размер одного загружаемого файла ограничен 25 мегабайтами (такой же лимит установлен в почтовой службе Gmail), пишет Mashable. Пользователи групп могут обмениваться документами, ..

2012-05-12 2129 0 Интернет, IT

Панда "нового поколения" скоро увидит мир

Согласно данным, полученным с конференции SMS West, которая недавно проходила в Калифорнии, команда разработчиков интернет-корпорации Google занимается разработкой нового алгоритма, носящего название Панда «нового поколения». По словам Мэтта Каттса: «Этот алгоритм станет для представителей малого ..

2014-03-17 2146 0 Интернет, IT

Создан эффективный алгоритм распознавания пешеходов

Исследователи из Калифорнийского университета в Сан-Диего разработали алгоритм распознавания пешеходов в режиме реального времени, который в качестве исходных данных использует только изображение с камеры. Доклад был представлен на конференции ICCV 2015, которая прошла в декабре в Сантьяго. С кратким описанием ..

2016-02-10 1858 0 Интернет, IT

Facebook увеличил длину статуса до 63 тыс. символов

Социальной сетью Facebook была увеличена наибольшая возможная длина статуса до 63 тыс. символов, что превышает ранее разрешенное ограничение в 5 тысяч символов в 12 раз, информирует издание, которое называется Mashable. Один из представителей социальной сети, Вадим Лаврушик, на своей странице ..

2011-12-3 2113 0 Интернет, IT

Алгоритм, выдающий портрет пользователя Facebook по "лайкам"

Результаты исследований, проведенных учеными из Кембриджского университета совместно с сотрудниками Microsoft Research Сenter, свидетельствуют о том, что "лайки" в социальной сети Facebook позволяют не только определить пристрастия данного пользователя, но также составить его психологический портрет. Об этом пишут во вторник, ..

2013-03-13 1895 0 Интернет, IT

Google внедрила новый поисковый алгоритм

Компания Google приурочила к своему 15-летию объявление о запуске нового алгоритма поиска. Система, получившая кодовое имя Hummingbird ("Колибри"), работает уже как месяц. Она обрабатывает примерно 90% всех поисковых запросов. Поисковик, основанный в сентябре 1998 года, не стал вдаваться в подробности о том, ..

2013-09-28 1901 0 Интернет, IT

Общественные сети Wi-Fi пообещали ускорить в семь раз

Исследователи из Университета штата Северная Каролина (NCSU) заявили о разработке метода повышения скорости работы сетей Wi-Fi, развернутых в общественных местах - например, в конференц-залах, в кафе или в аэропортах, пишет Lenta.ru со ссылкой на ExtremeTech. Метод, получивший название WiFox, основан на постоянном ..

2012-11-16 1580 0 Интернет, IT

Алгоритм Baidu догнал людей в распознавании речи на английском и китайском

Лаборатория искусственного интеллекта (SVAIL) исследовательского подразделения китайской компании Baidu улучшила алгоритм распознавания речи под названием Deep Speech, при этом в некоторых случаях вторая версия программы распознает речь даже быстрее людей. Препринт статьи опубликован ..

2016-01-10 1990 0 Интернет, IT

Facebook копирует технологии Google

В социальной сети Facebook изменился интерфейс просмотра изображений. Техноблог ZDNet со ссылкой на представителей сервиса сообщил, что новая версия просмотрщика была введена для всех пользователей. Главным нововведением стало перемещение блока с описанием снимка и комментариями в правую часть ..

2012-02-9 2085 0 Интернет, IT

"Яндекс" начал регистрацию на чемпионат по программированию "Алгоритм"

Российская интернет-компания "Яндекс" открыла регистрацию на международный чемпионат по спортивному программированию "Яндекс.Алгоритм", в котором могут участвовать все желающие, говорится в сообщении компании. "Яндекс.Алгоритм" — это индивидуальные соревнования, участие в которых не ограничено образованием, родом занятий и возрастом. Впервые конкурс проводился в 2011 ..

2014-04-09 2025 0 Интернет, IT

"Яндекс" начал ранжировать сайты в поисковой выдаче без учета ссылок

Интернет-компания "Яндекс" начала внедрять новый алгоритм ранжирования поисковой выдачи по коммерческим запросам, который не учитывает ссылки на сайт на сторонних ресурсах и позволяет эффективнее бороться с "черным" SEO (search engine optimization — поисковая оптимизация), сообщает Digit.ru. Руководитель поисковых сервисов ..

2014-03-12 2313 0 Интернет, IT