очень странно, совсем разные паттерны - единовременное создание (?) огромной кучи юзеров, которых нигде не видно (может, они "англоязычные"); и растянутое на весь январь-месяц (а часть этих ботов и в марте вылупилась) создание активно френдящего улья. лично меня впечатляет еще индивидуализация, особенно естественно выглядещие ники вместо обычных "sf67srt76".
Ну, ники создать это просто вторая итерация генерации ботов.
Не вижу ничего сложного в использовании словаря, хотя проще юзать базу зарегистрированых доменов, там уже всю работу по натуральности названия выполнили люди.
как бы оценить сколько их? тот улей, который я заметил, он для рекламодателей слишком мелкий - что такое 500 журналов; тем более, за три месяца (там даты регистрации - январь/март)
Берешь фразу из верхнего поста, и ищешь ее, допустим, в гугле. Если точно такая же фраза есть еще в как минимум десяти журналах - это робот (добавляешь заодно и остальных). Это основная идея, ее можно немного уточнить, чтобы отсечь случайные совпадения.
это если они все "пишут" выборку из одного и того же пула, а если, например, есть несколько десятков/сотен групп, каждая со своими источниками?
пока что вижу одну отлавливаемую черту - изобилие ссылок на библиотеки и просто сайты в домейне info. но а) это не оченьто спецефично б)кто сказал, что они все ракламиручт одно и тоже? может, большинство вообще "спит"
Суп может и по базе искать. Они-то точно знают, кто первый запостил (он может быть не бот, другие практически точно боты). Конечно, они могут контент и с других сайтов заливать, хоть ленту с google news перепечатывать.
no subject
on 2008-04-29 12:46 pm (UTC)Большинство из них зарегено 20 января, если я не ошибаюсь и в количестве нескольких десятков тысяч.
Ходил даже график количества новых аккаунтов.
Сие явление обсуждалось в свое время.
no subject
on 2008-04-29 12:47 pm (UTC)2 - 12-го января
1 - 8-го января
Впрочем, может быть, это они и есть.
no subject
on 2008-04-29 01:49 pm (UTC)Видать мы оба брали верхних 3-4-х ботов.
no subject
on 2008-04-29 03:45 pm (UTC)no subject
on 2008-04-29 12:57 pm (UTC)http://pyrop.livejournal.com/782464.html
28-го января был пик, так что это другие роботы.
no subject
on 2008-04-29 01:48 pm (UTC)Кроме того, что это был пререлиз ботогенератора у меня других версий нет.
no subject
on 2008-04-29 01:49 pm (UTC)no subject
on 2008-04-29 02:17 pm (UTC)и растянутое на весь январь-месяц (а часть этих ботов и в марте вылупилась) создание активно френдящего улья.
лично меня впечатляет еще индивидуализация, особенно естественно выглядещие ники вместо обычных "sf67srt76".
no subject
on 2008-04-29 02:42 pm (UTC)Не вижу ничего сложного в использовании словаря, хотя проще юзать базу зарегистрированых доменов, там уже всю работу по натуральности названия выполнили люди.
no subject
on 2008-04-29 01:02 pm (UTC)no subject
on 2008-04-29 01:13 pm (UTC)no subject
on 2008-04-29 01:17 pm (UTC)no subject
on 2008-04-29 01:50 pm (UTC)no subject
on 2008-04-29 02:19 pm (UTC)тот улей, который я заметил, он для рекламодателей слишком мелкий - что такое 500 журналов; тем более, за три месяца (там даты регистрации - январь/март)
no subject
on 2008-04-29 02:20 pm (UTC)no subject
on 2008-04-29 02:37 pm (UTC)no subject
on 2008-04-29 02:43 pm (UTC)no subject
on 2008-04-29 03:06 pm (UTC)пока что вижу одну отлавливаемую черту - изобилие ссылок на библиотеки и просто сайты в домейне info. но а) это не оченьто спецефично б)кто сказал, что они все ракламиручт одно и тоже? может, большинство вообще "спит"
no subject
on 2008-04-30 12:02 am (UTC)no subject
on 2008-04-29 01:50 pm (UTC)no subject
on 2008-04-29 03:29 pm (UTC)no subject
on 2008-04-29 05:32 pm (UTC)