Stats

Apr. 29th, 2008 03:36 pm
dimrub: (Default)
[personal profile] dimrub
Один из источников радужной статистики использования ЖЖ, о которой регулярно рапортует главный блогер всея ЖЖ А.Б. Носик.

on 2008-04-29 12:46 pm (UTC)
Posted by [identity profile] yanek.livejournal.com
Так эта, известная фича.

Большинство из них зарегено 20 января, если я не ошибаюсь и в количестве нескольких десятков тысяч.

Ходил даже график количества новых аккаунтов.

Сие явление обсуждалось в свое время.

on 2008-04-29 12:47 pm (UTC)
Posted by [identity profile] dimrub.livejournal.com
Первые три наугад выбранные зарегистрированы:

2 - 12-го января
1 - 8-го января

Впрочем, может быть, это они и есть.

on 2008-04-29 12:57 pm (UTC)
Posted by [identity profile] dimrub.livejournal.com
Ага:

http://pyrop.livejournal.com/782464.html

28-го января был пик, так что это другие роботы.

on 2008-04-29 01:02 pm (UTC)
Posted by [identity profile] catpad.livejournal.com
Какая, однако, мерзость. Это они рекламодателей так, наверное, привлекают.

on 2008-04-29 01:13 pm (UTC)
Posted by [identity profile] anjey.livejournal.com
В нужный момент эти человекоподобные будут обеспечивать ссылками и поднимать в топ Яндекса то, что прикажут.

on 2008-04-29 01:17 pm (UTC)
Posted by [identity profile] mopexod.livejournal.com
Купили крутые пацаны сервис, почему бы самим не использовать? Не самим же писать - роботов посадили...

on 2008-04-29 01:48 pm (UTC)
Posted by [identity profile] yanek.livejournal.com
Я именно єтот график имел ввиду.

Кроме того, что это был пререлиз ботогенератора у меня других версий нет.

on 2008-04-29 01:49 pm (UTC)
Posted by [identity profile] dimrub.livejournal.com
Разумная версия (объясняет близость по времени).

on 2008-04-29 01:49 pm (UTC)
Posted by [identity profile] yanek.livejournal.com
у меня такая же статистика.

Видать мы оба брали верхних 3-4-х ботов.

on 2008-04-29 01:50 pm (UTC)
Posted by [identity profile] dimrub.livejournal.com
Я, кстати, не уверен, что эти роботы - дело рук СУПа. Но что в СУПе о них знают - тут к бабке не ходи.

on 2008-04-29 01:50 pm (UTC)
Posted by [identity profile] yanek.livejournal.com
Кстати судя по ссылке, раскручивают в поисковиках врангель.нет.

on 2008-04-29 02:17 pm (UTC)
Posted by [identity profile] shufel.livejournal.com
очень странно, совсем разные паттерны - единовременное создание (?) огромной кучи юзеров, которых нигде не видно (может, они "англоязычные");
и растянутое на весь январь-месяц (а часть этих ботов и в марте вылупилась) создание активно френдящего улья.
лично меня впечатляет еще индивидуализация, особенно естественно выглядещие ники вместо обычных "sf67srt76".

on 2008-04-29 02:19 pm (UTC)
Posted by [identity profile] shufel.livejournal.com
как бы оценить сколько их?
тот улей, который я заметил, он для рекламодателей слишком мелкий - что такое 500 журналов; тем более, за три месяца (там даты регистрации - январь/март)

on 2008-04-29 02:20 pm (UTC)
Posted by [identity profile] dimrub.livejournal.com
Я бы написал скрипт, который их отлавливает, но времени нет.

on 2008-04-29 02:37 pm (UTC)
Posted by [identity profile] shufel.livejournal.com
по какому признаку отлавливать?!

on 2008-04-29 02:42 pm (UTC)
Posted by [identity profile] yanek.livejournal.com
Ну, ники создать это просто вторая итерация генерации ботов.

Не вижу ничего сложного в использовании словаря, хотя проще юзать базу зарегистрированых доменов, там уже всю работу по натуральности названия выполнили люди.

on 2008-04-29 02:43 pm (UTC)
Posted by [identity profile] dimrub.livejournal.com
Берешь фразу из верхнего поста, и ищешь ее, допустим, в гугле. Если точно такая же фраза есть еще в как минимум десяти журналах - это робот (добавляешь заодно и остальных). Это основная идея, ее можно немного уточнить, чтобы отсечь случайные совпадения.

on 2008-04-29 03:06 pm (UTC)
Posted by [identity profile] shufel.livejournal.com
это если они все "пишут" выборку из одного и того же пула, а если, например, есть несколько десятков/сотен групп, каждая со своими источниками?

пока что вижу одну отлавливаемую черту - изобилие ссылок на библиотеки и просто сайты в домейне info. но а) это не оченьто спецефично б)кто сказал, что они все ракламиручт одно и тоже? может, большинство вообще "спит"

on 2008-04-29 03:29 pm (UTC)
Posted by [identity profile] romanklimenko.livejournal.com
Агент Смит :-)

on 2008-04-29 03:45 pm (UTC)
gingema: (Default)
Posted by [personal profile] gingema
Вот в сумме как раз 20 и выходит ;)

on 2008-04-29 05:32 pm (UTC)
Posted by [identity profile] wildernesscat.livejournal.com
Точно!

on 2008-04-30 12:02 am (UTC)
stas: (Default)
Posted by [personal profile] stas
Суп может и по базе искать. Они-то точно знают, кто первый запостил (он может быть не бот, другие практически точно боты). Конечно, они могут контент и с других сайтов заливать, хоть ленту с google news перепечатывать.

Profile

dimrub: (Default)
Adventures of a somewhat curious character

September 2013

S M T W T F S
12 345 67
891011121314
15161718192021
22232425262728
2930     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 2nd, 2026 03:06 pm
Powered by Dreamwidth Studios