как бы оценить сколько их? тот улей, который я заметил, он для рекламодателей слишком мелкий - что такое 500 журналов; тем более, за три месяца (там даты регистрации - январь/март)
Берешь фразу из верхнего поста, и ищешь ее, допустим, в гугле. Если точно такая же фраза есть еще в как минимум десяти журналах - это робот (добавляешь заодно и остальных). Это основная идея, ее можно немного уточнить, чтобы отсечь случайные совпадения.
это если они все "пишут" выборку из одного и того же пула, а если, например, есть несколько десятков/сотен групп, каждая со своими источниками?
пока что вижу одну отлавливаемую черту - изобилие ссылок на библиотеки и просто сайты в домейне info. но а) это не оченьто спецефично б)кто сказал, что они все ракламиручт одно и тоже? может, большинство вообще "спит"
Суп может и по базе искать. Они-то точно знают, кто первый запостил (он может быть не бот, другие практически точно боты). Конечно, они могут контент и с других сайтов заливать, хоть ленту с google news перепечатывать.
no subject
on 2008-04-29 02:19 pm (UTC)тот улей, который я заметил, он для рекламодателей слишком мелкий - что такое 500 журналов; тем более, за три месяца (там даты регистрации - январь/март)
no subject
on 2008-04-29 02:20 pm (UTC)no subject
on 2008-04-29 02:37 pm (UTC)no subject
on 2008-04-29 02:43 pm (UTC)no subject
on 2008-04-29 03:06 pm (UTC)пока что вижу одну отлавливаемую черту - изобилие ссылок на библиотеки и просто сайты в домейне info. но а) это не оченьто спецефично б)кто сказал, что они все ракламиручт одно и тоже? может, большинство вообще "спит"
no subject
on 2008-04-30 12:02 am (UTC)