SOFT для SEO
ГлавнаяСофтСофт на заказБазыСтатьиВиды СЕО бизнесаКонтактыОбратная связьДругие ресурсыКарта сайта

Xrumer, стратегия использования: от начинающего до профессионала.
Часть 1 - нетривиальный взгляд, на тривиальные вещи.

Хрумер, как много в этом звуке...
И так, по порядку, если в двух словах, то хрумер, это многопоточная и многофункциональная серверная спамилка :). Наиболее эффективен хрумер для работы с форумами - массовая рассылка сообщений, регистрация пользователей, распознавание каптч, редактирование профайлов, ответы на сообщения и тд., но его также можно использовать для спама по гостевым книгам, блогам и каталогам.(Иногда правда прийдется "обучать" - несколько дополнять логику его работы. Это несложный и, на самом деле, даже интересный процесс). Со временем эта система разрослась в довольно таки многофункциональный инструмент.

Так, теперь опишем основные принципы работы, на примере работы с форумами.
Вобщем, можно выделить 3 метода работы:

  1. Это "тупой спам" - т.е. массовый спам, тут основная идея в массовости, т.е. внимание уделяется настройке потока, и в меньшей степени мелочам.
  2. "Умный спам" (типа хитрый спам :)) - тут массовость конечно же не такая, но улучшается качество, т.е. более умелое использование ресурсов.
  3. Это автоматизация "белой" работы, т.е. размещение нормальных объявлений, создание вменяемых диалогов и тд.

Так, теперь общее описание процесса с пояснениями. Сначала идет сбор ресурсов(аля форумов и тд), для этого в комплекте с хрумером идет хрефер - основной задачей которого является сбор ресурсов, через поисковики по определенным признакам. Потом идет составление проекта для хрумера - т.е. ник, почта, тело сообщения и тд. ну и собственно сам процесс спама и анализ результатов.

И так теперь подробнее. Опишем, на примере второго типа - "умного спама" :) (ну может и не самого умного, ну не совсем уж и тупого :) )
Хрефер. Сначала нам понадобятся признаки для парсинга, т.е. своего рода ключевые слова, по которым, мы сможем получать в поисковиках нужные нам ресурсы.
Для примера :
"inurl:forum", "inurl:phpbb", "inurl:viewtopic", "inurl:/topic.php?forum=", "inurl:/showthread.php?p="...
И собственно в выдаче мы получим форумы (ну не вся выдача конечно, но достаточная ее часть). Если нам нужны будут более специфические форумы, то мы можем просто добавить нужные ключевики в запрос - типа : asian porno inurl:forum или gay sex inurl:viewtopic.

Теперь как можно добыть эти признаки (так называемые "признаки для парсинга").
  1. Просто купить :). Только надо учесть, что в большинстве случаев продается не особо качественные признаки. Не особо качественные, имеется ввиду, что эти признаки уже многим известны, и как следствие форумы, которые по ним находятся уже есть у многих других людей со всеми вытекающими... хотя иногда можно выбрать и неплохие признаки и из покупной базы.
  2. Собрать самому :) - все гениальное просто. Тут тоже можно действовать многими способами.

    1. Можно полазить по форумным движкам и посмотреть, что к чему у них. Т.е. посмотреть какие распространенные файлы и папки используются. (Кстати, забегая немного вперед, хочу сказать, что в инструментах хрумера, есть полезные функции которые помогут вычислять признаки, на основе уже собранных форумов). Например : http://domain.com/forum; http://site.com/punbb/ и тд p.s. причем использовать можно не только сильно распространенные движки.

    2. Так же можно использовать не только папки и имена файлов, но и уникальные названия в локализациях самих форумов или подписи копирайта.
      Например : "Powered by SMF", "Copyright © 2008 PunBB" и тд... - думаю смысл понятен :)

    3. Есть и еще способ, а именно можно брать те форумы, которые уже нашли другие люди и уже использовали для спама (т.е. по крайней мере будем знать, что сообщения там живут какое то время) -- например можно искать по темам, которые создали другие люди т.е. вы каким то способом находите форум и смотрите сообщение уже созданное, которое является спамерским (ну это понять достаточно не сложно.) например "hard anal asian porno xxx", затем пишем это в поисковике, немного удачи и вуаля находится еще куча результатов с такими же сообщениями (ну конечно, возможно не с первой попытки).
      Причем обычно, в одном форуме если есть одно спам сообщение, то там и других достаточно, поэтому мы получим кучу признаков. Стоит заметить, что порой эти сообщения полностью совпадают с выборкой из базы пастухова... так что порой можно смело брать выборку из нее по каким то ключевикам, брать это дело в кавычки и у нас куча признаков :) (понятно, что такую базу надо будет чистить, от дублей, и от сайтов, которые не являются форумами и вперед).
      Так же можно искать по никам, тех кто уже спамил, причем это очень хорошо ищется если ники уникальные типа "asdasdXXX" т.е. запросы будут типа : porno "asdasdXXX", sex "asdasdXXX" и тд, добавление слов кроме ников, даст нам возможность получить больше результатов.

      Опытные спамеры порой стараются использовать НЕ уникальные ники, которые теряются в других поисковых результатах. т.е. если к примеру взять ник "Honda", то понятно что по нему будет достаточно сложно выявить форумы, так как много будет результатов не относящихся к этому нику, НО это тоже можно обойти, например используя уникальные добавки форума
      Например : "posted by Honda", "author Honda" и тд.
      Ну и в завершение хочется сказать, что не стоит забывать про разные локализации форумов, т.е. можно брать из локализаций по возможности уникальные словосочетания и искать уже по ним ;)
Так теперь про сам процесс сбора. Обычно для сбора ресурсов используется парсинг google, и, как известно, гугл достаточно оперативно банить за это дело. Для избежания бана используются прокси(proxy)(не путать с прокси, которые использует хрумер).
Для парсинга гугла требуется достаточно БОЛЬШОЕ кол-во проксей, причем от них не требуется поддержка POST метода, также скорость для данных проксей не так критична, понятно, что чем быстрее тем лучше, но не так критично, как для спама через них хрумером.
Грубо говоря для хрефера - МНОГО проксей, а для хрумера - больше важна скорость этих проксей и поддержка POST метода.

Прокси можно как покупать, так и собирать из открытых источников, как самому, так и использовать те, что идут в комплект с хрумером.
Самостоятельный сбор прокси можно осуществлять по такому же принципу как и сбор форумов. Т.е. либо по словам "список прокси", "анонимные прокси" и тд.(так же на английском("proxy", "proxy list"...) и других! языках - причем, на других языках может оказаться в некотором смысле даже эффективнее, так как можно найти не сильно загруженные прокси), ну и понятно, что после того как мы найдем несколько сайтов с проксями, то можем уже смотреть и на названия файлов и папок (proxylist.php, proxy/list.php, proxy.php и тд).

Теперь у нас есть признаки для парсинга, и прокси, перед запуском хрефера, нам остается только проверить их и все можно запускать. :) Причем у хрефера, есть замечательные функции - он может фильтровать дубликаты, И! сортировать по пиару (пейдж ранку).
Теперь на выходе у нас есть куча результатов, которые потенциально являются форумами.(в зависимости от целей(методов работы), их можно отсортировать по пиару, тут на самом деле достаточно ньюансов, по поводу того стоит это делать или нет, в плане того насколько это улучшит результат).

Теперь эту базу ресурсов можно немного отфильтровать,
во-первых, прогнать по блэк листу - ресурсам, в которые спамить не рекомендуется, ввиду жалоб и других причин.

Во-вторых стоит проверить эту базу на живые ресурсы, а именно те, которые возвращают в заголовке HTTP 200 ответ. Это позволяет сделать хрумер.

Причем прогонять стоит раза 2(а возможно и 3), дело в том, что многие пригодные для спама форумы, уже ктото спамит, поэтому в момент проверки они могут не дать нужный ответ, процент успешного постинга в такие может быть не особо высоким, но терять их не стоит все таки, потому что раз в них спамят другие, то видимо не просто так ;).
В некоторых случаях, так же стоит проверить на сообщения об ошибках форума - т.е. по HTTP идет 200 ответ, но сам форум или php кидает ошибку в браузер(это происходит например когда форум сильно заспамлен и кончилось место в БД например, или закончилась оплата за хостинг и тд). Т.е. уже проверять не заголовки ответа, а само тело ответа.
Например "phpBB : Critical Error Error" и тд (непосредственно сами ошибки можно посмотреть, в движках форумов) проверять на все конечно же смысла нету, но вот либо на основные, либо по общим заголовкам ошибок.
Ну и собственно сохранять только те, у которых нету этих багов:). Теперь у нас уже имеется относительно чистая база. Теперь, нам нужно создать проект, проверить прокси для хрумера (если спам идет через прокси) и вперед. А том как составить проект, и как грамотно составить сообщение вы узнаете из следующих статей.
Часть 2 - "умная рассылка", сообщения-доры, паутинки и картинки. >>>