Создание баз для постинга или какой мусор нам никогда не пригодится.

by Wow on Февраль 11, 2008

Хочу начать свою новую заметку с благодарностей тем, кто оставляет свои комментарии(причём не важно положительные или отрицательные), вы не представляете насколько важно(особенно наверное в начале пути) иметь обратную связь.

Сегодня я хочу поговорить об одной из самых важных проблем для любого новичка – сбор базы для постинга. Конечно, можно залезть на гуглю и самому в ручную искать гостевухи, форумы и другие пригодные для постинга ресурсы, но не думаю, что мы далеко так уедем. Поэтому человечество придумало такую великолепную штуку, как парсер. Конечно, у всех нас ньбов стоит проблема, где достать фришный софт, и к счастью есть люди, которые данный софт создают. Короче говоря, из фришных парсеров я рекомендую AGGRESS Parser. Как только скачаете данную утилиту с сайта производителя не поленитесь и зайдите вот сюда, в статье на том сайте описано, что нужно поменять в настройках, чтобы данный парсер отлично работал с яху.ком. И так у нас на руках есть неплохой, работающий фришный парсер. Теперь осталось научиться собирать запросы. Я не буду переписывать миллион статей по данной тематике, а лучше дам ссылку на лучшую из них, там автор использует алльсубмиттер, в нашем случае всё ещё гораздо легче. А вообще, скажу вам по секрету, на некоторых форумах люди выкладывают свои запросы, так что если хорошо поищете, то обязательно найдёте. А мы идём дальше. И так наш парсер создал для нас базу. Что мы будем с ней делать? Конечно, там много мусора, мёртвых страниц, и всякой чепухи, которой нам не нужно. Что делаю я. Загоняю всю эту базу в демку хрумера, в закладке инструменты, удаляю все повторные ссылки, потом прохожусь по блеклисту, потом удаляю ссылки по зоне домена, в первую очередь я советую удалять в зоне .gov, .mil, и edu, так как именно с этих зон приходит наибольшее количество абуз. Отлично, больше половины работы мы сделали, теперь я проверяю базу с помощью 404 чекера, который написал Seocoder и в самом конце, я возвращаюсь снова в AGGRESS Parser и чекаю на пиар, как правило всё что ниже пиара 2 уходит у меня в небытие. Можно ещё чекать с помощью например AGGRESS AutoPost на наличие формы. Вот пожалуй и всё, у нас получается рабочая база для постинга. Очень рад буду услышать ваши способы создания подобных баз, а также отзывы на данную заметку.

{ 18 comments… read them below or add one }

1 k2 02.12.08 at 1:14 дп

Я тоже новичек в дорвеях, и также недавно начал, но этот путь уже не рулит, парсер и тупое засырание фтопку. Сейчас рулят только прямые руки, или хакеры.

У меня база 3к ресурсов, 250 ПР6, 350 ПР5, 900 ПР4, и все остальное от ПР 3 до ПР4, так как страница с формами, а сам камент будет на другой странице, поэтому ПР в базе не определен. Собирал базу руками, да-да, именно РУКАМИ. По бэкам в Яху, своеобразные запросы в гугл и еще по некоторым очень интересным признакам.

Теперь покажи мне хоть одного дорвейщика который бы смог собрать такую базу парсером и чекером.
Ваши тупые гесты до [цензура], вы их уже так засрали, что уже даже сами в бестолку спаммите, наверное забыли что гугля не хавает больше 100-150 исходящих ссылок!

2 flix 02.12.08 at 2:10 дп

Согласен с тобой лишь отчасти. Ты не указал под ручной спам ты собираешь базу или под автомат?
Если руками, о чем говорит то, что ты удаляешь все ниже ПР2, то проще напарсить тоже руками небольшую качественную базку используя Мозиллу/ИЕ с установленным SeoQuake.
Если есть спамилко, то сразу после удаления дублей и прочего начинай спамить. Она тебе и на 404 прочекает и на формы, в любом случае встроеный в нее анализатор лучше работает, чем сторонний. А так, пока ты все своим методом отберешь, кучу времени зря потратишь.
Насчет ПР, то для ручного шпама бери 4-5 и выше, для автомата я уже сказал, что чекать нет смысла, сразу спамь.

3 99th 02.12.08 at 4:38 дп

я, как последний ламер, НИКОГДА не парсил базы для спама. Даже парсера в глаза не видел, кроме олсабмиттерского. Просто небольшой камент :)

4 qwe 02.12.08 at 12:14 пп

“Отлично, больше половины работы мы сделали, теперь я проверяю базу с помощью 404 чекера”

http://www.seocoder.org/?attachment_id=22
здесь выдает:
Sorry, no posts matched your criteria.

5 SeoCoder 02.12.08 at 12:20 пп

надо зарегистрироваться и войти в свой акк.
тыщу раз писано это

6 k2 02.12.08 at 2:25 пп

flix вот и разница ручного сбора базы и спама, и автоматизированного.

Та база что есть у меня ты никогда не соберешь парсером, ибо урлы очень отличаются от стандартных, и парсилка такие не заглотит, во вторых оставить страница с каментами и форма добавления каментов разные, причем последняя в индексе не наблюдается. Есть и под автомат то что без каптчи, под алсабмитер заточено, а есть и под полурегистрацию с мудренными каптчами.

7 Wow 02.12.08 at 3:49 пп

2k2 Не нужно так кипятиться. “Ваши тупые гесты до [цензура], вы их уже так засрали, что уже даже сами в бестолку спаммите”. Я хочу сказать, что почти по каждому запросу я нахожу гесты, которые ещё не “засраны”, но уже заброшены, при этом они имеют нормальный пиар(4 например), и на пиар я смотрю именно страницу комментов, а не на страницу “добавления сообщений”. “Собирал базу руками, да-да, именно РУКАМИ. По бэкам в Яху”, бэки яху отлично парсит Агресс, если правильно его настроить, об этом написано в статье, ссылку на которую я давал. Из вашего поста может сложиться впечатление, что парсерами пользуются только те у кого кривые руки. Весьма спорно.
2flix Спасибо за комментарий, им вы помогли как минимум одному человеку.
2all Эта рубрика новичка и создана тоже для таких же новичков.Если вы хотите, услышать “истину в последней инстанции”, то вам в блоги к Гуру.

8 Наумов Михаил 02.12.08 at 4:42 пп

А я сам себе парсеры на php сделал и не парюсь. Хотя по качеству они вряд ли превосходят общеизвестные.

9 flix 02.12.08 at 4:50 пп

2 k2
И зачем ты пишешь сюда ПР своей базы страниц с формами, если сам же указываешь, что он отличен от ПР паги с коментом?
Интересно, откуда высказывание, что “наверное забыли что гугля не хавает больше 100-150 исходящих ссылок!”? Первый раз об этом слышу.
И насчет парсера вам всем сюда http://ru.wikipedia.org/wiki/Парсер Поэтому неважно руками или программой, вы все равно “парсите” - делаете запросы, анализируете, отбираете.
2 Wow Пожалуйста, удачи в гуглфакинге :))

10 k2 02.12.08 at 8:34 пп

“бэки яху отлично парсит Агресс” - это я знаю, вот только формы не всегда находятся на той же странице, по урлу которого собственно и парсится Яху. Сканировать весь сайт на наличие форм никто не будет, вот в чем приемущество ручной сборки.
У меня те страницы, до которых спамеры с помощью прог никак не доберуться.

“что парсерами пользуются только те у кого кривые руки” даже и не знаю, вначале искал себе наставника, пока не понял что они ну больше нехрена не знают, кроме как раздавать инвиты. Если отлучился от дел больше чем на 2-3 месяца, то уже все очень, и очень поменялось. Поэтому работаю сам, только на пробах и ошибках.

Анализировав выдачу вижу что рулят именно РУКИ и Хакеры. Большинство вкусных запросов по фарме в еду, профайлах, социалках, а там то, программы то и не очень помогут, точнее помогут, но процесс не автоматизируют ;)

11 k2 02.12.08 at 8:36 пп

PS Увидел пост на сайте Агрессора, что в последней версии сидит трой, по скриншоту было вино что антивирус Авира.

У меня кстати тоже антивирус матерится на последнию версию парсера.

12 qwe 02.12.08 at 10:27 пп

надо зарегистрироваться и войти в свой акк. тыщу раз писано это
Comment by SeoCoder — February 12, 2008 @ 12:20 pm

я давно зарегистрирован у тебя и куки давно не чистил. Но вот какая штука - сейчас попробовал открыть эту страницу MyIE - открылась, FF по прежнему выдает вышеупомянутую ошибку. такие дела…

13 Виталий Бадмин 02.15.08 at 9:33 дп

Пользуюсь AllSubmitter - сначала “Мастер SE”, далее “Найти формы добавления”, в завершение - “Распознать однотипные формы”. Программа сама раскладывает страницы по разным подкатегориям. По срочному проходишься по “Найдена эталонная форма”, в большинстве случаев остается только нажимать кнопку добавления. А потом уже по “Не найдена эталонная форма” проходишь сколько-то, откладывая удачные и неудачные добавления в отдельные подкатегории и снова на “Распознать однотипные формы”. С каждой чисткой исходная база требует все больше затрат ручного труда, я, по-ленивости, ее просто удаляю - если веб-мастер озаботился изменить стандартное оформление формы, много шансов что и за спамом он приглядывает особенно сильно.

14 jeka 02.24.08 at 11:15 дп

как ты пользуешся AllSubmitter для заполнение форм в гостевые немогу разобратся неможеш подсказать ато AGGRESS AutoPost неработает

15 Виталий Бадмин 02.24.08 at 11:43 дп

варианты набить, к примеру на фиелд8 - подальше от фиелдов, используемых для каталогов. После прокачки эталонных форм значение привязывается к форме автоматом. Проблема только в том, что использование большого количества фиелдов замусоривает меню(((

16 DIMKA 02.29.08 at 4:58 дп

Но вот скачал я с оффициального сайта по ссылке парсер ! Но после выключения, файрвол показывал что идет коннект к vector-seo.info даже после выключения парсера. Напарсить им у меня ничего не удалось. Вы уж сорри если что не так говорю…

17 жека 04.29.08 at 2:52 пп

а спамиш ты чем какой спамилкой я пробывал бесплатный хрумер найти, но ломаного нигде нет я только начал этим занематся неподскажеш чем пожно заполнять гостевые

18 Seo блог разработчика 11.13.08 at 12:05 дп

Половина ссылок в статье не работают, можно на мыло скинуть Yahoo.txt с правильными параметрами ??
ну или как нужно настроить что бы парсить бэклинки ?
Заранее благодарю…

Leave a Comment

You can use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>