Хочу начать свою новую заметку с благодарностей тем, кто оставляет свои комментарии(причём не важно положительные или отрицательные), вы не представляете насколько важно(особенно наверное в начале пути) иметь обратную связь.
Сегодня я хочу поговорить об одной из самых важных проблем для любого новичка – сбор базы для постинга. Конечно, можно залезть на гуглю и самому в ручную искать гостевухи, форумы и другие пригодные для постинга ресурсы, но не думаю, что мы далеко так уедем. Поэтому человечество придумало такую великолепную штуку, как парсер. Конечно, у всех нас ньбов стоит проблема, где достать фришный софт, и к счастью есть люди, которые данный софт создают. Короче говоря, из фришных парсеров я рекомендую AGGRESS Parser. Как только скачаете данную утилиту с сайта производителя не поленитесь и зайдите вот сюда, в статье на том сайте описано, что нужно поменять в настройках, чтобы данный парсер отлично работал с яху.ком. И так у нас на руках есть неплохой, работающий фришный парсер. Теперь осталось научиться собирать запросы. Я не буду переписывать миллион статей по данной тематике, а лучше дам ссылку на лучшую из них, там автор использует алльсубмиттер, в нашем случае всё ещё гораздо легче. А вообще, скажу вам по секрету, на некоторых форумах люди выкладывают свои запросы, так что если хорошо поищете, то обязательно найдёте. А мы идём дальше. И так наш парсер создал для нас базу. Что мы будем с ней делать? Конечно, там много мусора, мёртвых страниц, и всякой чепухи, которой нам не нужно. Что делаю я. Загоняю всю эту базу в демку хрумера, в закладке инструменты, удаляю все повторные ссылки, потом прохожусь по блеклисту, потом удаляю ссылки по зоне домена, в первую очередь я советую удалять в зоне .gov, .mil, и edu, так как именно с этих зон приходит наибольшее количество абуз. Отлично, больше половины работы мы сделали, теперь я проверяю базу с помощью 404 чекера, который написал Seocoder и в самом конце, я возвращаюсь снова в AGGRESS Parser и чекаю на пиар, как правило всё что ниже пиара 2 уходит у меня в небытие. Можно ещё чекать с помощью например AGGRESS AutoPost на наличие формы. Вот пожалуй и всё, у нас получается рабочая база для постинга. Очень рад буду услышать ваши способы создания подобных баз, а также отзывы на данную заметку.

{ 30 comments… read them below or add one }
Я тоже новичек в дорвеях, и также недавно начал, но этот путь уже не рулит, парсер и тупое засырание фтопку. Сейчас рулят только прямые руки, или хакеры.
У меня база 3к ресурсов, 250 ПР6, 350 ПР5, 900 ПР4, и все остальное от ПР 3 до ПР4, так как страница с формами, а сам камент будет на другой странице, поэтому ПР в базе не определен. Собирал базу руками, да-да, именно РУКАМИ. По бэкам в Яху, своеобразные запросы в гугл и еще по некоторым очень интересным признакам.
Теперь покажи мне хоть одного дорвейщика который бы смог собрать такую базу парсером и чекером.
Ваши тупые гесты до [цензура], вы их уже так засрали, что уже даже сами в бестолку спаммите, наверное забыли что гугля не хавает больше 100-150 исходящих ссылок!
Согласен с тобой лишь отчасти. Ты не указал под ручной спам ты собираешь базу или под автомат?
Если руками, о чем говорит то, что ты удаляешь все ниже ПР2, то проще напарсить тоже руками небольшую качественную базку используя Мозиллу/ИЕ с установленным SeoQuake.
Если есть спамилко, то сразу после удаления дублей и прочего начинай спамить. Она тебе и на 404 прочекает и на формы, в любом случае встроеный в нее анализатор лучше работает, чем сторонний. А так, пока ты все своим методом отберешь, кучу времени зря потратишь.
Насчет ПР, то для ручного шпама бери 4-5 и выше, для автомата я уже сказал, что чекать нет смысла, сразу спамь.
я, как последний ламер, НИКОГДА не парсил базы для спама. Даже парсера в глаза не видел, кроме олсабмиттерского. Просто небольшой камент
«Отлично, больше половины работы мы сделали, теперь я проверяю базу с помощью 404 чекера»
http://www.seocoder.org/?attachment_id=22
здесь выдает:
Sorry, no posts matched your criteria.
надо зарегистрироваться и войти в свой акк.
тыщу раз писано это
flix вот и разница ручного сбора базы и спама, и автоматизированного.
Та база что есть у меня ты никогда не соберешь парсером, ибо урлы очень отличаются от стандартных, и парсилка такие не заглотит, во вторых оставить страница с каментами и форма добавления каментов разные, причем последняя в индексе не наблюдается. Есть и под автомат то что без каптчи, под алсабмитер заточено, а есть и под полурегистрацию с мудренными каптчами.
2k2 Не нужно так кипятиться. «Ваши тупые гесты до [цензура], вы их уже так засрали, что уже даже сами в бестолку спаммите». Я хочу сказать, что почти по каждому запросу я нахожу гесты, которые ещё не «засраны», но уже заброшены, при этом они имеют нормальный пиар(4 например), и на пиар я смотрю именно страницу комментов, а не на страницу «добавления сообщений». «Собирал базу руками, да-да, именно РУКАМИ. По бэкам в Яху», бэки яху отлично парсит Агресс, если правильно его настроить, об этом написано в статье, ссылку на которую я давал. Из вашего поста может сложиться впечатление, что парсерами пользуются только те у кого кривые руки. Весьма спорно.
2flix Спасибо за комментарий, им вы помогли как минимум одному человеку.
2all Эта рубрика новичка и создана тоже для таких же новичков.Если вы хотите, услышать «истину в последней инстанции», то вам в блоги к Гуру.
А я сам себе парсеры на php сделал и не парюсь. Хотя по качеству они вряд ли превосходят общеизвестные.
2 k2
)
И зачем ты пишешь сюда ПР своей базы страниц с формами, если сам же указываешь, что он отличен от ПР паги с коментом?
Интересно, откуда высказывание, что «наверное забыли что гугля не хавает больше 100-150 исходящих ссылок!»? Первый раз об этом слышу.
И насчет парсера вам всем сюда Поэтому неважно руками или программой, вы все равно «парсите» – делаете запросы, анализируете, отбираете.
2 Wow Пожалуйста, удачи в гуглфакинге
«бэки яху отлично парсит Агресс» – это я знаю, вот только формы не всегда находятся на той же странице, по урлу которого собственно и парсится Яху. Сканировать весь сайт на наличие форм никто не будет, вот в чем приемущество ручной сборки.
У меня те страницы, до которых спамеры с помощью прог никак не доберуться.
«что парсерами пользуются только те у кого кривые руки» даже и не знаю, вначале искал себе наставника, пока не понял что они ну больше нехрена не знают, кроме как раздавать инвиты. Если отлучился от дел больше чем на 2-3 месяца, то уже все очень, и очень поменялось. Поэтому работаю сам, только на пробах и ошибках.
Анализировав выдачу вижу что рулят именно РУКИ и Хакеры. Большинство вкусных запросов по фарме в еду, профайлах, социалках, а там то, программы то и не очень помогут, точнее помогут, но процесс не автоматизируют
PS Увидел пост на сайте Агрессора, что в последней версии сидит трой, по скриншоту было вино что антивирус Авира.
У меня кстати тоже антивирус матерится на последнию версию парсера.
надо зарегистрироваться и войти в свой акк. тыщу раз писано это
Comment by SeoCoder — February 12, 2008 @ 12:20 pm
я давно зарегистрирован у тебя и куки давно не чистил. Но вот какая штука – сейчас попробовал открыть эту страницу MyIE – открылась, FF по прежнему выдает вышеупомянутую ошибку. такие дела…
Пользуюсь AllSubmitter – сначала «Мастер SE», далее «Найти формы добавления», в завершение – «Распознать однотипные формы». Программа сама раскладывает страницы по разным подкатегориям. По срочному проходишься по «Найдена эталонная форма», в большинстве случаев остается только нажимать кнопку добавления. А потом уже по «Не найдена эталонная форма» проходишь сколько-то, откладывая удачные и неудачные добавления в отдельные подкатегории и снова на «Распознать однотипные формы». С каждой чисткой исходная база требует все больше затрат ручного труда, я, по-ленивости, ее просто удаляю – если веб-мастер озаботился изменить стандартное оформление формы, много шансов что и за спамом он приглядывает особенно сильно.
как ты пользуешся AllSubmitter для заполнение форм в гостевые немогу разобратся неможеш подсказать ато AGGRESS AutoPost неработает
варианты набить, к примеру на фиелд8 – подальше от фиелдов, используемых для каталогов. После прокачки эталонных форм значение привязывается к форме автоматом. Проблема только в том, что использование большого количества фиелдов замусоривает меню(((
Но вот скачал я с оффициального сайта по ссылке парсер ! Но после выключения, файрвол показывал что идет коннект к vector-seo.info даже после выключения парсера. Напарсить им у меня ничего не удалось. Вы уж сорри если что не так говорю…
а спамиш ты чем какой спамилкой я пробывал бесплатный хрумер найти, но ломаного нигде нет я только начал этим занематся неподскажеш чем пожно заполнять гостевые
Половина ссылок в статье не работают, можно на мыло скинуть Yahoo.txt с правильными параметрами ??
ну или как нужно настроить что бы парсить бэклинки ?
Заранее благодарю…
Восставший из ада бля)
Декабрь 29th, 2008
***
В общем статьи по настройке НЕТ!
Тема уже давно забытая,но интересная.Все же некоторый прирост еще есть с качественных ресурсов.
Эх обновили бы ссылки
Тема интересная, но ссылки обновить надо, очень надо, плз
спасибо за информацию)
Спасибо
Плиз обновите ссылки
C обновлением че-то наверно не получается?
Очень интересно. То что на яхоо искать сылки и создавать базу понятно.
Но тут у вас не все сылки работают(((
Обновите ссылки…..плииииииз
Так подскажите запрос к яху на парсинг беклинков, плиз
Очень много времени прошло, может какие то новые способы появились как напарсить базу, было бы очень интересно узнать
Leave a Comment