Перейти к содержимому


A-Parser 1.1 - Продвинутый Парсер Пс, Кейвордов, Контента, Показателей, 70+ Парсеров


  • Авторизуйтесь для ответа в теме
Сообщений в теме: 64

#1 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 26 Июнь 2017 - 10:37

A-Parser - многопоточный парсер поисковых систем, сервисов оценки сайтов, ключевых слов, контента(текст, ссылки, email, телефоны, произвольные данные) и других различных сервисов(youtube, картинки, переводчик...), всего A-Parser содержит более 70 парсеров

На сегодняшний день A-Parser развился в невероятный SEO комбаин, позволяющий покрыть огромное число задач для SEO-специалистов и вебмастеров любого уровня подготовки:
  • Используйте встроенные парсеры чтобы с легкостью получать и анализировать любые данные
  • Воспользуйтесь нашим каталогом парсеров и пресетов для расширения возможностей A-Parser и решения нестандартных задач
  • Если вы продвинутый пользователь - создавайте свои собственные парсеры на основе регулярных выражений или XPath
  • Владеете JavaScript? Тогда A-Parser предлагает вам беспрецедентную возможность программировать свои собственные парсеры, используя всю мощь возможностей A-Parser!
  • Для автоматизации мы предлагаем API позволяющий легко встроить A-Parser в ваши бизнес процессы, а также для создания сервисов любого уровня сложности на базе нашего парсера
Изображение

Кроме этого мы предоставляем услуги по составлению заданий и написанию парсеров под ваши задачи, в кратчайшие сроки и по демократичной цене. Хотите спарсить целиком интернет магазин(Ozon, Amazon, AliExpress)? Проверить 100 миллионов сайтов по вашим признакам? Получить данные с любого сайта в структурированном виде(CSV, JSON, XML, SQL)? В решении этих задач поможет наша дополнительная платная поддержка

A-Parser полностью решает рутинные задачи по получению, обработки и систематизации данных, необходимых для работы в следующих областях:

  • SEO-оптимизация сайтов и Web-аналитика
    • Сбор баз ссылок для XRumer, A-Poster, AllSubmitter, ZennoPoster...
    • Оценка сайтов и доменов по множеству параметров
    • Мониторинг позиции любых сайтов в поисковых системах
    • Сбор контента(текст, картинки, ролики) для генерации сайтов(дорвеев)
    • Отслеживание обратных ссылок
    • Сбор произвольной информации с любых сайтов(например телефоны/e-mails, сообщения с форумов, объявления...)
    • Сбор и оценка ключевых слов
    • Сбор списка обратных ссылок
    • И многое другое
  • Web-безопасность
    • Сбор и фильтрация баз ссылок по признакам
    • Определение CMS сайтов
    • Формирование произвольных GET, POST запросов с одновременной фильтрацией ответа
  • Сетевое администрирование
    • Работа с DNS службой - резолвинг доменов в IP адреса
    • Работа с Whois - дата регистрации и окончания регистрации доменов, name-cервера
A-Parser обладает следующими преимуществами:
  • Колоссальная производительность
    • Многопоточность - парсер способен распараллеливать сетевые операции до 5000-10000 потоков в зависимости от конфигурации компьютера и решаемой задачи
    • Продуманная внутренняя архитектура, в которую заложена производительность и расширяемость
    • Множественные оптимизации сложных операций
    • Парсер не требователен к ресурсам, может работать как на компьютере, так и на VDS или сервере, на операционных системах Windows, Linux или FreeBSD
  • Промышленные масштабы
    • Парсер разрабатывался с учетом работы с неограниченным размером данных
    • Способен обрабатывать сотни миллионов и миллиардов запросов
    • Размеры файлов запросов и результатов ничем не ограничены и могут достигать терабайтных значений
  • Автономность
    • A-Parser рассчитан на бесперебойную и беспрерывную работу без участия пользователя
    • Очередь заданий позволяет нагрузить парсер работой на недели и месяцы вперед
    • Одновременное выполнение нескольких разных задач для скорейшего получения результатов
  • Поддержка более 70 парсеров
  • Создание собственных пресетов
    • Использование регулярных выражений
    • Поддержка XPath
    • Поддержка многостраничного парсинга
    • Проверка контента и наличия следующей страницы
  • Создание собственных парсеров
    • Быстрая разработка на JavaScript
    • Многопоточность и работу с прокси обеспечивает A-Parser
  • Распознавание каптчи
    • Поддержка множества сервисов: антигейт, cheap-captcha.com, rucaptcha.com и любых других на основе AntiGate API
    • Поддержка CapMonster и XEvil
  • Мощные инструменты для формирования запросов и результатов
    • Конструктор запросов и результатов - позволяет видоизменять данные(поиск и замена, выделение домена из ссылки, преобразования по регулярным выражениям...)
    • Подстановки для запросов: из файла; перебор слов, символов и цифр
    • Фильтрация результатов - по вхождению подстроки, равенству, больше\меньше
    • Уникализация результатов - по строке, по домену, по главному домену(A-Parser знает все домены верхнего уровня, в т.ч. такие как co.uk, msk.ru)
    • Мощный шаблонизатор результатов на основе Template Toolkit - позволяет выводить результаты в любом удобном виде(текстом, csv, html, xml, json, sql, произвольный формат)
  • Гибкость настроек
    • В парсере используется система пресетов - для каждого парсера можно создать множество предустановленных настроек для различных ситуаций
    • Настроить можно все - никаких рамок и ограничений
    • Экспорт и импорт настроек позволяет легко обмениваться опытом с другими пользователями
  • Сетевые возможности
    • Поддержка HTTP/1.1, HTTP/2 и HTTPS(TLS)
    • Поддержка HTTP и SOCKS5 прокси, в т.ч. с авторизацией
    • Полностью асинхронная работа с сетью, включая работу с DNS
  • API
    • Возможность интегрировать и управлять парсером из своих программ и скриптов
    • Полная автоматизация бизнес-процессов
    • Клиенты для PHP, Perl, Python и NodeJS
  • Постоянные улучшения и исправления
    • Разработка парсера началась в 2011 году, а первый релиз вышел зимой 2012 года
    • С тех пор было выпущено более 100 новых версий, включающих множество улучшений и исправлений
    • A-Parser не останавливается в развитии, идет активная разработка, будет реализовано множество новых функций, в т.ч. по запросам от пользователей
  • Техническая поддержка
    • Мы прилагаем все усилия по поддержке пользователей и ответам на все возникающие вопросы
    • Создана подробная документация по A-Parser'у, открыт форум для пользователей
    • Специалист технической поддержки готов ответить любым удобным способом: ICQ, Skype, Jabber, GoogleTalk, e-mail и через форму онлайн связи на сайте
    • Разработчики A-Parser'а готовы ответить на любые сложные и технические вопросы, также открыт к обсуждению улучшений и дополнений для парсера
Более подробно ознакомится с возможностями парсера можно в полноценной документации

A-Parser предоставляется в трех версиях, сравнительная таблица и стоимость лицензий:

Изображение

Мы принимаем к оплате в автоматическом режиме все популярные платежные системы, такие как Bitcoin, WebMoney, PayPal, Visa, MasterCard, Paxum, Яндекс.Деньги, QIWI, PerfectMoney, банковские переводы, терминалы оплаты и многое другое.
Для приобретения лицензии необходимо зарегистрироваться на сайте https://a-parser.com и перейти на страницу оплаты.
Если у вас возникли вопросы - обращайтесь по любым контактам в техническую поддержку


#2 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 31 Июль 2017 - 18:00

1.1.899 - автоматическое распознавание Яндекс каптчи и новый парсер мобильной выдачи Google

В A-Parser 1.1.899 добавлено автоматическое распознавание новой Яндекс каптчи, без использования антигейта:

Изображение

Как следствие скорость парсинга Яндекса сильно выросла:

Изображение

Улучшения:
  • Добавлен парсер Изображение SE::Google::Mobile - парсер мобильной и современной десктоп выдачи(режим переключается в настройках)
  • В парсере Изображение SE::Google::Translate названия языков теперь указаны на английском
  • В парсер Изображение Shop::Amazon добавлена возможность указать домен амазона
  • Добавлена возможность пропускать сохранение в файл указав в шаблоне пустое название файла
  • Улучшен просмотр HTML кода в дебаг режиме - отключена возможность перезагрузки интерфейса парсера
Исправления в связи с изменениями в выдаче:
  • Изображение SE::Google::Fast, Изображение Shop::Amazon
  • Изображение SE::Yandex - исправлена обработка каптчи
  • Изображение SE::Yandex - исправлен сбор рекламных блоков
  • В парсере Изображение SE::Rambler исправлена загрузка каптчи


#3 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 23 Август 2017 - 14:37

1.1.918 - улучшена работа с override и отдельные append/preppend text для каждого файла

Изображение

Улучшения:
  • Изменена работа с override: устранена возможность их дублирования, а также улучшен выбор и добавление настроек в пресет в один клик

    Изображение
  • Добавлена возможность для каждого файла результатов задавать индивидуальные Начальный/Конечный текст
Исправления в связи с изменениями в выдаче:
  • Изображение SE::Dogpile, Изображение Rank::MajesticSEO, Изображение SE::Google::Images, Изображение SE::Yandex
Исправления:
  • Исправлены падения при работе JS парсеров на Windows 10
  • Исправлен баг с "белым экраном", который появился в предыдущей версии
  • Парсер Rank::SimilarWeb удален в связи с требованием правообладателей
  • Исправлен баг, при котором не срабатывал шаблон в Общем формате результата при пустом имени файла результата, появился в версии 1.1.896
  • Исправлена работа с каптчей в Изображение SE::Google при работе через IPv6 прокси


#4 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 05 Сентябрь 2017 - 18:23

Видео урок: Парсинг пользователей ВК, которые лайкнули определенный пост

В этом уроке будет рассмотрен пример получения с помощью A-Parser списка пользователей социальной сети Вконтакте, которые лайкнули выбранный пост.
Такую информацию можно использовать для дальнейшего маркетинга, например, для рассылки сообщений только заинтересованным пользователям или проведения различных акций.

Изображение

Урок включает в себя:
  • Парсинг социальной сети Вконтакте после авторизации
  • Отправка POST-запросов парсером и разбор результата
  • Использование Cookies в парсинге
Готовый парсер можно взять в нашем каталоге пресетов: Получение списка пользователей, которые лайкнули пост в VK

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

#5 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 18 Сентябрь 2017 - 19:20

1.1.937 - 2 новых парсера, поддержка reCAPTCHA, возможность перевода интерфейса парсера

Изображение

Улучшения:
  • Добавлено 2 новых парсера:
    • GooglePlay::Apps - парсинг информации о приложениях из Google Play
    • SE::Yandex::Speller - проверка страниц на ошибки в тексте через Яндекс.Спеллер
  • Добавлен функционал перевода интерфейса парсера на другие языки
  • В тестовом режиме добавлена поддержка reCAPTCHA в SE::Google::Mobile, пока поддерживается только сервис anti-captcha.com
  • Улучшен парсинг Google на паблик прокси
  • Уменьшена частота появления каптч, убран лимит страниц и добавлена поддержка антигейта в Shop::Yandex::Market
  • Добавлен выбор базы данных в Rank::SEMrush::Keyword
  • В SE::Yandex:: Direct::Frequency улучшена обработка ошибок
  • Обновлен список языков в SE::Bing::Translator
Исправления в связи с изменениями в выдачи
  • В связи с прекращением поддержки со стороны Google, удален SE::Google::Fast
  • SE:: Dogpile, Rank::MajesticSEO, SE:: DuckDuckGo, Shop::Amazon
Исправления
  • Исправлен сбор картинок в HTML::EmailExtractor
  • Исправлена работа Shop::Yandex::Market в некоторых случаях
  • Исправлена работа с каптчей в SE::Yandex:: Direct::Frequency в редких случаях
  • Исправлен парсинг данных о доменах .biz в Net::Whois
  • Исправлена работа с экзотическими кодировками в Net::HTTP
  • Исправлена работа с прокси в SE::Yandex
  • Исправлена работа с кодировками в JS-парсерах


#6 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 28 Сентябрь 2017 - 14:32

Сборник рецептов #18: скриншоты сайтов, lite выдача Яндекса и проверка сайтов

18-й сборник рецептов. В нем мы будем смотреть как выглядят сайты сразу в нескольких браузерах, протестируем облегченную выдачу Яндекса и проверим сайты в Яндексы. Кроме этого в сборнике предоставлены парсер для проверки существования e-mailов и пресет для получения позиций сразу по нескольким регионам. Итак, поехали!

Автоматизация тестирования сайтов в разных браузерах

Наверное каждый разработчик сайтов сталкивается с вопросом тестирования своих наработок в различных браузерах. Можно конечно держать для этого несколько виртуальных машин, что далеко не совсем рационально. Можно собирать отзывы от пользователей, что негативно влияет на общее впечатление от сайта тех же пользователей. А можно воспользоваться специализированными сервисами. Например BrowserStack. А с помощью А-Парсера этот процесс можно еще и автоматизировать, если к примеру нужно сразу протестировать множество сайтов. Как это сделать - читайте по ссылке выше.
Изображение

Парсинг lite выдачи Яндекса

Недавно на Хабре была опубликована статья о lite выдаче поиска Яндекса. Нам стало интересно, насколько такая выдача может быть полезной в сравнении с обычной с точки зрения парсинга. Мы с помощью функционала JS парсеров сделали новый парсер и сравнили его со стандартным. Как это было, что из этого вышло и какие получились выводы, а также готовый парсер lite выдачи Яндекса - по ссылке выше.
Изображение

Проверка сайта в Яндекс

Поисковую выдачу Яндекса можно использовать для решения самых разных задач. Одна из них - проверка сайтов на различные типы угроз. Яндекс отмечает такие сайты в выдаче специальными метками. С помощью A-Parser можно быстро проверить большие списки сайтов на наличие таких меток. Как это сделать - описано по ссылке выше.
Изображение

Кроме этого: Еще больше различных рецептов в нашем обновленном Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники


#7 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 09 Октябрь 2017 - 13:14

Получение позиций сайта одновременно для нескольких регионов
Написание JS парсера для получения позиций сайта сразу по нескольким регионам

Изображение

Обычно для получения позиций сайта в Яндексе используется ИзображениеSE::Yandex::position. Но если возникает задача получить позиции для нескольких регионов, при этом для каждого региона нужно проверять позицию отдельного поддомена, то нужно делать много однотипных заданий с разными регионами, что несколько неудобно. Решение можно значительно упростить, использовав функционал JavaScript парсеров и написав небольшую обертку вокруг ИзображениеSE::Yandex::position

Урок включает в себя:
  • Написание JS парсера
  • Использование стандартных встроенных парсеров в JS парсере
  • Переопределение настроек стандартного парсера при обращении к нему
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

#8 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 11 Октябрь 2017 - 14:28

Прием оплаты криптовалютами (Bitcoin и т.п.)

После отключения приема Интеркассой биткоинов, мы добавили собственную возможность оплаты в личном кабинете различными криптовалютами. Поддерживаются Bitcoin, BCH, LTC, ETH и другие альткоины.
Изображение

Для того чтобы сделать оплату, достаточно выбрать в личном кабинете соответствующий способ:
Изображение

И проследовать дальнейшим инструкциям, выбрав нужную криптовалюту.

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

#9 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 19 Октябрь 2017 - 16:26

Сборник рецептов #19: публикация сообщений в Wordpress, парсинг Chrome Webstore и AliExpress

19-й сборник рецептов. В нем мы будем постить сообщения в блоги Wordpress, парсить Chrome Webstore и AliExpress. Поехали!

Постинг сообщений в Wordpress блоги
Как известно, А-Парсер - это многофункциональный парсер. И он настолько многофункционален, что может не только парсить, но и постить! О том, как это сделать, пойдет речь в этой статье. В качестве примера выбран один из самых популярных движков - Wordpress. Все подробности, а также готовый постер - по ссылке выше.

Изображение

Получение ссылок на плагины из Chrome Webstore
Браузер Chrome является одним из самых популярных в мире. И в нем практически с самого начала существования есть поддержка расширений, которые доступны в специальном магазине. Данный магазин представляет собой обычный сайт, который, как и любые другие, можно парсить. Полученная информация может быть использована к примеру для создания собственного магазина расширений или парсинга текстовок. Детальнее о том, как создавать такие парсеры - в статье по ссылке выше.

Изображение

Парсер AliExpress
AliExpress - это одна из крупнейших торговых онлайн площадок. Парсинг данных о товарах из алиэкспресс позволяет проводить сравнение цен, получать картинки и названия товаров. Готовый парсер JS::Shop::AliExpress доступен в нашем каталоге по ссылке выше.

Изображение

Кроме этого: Еще больше различных рецептов в нашем обновленном Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники:


#10 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 21 Ноябрь 2017 - 12:59

Сборник статей #1: A-Parser для маркетологов, SEO-специалистов и реальный опыт работы
Мы начинаем публикацию статей об использовании A-Parser для решения различных задач.
В этом сборнике будет рассмотрено использование А-Парсера SEO-специалистами и маркетологами, а также описан реальный пользовательский опыт работы. Поехали!

A-Parser для SEO специалиста
В статье рассмотрена актуальность использования A-Parsera в работе SEO мастера. Определено место парсера в системе SEO оптимизации. На конкретных примерах продемонстрирована его практическая ценность.
Изображение

Интернет-маркетинг и A-Parser
В статье рассмотрены понятия интернет-маркетинга и место в нем A-Parser. Актуализирован вопрос целесообразности использования парсера для интернет-маркетинга. Показаны практические примеры использования парсера в области интернет-маркетинга.
Изображение

Как я пришел к покупке A-Parser в 2016 году!
Описание реального опыта использования парсера одним из наших пользователей. На примере одной из задач показан подход к ее решению и реальная финансовая выгода.

Изображение

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

#11 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 04 Декабрь 2017 - 13:45

1.2.31 - x64 для Windows, обновление JS движка, улучшения работы с сохраненными заданиями

Улучшения
  • Для Windows начат выпуск 64-битных сборок
  • Переработан интерфейс выбора сохраненных заданий, теперь пресеты можно сортировать по папкам любой вложенности
    Изображение
  • Реализована "ленивая" загрузка сохраненных пресетов
  • В 64-битных windows/linux версиях обновлен JavaScript движок V8 до версии 6.3
  • Изображение SE::Bing::Translator полностью переписан, исправлена проблема, когда не переводился текст с html тегами и двойными кавычками, а также теперь переводятся большие тексты
  • Добавлено автодополнение Provider url для CapMonster в Изображение Util::ReCaptcha2
  • Добавлена возможность парсинга Cloudflare protected e-mails в Изображение HTML::EmailExtractor
  • Добавлена сортировка JS парсеров внутри папок
  • Уведомление о новой версии перенесено в статусбар
  • Улучшена плавность при просмотре логов в Тестовом парсинге
Исправления в связи с изменениями в выдачи
Исправления
  • Исправлен баг, при котором список пресетов антигейта не обновлялся после создания нового
  • Исправлены падения парсера при использовании удаленного пресета антигейта
  • Исправлена работа через API при вызове сохраненного задания
  • Исправлена ошибка с $followlinks в HTML::LinkExtractor
  • Исправлено определение кодировки на некоторых сайтах
  • Исправлен подсчет неудачных запросов в некоторых случаях
  • Исправлена ошибка с Custom template в фильтрах
  • Исправлена работа кнопки Обновить в логах
  • Исправлена ошибка Can't call method "Parser::HTML::Util::urlFromHTML", возникшая в одной из предыдущих версий
  • Исправлены зависания при использовании уникализации в некоторых случаях
  • Исправлена проверка обновлений после смены канала


#12 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 15 Декабрь 2017 - 14:14

Сборник рецептов #20: автообновление цен в ИМ, анализ текстов и регистрация аккаунтов

В 20-м сборнике рецептов наш пользователь glukmaster поделится опытом решения реальной задачи на практике с помощью A-Parser. А также мы будем анализировать тексты и автоматизировать регистрацию аккаунтов Яндекса. Поехали!

Автоматическое обновление цен 5000 товаров в интернет-магазине на Bitrix
Цикл видео из 7 частей, в которых очень детально и наглядно показано, как решать такую задачу, как обновление цен в интернет магазине. Для парсинга используется A-Parser. Посмотреть видео можно по ссылке выше.
Изображение

Анализ текста
Одним из самых популярных кейсов по применению А-Парсера является парсинг текстов. При этом возникает задача их анализа. Полноценно решить эту задачу позволяют специальные ресурсы. Ранее мы уже публиковали пресет по парсингу одного из таких сервисов. Теперь же это решение полностью переписано в виде JS-парсера, добавлена возможность анализировать не только тексты, а и полностью страницы, т.е. подавать на вход ссылки. Все детали и сам парсер - по ссылке выше.
Изображение

Автоматизация регистрации аккаунтов Яндекса
Как известно, для парсинга WordStat нужны аккаунты Яндекса. А-Парсер умеет их регистрировать, но их срок жизни невелик, т.к. спустя 1-2 суток включается проверка номера телефона. Поэтому возникает необходимость периодической регистрации новых аккаунтов. И это можно легко автоматизировать. По ссылке выше показано как это сделать.
Изображение

Кроме этого: Еще больше различных рецептов в нашем обновленном Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники рецептов:
Сборники статей:


#13 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 26 Декабрь 2017 - 14:27

1.2.50 - улучшение стабильности, поддержка Xevil и множество исправлений в стандартных парсерах

Изображение

Улучшения
  • Уменьшение потребления памяти и улучшение стабильности работы x64 версий
  • Добавлена поддержка 2captcha и Xevil в Изображение Util::ReCaptcha2
  • Добавлен Parse all results и Parse related to level для Изображение SE::Bing
  • В Изображение SE::Bing добавлена возможность задавать Safe Search, а также добавлен повтор запроса при получении кешированной "короткой" выдачи
  • В Изображение SE::Yandex::Translate, добавлен обход ограничения на кол-во символов в запросе, что позволяет переводить очень большие запросы (>10k символов)
  • В Изображение SE::Google::Modern добавлена возможность задать автоматическое определение языка интерфейса в зависимости от IP
  • Движок V8 обновлен до версии 6.4
Исправления в связи с изменениями в выдаче Исправления
  • Исправлена работа  SE::Bing:
    • устранена ситуация, когда выдавалась одинаковая выдача для всех страниц
    • исправлена работа параметра Links per page
    • исправлен парсинг количества результатов в некоторых ситуациях
    • исправлена ошибка, при которой не было результатов, если в выдаче одна ссылка
  • Исправлена работа с каптчей в  SE::Yandex::Wordstat
  • Исправлена ошибка, когда при запросе с опечаткой  SE::Google::Modern не забирал результаты с первой страницы
  • Исправлена ошибка в  Rank::MajesticSeo, при которой неправильно определялся бан IP
  • В  SE::Google::Trends исправлена работа при изменении формата результата по-умолчанию
  • В  SE::Google::Modern для Search from country изменен параметр: вместо cr теперь используется gl - это на данный момент позволяет более точно задавать регион
  • Исправлена проблема с чрезмерным потреблением памяти в JavaScript парсерах
  • Исправлена ошибка влияющая на стабильность работы на Linux и Windows
  • Исправлена ошибка в SE::Yandex, при которой не было результатов, если в выдаче одна ссылка
Команда A-Parser поздравляет всех с Новым годом и Рождеством! Спасибо что вы с нами!

#14 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 09 Январь 2018 - 14:36

Как известно, в A-Parser есть возможность создавать свои собственные парсеры, которые могут иметь практически любую логику и в то же время позволяют пользоваться всеми преимуществами А-Парсера. Для написания таких парсеров используется язык JavaScript. В нашей документации подробно описаны все функции и методы, которые можно использовать при написании парсеров. А в сегодняшнем сборнике мы на практических примерах покажем наиболее часто применяемые функции. Поехали!
Изображение
  • Получение результатов от стандартного парсера.
    В этой статье описано использование функции yield this.parser.request, которая позволяет работать с уже существующими парсерами, получать от них данные и дополнительно обрабатывать их.
  • Парсинг сайта с проходом по страницах.
    Здесь показан общий подход к созданию парсера, который будет "ходить" по страницам на сайте и забирать с них некоторую информацию.
  • Парсинг title и description для топ10 сайтов по запросу.
    В данном примере показано как написать собственный парсер, который объединит в себе две разных задачи: парсинг топ10 сайтов и парсинг данных из каждого полученного сайта. При этом также будет показана возможность реализации выбора между несколькими поисковиками, что делает такой парсер еще более универсальным.
  • Реализация подстановки запросов и их многопоточной обработки.
    Этот пример продемонстрирует, как "на лету" добавлять запросы с помощью tools.query.add, а также, как обрабатывать их в многопоточном режиме.
  • Работа с CAPTCHA.
    В этой статье на простом примере будет показан общий подход к работе с сайтами, на которых появляется каптча. Будет пошагово разобран алгоритм и продемонстрирован результат работы.
  • Работа с ReCaptcha2.
    А в этом примере по аналогии с обычной каптчей демонстрируется алгоритм работы с рекаптчей, а также вкратце поясняется принцип ее действия.
Для каждой статьи в конце будет продемонстрирован результат работы и дана ссылка на готовый парсер.

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей

#15 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 23 Январь 2018 - 18:28

1.2.78 - поддержка сессий в JS парсерах, улучшение SE::Google::Modern, правки в интерфейсе

Изображение

Улучшения
  • Добавлена поддержка сессий в JavaScript парсерах
  • В ИзображениеSE::Google::Modern добавлена поддержка сессий и улучшена производительность за счет уменьшения частоты появления каптч/рекаптч
  • Добавлена переменная $query.prev - показывает запрос, который использовался на предыдущем уровне
  • Для JS парсеров добавлен метод this.logger.putHTML, который позволяет вывести в лог HTML код
  • В Lite версию добавленИзображениеSE::Google::Modern и ИзображениеUtil::ReCaptcha2
  • В x86 версиях добавлено предложение перейти на x64
  • Добавлена возможность переименовывания пресетов
  • В окне выбора пресета для папок реализована "память на сворачивание"
  • Изменены иконки для JS парсеров
  • Исправлены ошибки с переводом в интерфейсе
  • Исправлено отображение HTML тегов в логах
  • Исправлен баг при импорте с вложенным парсером
  • Исправлен баг с прокруткой при сохранении JS парсеров и пресетов
  • Доработан Конструктор регулярных выражений
  • Другие мелкие правки в интерфейсе, направленные на улучшение общей работы
Исправления в связи с изменениями в выдаче

  • В  ИзображениеSE::Google::Modern  исправлен парсинг сниппетов и рекламы, а также мобильной выдачи
  • В ИзображениеSE::Google::Suggest исправлен парсинг подсказок, а также добавлена опция Remove HTML tags, позволяющая получать подсказки с или без html тегов
  • Исправлен парсинг анкоров и сниппетов в ИзображениеSE :: DuckDuckGo
  • ИзображениеSE::Ask, ИзображениеSE :: Dogpile, Изображение Rank::Mustat
Исправления

  • Исправлен баг с перемещением заданий в очереди
  • В SE::Google::Modern  исправлен баг с кодировкой
  • Исправлена работа параметров Request delay и Extra query string во всех JS парсерах
  • Исправлен выбор файлов запросов
  • Исправлено отображение иконок для JS парсеров


#16 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 02 Февраль 2018 - 13:29

Видео урок: Создание JS парсеров. Получение результатов от стандартного парсера

Это видео начинает цикл уроков по созданию JavaScript парсеров. Здесь рассказано о том, как начать писать собственные парсеры, используя функционал JS парсеров в А-Парсере.

Изображение

В уроке рассмотрено:
  • Создание кастомного JS парсера
  • Использование встроенного парсера внутри JS парсера
  • Парсинг выдачи поисковой системы с фильтрацией результатов по заданному условию
Полезные ссылки:
Статья и готовый парсер: https://a-parser.com/resources/254/

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

#17 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 13 Февраль 2018 - 11:59

Видео урок: Создание JS парсеров. Парсинг сайта с проходом по страницах

Второе видео в цикле уроков по созданию JavaScript парсеров. Здесь рассказано о том, как написать несложный парсер сайта, который будет "листать" страницы, используя функционал JS парсеров в А-Парсере.

Изображение

В уроке рассмотрено:
  • Создание кастомного JavaScript парсера без использования встроенных парсеров
  • Парсинг контента сайта постранично с использованием регулярных выражений
  • Реализация прохода по страницам ("пагинации") в JS парсере
Статья и готовый парсер: https://a-parser.com/resources/255/

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

#18 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 23 Февраль 2018 - 13:53

1.2.138 - поддержка Node.js модулей, обработка ReCaptcha2 во всех парсерах Google, парсер AliExpress

Изображение

В A-Parser 1.2.138 добавлена эмуляция node версии 8.9.x с поддержкой загрузки модулей и частичной реализацией fs и net модулей. Это дает возможность обращаться из JavaScript парсеров напрямую к файловой системе, а также использовать подключение по TCP из модулей к другим сервисам(например mysql, redis, chrome...).

Все это позволило загружать и использовать node модули из каталога npm, в котором собраны множество полезных библиотек для обработки данных, коннекторы к базам данных и множество других интересных вещей. На данный момент протестированы следующие модули: md5, async-redis, jsdom, puppeter.
Улучшения
  • Добавлена поддержка Node.js модулей в JavaScript парсерах
  • Изображение SE::Google:: Position, Изображение SE::Google::Compromised и Изображение SE::Google::TrustCheck полностью переписаны, добавлена поддержка ReCaptcha2
  • Улучшена работы Изображение SE::Google::Modern в целом
  • В Изображение SE::Youtube добавлен выбор языка, а также реализована возможность включать/отключать Безопасный режим
  • Добавлен Изображение Shop::AliExpress
  • Улучшена проверка создаваемых переменных в пресетах
  • Улучшена работа сессий
  • Исправлено отображение имени файла запроса на карточке задания
  • Улучшена работа скрола в Тестовом парсинге
  • Добавлено удаление переносов из сниппетов в Изображение SE::Google::Modern
  • Картинка каптчи в парсере Изображение SE::Yandex::Register теперь скачивается через прокси
  • Множество мелких улучшений в интерфейсе
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена работа Конструктора регулярных выражений
  • Исправлена работа с кодировками в парсерах переводчиков и JS парсерах
  • Исправлена работа  SE::Google:: Position
  • Исправлен выбор региона в SE::Yandex:: Direct
  • Исправлена работа опции Location в  SE::Google::Modern
  • Исправлена работа сессий в SE::Google::Modern при переопределенном домене
  • Исправлена ошибка при совместном использовании опций Перезаписи файла, Начального и Конечного текстов
  • Исправлено отображение вкладок в Тесте задания
  • Исправлено отображение списка пресетов в поле Запустить по завершению
  • Исправлена работа this.proxy.set в JS парсерах
  • Исправлена передача дополнительных параметров в JS парсерах
  • Исправлена ошибка, из-за которой через API нельзя было указать Начальный и Конечный тексты
  • Исправлен экспорт пресетов


#19 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 05 Март 2018 - 13:32

Использование Xevil совместно A-Parser для разгадывания ReCaptcha2

Изображение

Как известно, сейчас Google при парсинге очень часто выдает рекаптчу, что значительно усложняет и замедляет сбор данных.
В A-Parser есть возможность обходить данную проблему, разгадывая рекаптчу с помощью сторонних сервисов. Поддерживаются различные онлайн сервисы, а также программные решения.

Одним из таких решений есть XEvil. Его использование дает хороший прирост в скорости, а также значительно удешевляет парсинг, ведь здесь нету оплаты за количество разгаданных каптч/рекаптч, как в онлайн сервисах. Кроме этого, XEvil умеет разгадывать практически любые обычные каптчи (в виде картинки) и данная возможность также поддерживается в A-Parser.

Изображение

На данный момент использовать разгадывание рекаптчи с помощью XEvil можно в таких парсерах: В видео показано:
  • подключение Xevil к A-Parser для работы с ReCaptcha2
  • проверка работы и демонстрация работы в SE::Google::Modern
Ознакомиться более детально с возможностями XEvil можно по ссылкам: Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

#20 A-Parser Support

A-Parser Support

    Продвинутый пользователь

  • Пользователи
  • PipPipPip
  • 65 сообщений

Отправлено 15 Март 2018 - 11:02

Сборник рецептов #21: уведомления в Telegram из A-Parser, мультифильтр и парсинг IMDb

21-й сборник рецептов. В нем мы научимся отправлять сообщения в Telegram прямо из A-Parser, изучим работу с модулями Node.js в JS парсерах на примере решения задачи фильтрации по множеству признаков, а также спарсим весь IMDb. Поехали!

Уведомления в Telegram из A-Parser

Telegram является одним из самых популярных мессенджеров благодаря своей простоте, и в то же время большому функционалу. Среди прочего, в Телеграме можно создавать ботов, с помощью которых можно делать чаты более интерактивными. Взаимодействие с ботом на на стороне сервера происходит через Telegram Bot API. Используя эти возможности, можно легко и буквально за несколько минут настроить уведомления себе в Telegram прямо из парсера. О том, как это сделать, а также несколько реальных примеров - по ссылке выше.

Изображение
Изображение

Фильтрация по множеству признаков

Как известно, для фильтрации в А-Парсере используется встроенный функционал фильтров. Но бывают ситуации, когда список признаков, наличие которых нужно проверять, очень большой и его сложно вписать в строку стандартного фильтра.
Начиная с версии 1.2.127 в A-Parser добавлена поддержка модулей Node.js. Благодаря этому появилась возможность читать список признаков из файла и использовать его для проверки страниц. О том, как это сделать, а также готовый парсер с мультифильтром - по ссылке выше.

Изображение

Парсинг рекомендаций фильмов из IMDb

Пример решения задачи по сбору данных о фильмах и их рекомендаций на IMDb. Данная статья показывает, как можно решать задачи, которые на первый взгляд требуют много времени и ресурсов, буквально за несколько часов. Узнать о том, как спарсить весь IMDb за 1,5 часа, а также посмотреть пресет и забрать готовую базу можно по ссылке выше.

Изображение

Еще больше различных рецептов в нашем обновленном Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
Сборники статей:




Количество пользователей, читающих эту тему: 0

0 пользователей, 0 гостей, 0 анонимных