Наша команда достаточно часто работает по задачам парсинга веба, и сегодня кратко опишем, чем мы занимаемся по данному направлению.
1) Парсинг веб-сайтов.
Автоматическое извлечение данных любой направленности и представление их в удобной для заказчика форме.
2) Парсинг поисковых машин.
Автоматизация работы с поисковыми машинами, настройка сбора выборок по различным параметрам, ускорение рутинных процедур, фильтрация избыточной информации.
3) Написание прикладных БД для работы с полученной информацией.
Написание ПО для веба и десктопа, облегчающего работу с полученной информацией. У нас имеется опыт как использования готовых платформ для написание БД (в разы удешевляет конечный результат), так и написания ПО по индивидуальным запросам заказчика.
Мы используем многопоточные решения, применяем полный комплект доступных средств (запросы с ipv4, ipv6, TOR, luminati.io), возможно подключение сторонних сервисов распознавания каптчи (Антигейт), чаще всего данные представляются в БД (sqlite, mssql, mysql), либо пишем импорты в различные CMS (Wordpress, Webasyst).
Свяжитесь с нами:
jabber: slava@contactroot.com
skype: contactroot
icq: 657324100