Парсер яндекскарт.

Лучшие региональные справочники организаций были тщательно отобраны командой Яндекса, и данные из них отображаются на Яндекс-картах. Кроме того, многомиллионная аудитория Яндекса имеет возможность самостоятельно добавлять и актуализировать информацию о компаниях. Такое сочетание готовых справочников и пользовательских данных составляет серьезную конкуренцию ДубльГИСу (программа для которого здесь).

Преимущества справочника организаций Яндекса — более широкий охват территорий, большее количество телефонов, более высокая скорость сбора контактов (влияет и мощность серверов Яндекса, и особенности организации справочника).

Менее объемный рубрикатор (по сравнению с 2GIS) во многих случаях является преимуществом. Кроме краткого рубрикатора, есть и полный, на более чем 1000 рубрик.

Актуальность данных в 2GIS обеспечивается обзвоном организаций сотрудниками ДубльГис, в то время как актуальность справочника организаций Яндекс-Карт обеспечивается множественными поставщиками данных и пользователями Яндекса. Тот или иной подход в разных случаях может быть более полезным, однозначного победителя здесь нет.

Для работы с найденными контактами организаций вы можете делать так: зайти на сайт Яндекс-Карт, открыть справочник организаций, и последовательно открывать одну компанию за другой, выбирать подходящие, копировать их название и контактные данные в Excel, а затем уже делать свои пометки: «не дозвонился», «отправил предложение на email» и т.д. Это копирование с сайта в таблицу Excel занимает огромное количество времени!

Мы предлагаем вам другой подход: использовать программу — парсер организаций Яндекс-Карт, которая самостоятельно скопирует информацию об интересующих вас компаниях с сайта в Excel, и сэкономит ваши силы и время. Вы получите готовый к обработке список компаний, в котором можно делать примечания, отфильтровывать неинтересные компании и т.д.

Мы развиваем этот парсер с 2013 года! Доказательство (снимок страницы за 21.03.2013)

Программа-парсер Яндекс-Карт по сбору данных об организациях будет полезна:
— менеджерам по продажам для поиска покупателей
— менеджерам по закупкам для поиска поставщиков
— маркетологам для изучения рынка
— руководителям компаний для поиска партнеров и клиентов

Предлагаемая нами программа-парсер организаций Яндекс-карт позволяет собирать следующую информацию:

Название организации
Рубрики/Отрасли/Категории организации
Индекс/Страна/Регион/Район/Город/Улица/Дом в отдельных колонках
Полный адрес
Телефоны мобильные — для sms/Viber/WhatsApp-рассылки
Телефоны остальные — для холодных звонков
Факс
Сайт
Email с сайта компании(программа многопоточно просканирует сайт компании на заданную пользователем глубину)
ИНН с сайта компании
График работы
Геоданные (координаты): широта и долгота
ID и название филиальной сети
Услуги(атрибуты) организации
Ссылки на социальные сети (Facebook/Twitter/Instagram/Vkontakte/Youtube/Google+/Одноклассники)
Ссылка на карточку компании на Яндекс-картах
Все сайты и все телефоны в отдельных ячейках.
Дополнительные данные — сделаем индивидуальную настройку выгрузки по запросу!
Обратите внимание, парсер отзывов и фотографий — здесь.

Программа позволяет задать нужный участок на карте, одну или несколько категорий, и собрать все соответствующие данные нажатием одной кнопки. Например, можно отметить рубрику «парикмахерские», выбрать нужный регион, и собрать все парикмахерские из заданной области одной кнопкой!

Программа умеет работать с сервисом автоматического распознавания капчи для разгадки выдаваемых Яндексом картинок. Вам необходимо иметь аккаунт в этом сервисе для пользования парсером. Минимального баланса в 1$ обычно хватает на несколько месяцев использования антикапчи.

Парсер Яндекс.Карт умеет работать через прокси! Если в вашей корпоративной сети в настройках браузера нужно указывать какой-то прокси (нет прямого выхода в интернет) — программа сможет работать и у вас. Если ваш IP-адрес заблокируют, вы сможете с помощью прокси обойти блокировку. Для включения работы через прокси запишите параметры прокси в формате login:passwordip:port в файл proxy.txt в папке программы. Запустите выгрузку, программа напишет в окне логов, что начала использовать прокси.

После завершения работы программы файл с результатами автоматически открывается в Excel (если установлен MS Office) или Calc (если установлен OpenOffice). Файл имеет имя вида data***.csv. Результатом сбора являются такие файлы: пример файла с информацией о компаниях на Яндекс-Картах, выгруженной парсером.

Файл Excel с данными, собранными с Яндекс-Карт

Данные, собираемые программой, становятся доступны еще до завершения работы программы: сразу после скачивания информации об очередной организации данные записываются в файл выгрузки в папке программы.

От запуска сбора по нужным рубрикам до получения первых десятков контактов организаций — считанные секунды!

Программа-парсер умеет синхронизировать список рубрик с сайтом Яндекс-Карт. Это означает, что программа не только умеет работать со всеми категориями рубрикатора, но и при появлении новых рубрик программа будет способна работать с новыми рубриками без необходимости обновления!

В отличие от парсера 2гис, список городов в парсере Яндекс-карт отсутствует (можно сказать, что он бесконечен) — вы можете выбрать любую область карты, которая вам нужна, и собрать данные с любого количества городов! Если заданная вами область будет слишком велика, программа автоматически разобьет её на несколько более мелких — настолько мелких, чтобы можно было собрать все организации.

Если не использовать разбиение области, собрать все организации невозможно.
Возьмем, к примеру, школы танцев Петербурга. Сайт обещает нам 1144 организации в рубрике:

Обещанное количество школ танцев Петербурга

Если зайти в рубрику и прокрутить список до конца (до появления надписи «добавьте организацию, если не нашли их»), окажется что в списке — только менее половины от обещеннаго количества. Можно скопировать список куда-то для подсчёта количества, а можно посмотреть в запросах браузера к сайту: после загрузки 500 организаций были запрошены следующие 25, и на этом загрузка списка закончилась:

Фактически показанное количество школ танцев Петербурга — менее половины

Поэтому, для полной выгрузки всех данных, наш парсер по уникальному алгоритму дробит карты на мелкие, и собирает максимально полные списки организаций!

Однако, полностью доверять обещанному Яндекс-картами количеству не стоит, он может несколько завышать обещания по количеству организаций. К примеру, откроем Волоколамск и введём в поиск «Автошкола». Сайт обещает нам 3 организации:

Обещанное количество Автошкол Волоколамска — три

Если кликнуть по стрелочке, то окажется на самом деле, что автошкол всего две:

Фактически показанное количество Автошкол Волоколамска — две

Наш парсер выгружает все организации, которые фактически показывают Яндекс-карты.

Программа умеет приостанавливать свою работу, и продолжать её. Паузу можно включать вручную, а если отключится интернет — программа поставит себя на паузу автоматически. Если во время сбора на сайте возникнет ошибка, и программа не сможет получить данные — она поставит себя на паузу на некоторое время, затем автоматически проснется и сделает еще несколько попыток получить те же данные.

Два индикатора показывают ход выполнения работы. Синий показывает прогресс по рубрикам, зеленый индикатор показывает прогресс сбора данных текущего этапа работы.

Парсер яндекс-карт умеет работать в режиме получения списка новых организаций в базе. При запуске сбора парсер ищет файл skip.txt в своей папке, и загружает оттуда список ID организаций, которые не нужно загружать. Если Вы собрали какую-то рубрику некоторое время назад, возьмите из старого файла результатов первую колонку с числовыми ID организаций, и поместите этот список в файл skip.txt в папке программы. Запустите сбор той же рубрики, парсер пропустит все старые организации, и на выходе вы получите список только новых организаций заданной рубрики.

Скриншот программы для парсинга Яндекс-карт:


Скачать демо-версию парсера Яндекс-КартЧто вы получаете, покупая у нас программу:

Богатый функционал для любых бизнес-задач
Возможность выгрузки по заданной ссылке на карту любого масштаба — по ссылке может быть три дома, а может вся страна
Возможность выгрузки по заданному списку ссылок в файле — например, там могут быть 37 ссылок на города присутствия Вашей компании
Список готовых ссылок на разные города и регионы — в комплекте с программой
Возможность выгрузки по произвольному списку запросов / ключевых слов
Возможность выгрузки по полному списку рубрик, упорядоченному по алфавиту
Возможность выгрузки по дереву рубрик, структурированному по тематикам
Запоминание отмеченных городов и рубрик при выходе из программы, и восстановление их при запуске. Запускайте несколько копий программы с разными профилями выгрузки из разных папок, в том числе одновременно!
Корректная обработка ошибок Яндекс-карт — программа поставит себя на паузу, пока на сайте идут работы, чтобы не пропустить ни одной компании
Корректная обработка ошибок подключения к сети — программа поставит себя на паузу, пока вы везете ноутбук из офиса домой, и продолжит сбор после приезда домой
Поддержка работы через прокси-сервер для адаптации к инфраструктуре вашей компании или для обхода блокировки
Корректная обработка ошибок подключения к сети — программа поставит себя на паузу, пока вы везете ноутбук из офиса домой
Возможность автоматического сбора ИНН с сайтов компаний
Возможность сбора адресов электронной почты email с сайтов компаний, в том числе с защищенных
Возможность задавать количество страниц, сканируемых на сайтах компаний, и менять это количество «на лету» в процессе сбора
Многопоточное сканирование сайтов компаний: до 50 параллельных потоков
Программа при сканировании сайтов компаний умеет находить скрытые адреса электронной почты (например такие: office[at]mail, officemail[DOT]ru, office[собака]mail и другие подобные хитрости)
Визуальная индикация прогресса сбора с помощью разноцветных индикаторов
Возможность пропускать ненужные/старые компании с помощью функции skip
Программа автоматически задает имя файла с новой выгрузкой, не нужно искать куда и с каким именем сохранить, чтобы не потерять
Программа автоматически открывает файл выгрузки после завершения сбора — невозможно не заметить
Возможность сразу пользоваться собираемыми данными, еще до завершения полного сбора
Прозрачный, интуитивно понятный интерфейс
Надежная работа с любым качеством Интернет-соединения
Высокое качество продукта — гарантия отсутствия глюков/перезагрузок/и т.д.
Возможность оплаты через расчетный счет с закрывающими бухгалтерскими документами
Оперативная бесплатная техподдержка от профессиональных разработчиков
Бесплатные обновления программы — на год, или навсегда, без ограничения срока!

Комплект бонусов (при выборе опции с бонусами) — бесплатно!
БОНУС! Программа для отбора новых компаний в базе Яндекс-карт стоимостью 3.500Р — бесплатно!

БОНУС! Программа для склеивания нескольких баз в одну (например, для склеивания баз Абакана, Архангельска и Астрахани в одну базу «А») стоимостью 2.000Р — бесплатно!

БОНУС! Скидки на другие наши программы для сбора контактов — до 3.750Р!

БОНУС! Секретный бонус! Какой? — узнаете после покупки!

Стоимость парсера Яндекс-карт сегодня: 7.500Р от 1000 до 5900 рублей в зависимости от выбранных опций!)


Нажмите кнопку покупки, оформите заказ на защищённом сервере OnWiz, оплатите заказ в автоматическом режиме, и Вам будет автоматически выслана лицензия. Всего 1 минута отделяет Вас от возможности делать выгрузки!

Выберите подходящий вариант ниженет необходимости переплачивать за ненужные опции!
Парсер без указанных выше бонусов

1 неделя за 1000р
3 месяца за 2900р
6 месяцев за 3900р
12 месяцев за 5400р


Парсер с КОМПЛЕКТОМ БОНУСОВ, перечисленных выше

1 год за 6400р Вечная лицензия за 9900р

Те, кто покупает парсер организаций Яндекс-карт, чаще всего покупают и программу для карт ДубльГИС. Узнайте подробности о ней здесь: soksaitov/2gis-parser/

Хотите заказать подобную программу для другого сайта — закажите у нас создание парсера.

Заказать разработку парсера!

Нужен парсинг данных?

Собираем открытые данные с любых веб-сайтов: цены, названия, артикулы, описания, свойства, категории, фото, отзывы, ссылки, тел.номера, e-mail и многое другое.

Написать
img