Парсер, чтоб я сам мог собирать данные
33 USDДобрый день!
Есть сайт тендерных закупок: https://smarttender.biz
Необходимо периодически парсить базу проведенных тендеров, но доступ к базе только для зарегистрированных пользователей. Запросы нужно отправлять через случайное время, например от 5 до 15 секунд, чтоб капчи не появлялись. Данные сохранять в эксель в два файла (база тендеров и база номенклатуры). И чтоб парсер я запускал сам со своего ПК на виндовсе. Мне писали как то для другой подобной задаче на питоне, вроде все работало нормально. Как получаем данные:
ФАЙЛ 1: база тендеров
1. В личном кабинете есть вот такой перечень с выбранными фильтрами. Фильтра сам ставить буду.Ваша задача парсить данные - выбранные по фильтрам. В ссылке прописываются выбранные фильтры, поэтому указывая ссылку в парсере можно получить правильный массив. Результаты отражаются по странично, т.е. по 20 позиций, т.е. парсер должен и по страницах ходить.
2. Сохраняем данные в одну строку по таким столбцам:
- номер (4339356)
- название лота (препарати для анестезії)
- квалификация (ДК 021:2015: 33600000-6Фармацевтична продукція )
- бюджет закупки (48000), т.е. одной цифрой
- № у ЦБД (UA-2019-08-07-000222-c )
-. организатор (Покровська центральна районна лікарня )
- адреса (85300, Україна, Донецька обл., Покровськ, вул.Руднєва, 73) - при "разворачивании" видно
- категория (33600000-6 Фармацевтична продукція)
- форма торгов (Допорогові закупівлі )
- статус торгов (Завершено )
- опубликовано (07.08.2019)
- Прийом пропозицій (09.08.2019 12:00)
- Аукціон (12.08.2019 12:36)
- Контактна особа від підприємства (Гулих Олександра Геннадіївна) - при "разворачивании" видно
- Телефон (+хххххххххх) - при "разворачивании" видно
- e-mail (ххххххххххххххх) - при "разворачивании" видно
- мультилот (да / нет) - в некоторых тендерах присваивается такой значек
Т.е. на примере вот этой позиции:
А при клике на серый фон разворачивается вот так:
ФАЙЛ 2: база номенклатуры
1. получаем данные проваливая в каждую позицию из массива, который собираем для файла 1. Вот так выглядит страница для сбора данных (рамками пометил какие данные собирать):
2. Сохраняем данные в одну строку по таким столбцам:
- Закупівля № (4339356) - дублируем на все строки номенклатуры
- название лота (препарати для анестезії) - дублируем на все строки номенклатуры
- статус (Завершено) - дублируем на все строки номенклатуры
- Організатор (Комунальне неприбуткове підприємство "Покровська клінічна лікарня інтенсивного лікування" Покровської міської ради Донецької області) - дублируем на все строки номенклатуры
- Код ЄДРПОУ (01990884) - дублируем на все строки номенклатуры
- Адреса (85300, Україна, Донецька обл., Покровськ (Красноармійськ), вул. Руднєва, 73) - дублируем на все строки номенклатуры
- Форма проведення закупівлі (Допорогові закупівлі) - дублируем на все строки номенклатуры
- Категорія (33600000-6 Фармацевтична продукція) - дублируем на все строки номенклатуры
- бюджет (48 000,00) - дублируем на все строки номенклатуры
- Номенклатура_назва (Дитилін, 20мг/мл, ампула №10 Код ДК021: 33600000-6 Фармацевтична продукція)
- Номенклатура_кiлькисть (100 Упаковка )
- ПІБ (Гулих Олександра Геннадіївна)- дублируем на все строки номенклатуры
- Телефон (380хххххххх) - дублируем на все строки номенклатуры
- Email (alххххххххх)- дублируем на все строки номенклатуры
ВАЖНО! Есть такие позиции как МУЛЬТИЛОТ, они помечаются вот так:
В таких позициях при проваливании сразу нет возможности увидеть номенклатуру для формирования файла 2. Там нужно провалится и потом в блоке "номенклатура" провалится в каждый лот и там собрать данные все в один общий файл 2. Вот так:
Страница отдельного лота не отличается от описанное выше
Client's review of cooperation with Mykola Dudych
Парсер, чтоб я сам мог собирать данныеНиколай внимательный к деталям и перепроверяет свою работу, рекомендую!
![]()
Freelancer's review of cooperation with client
Парсер, чтоб я сам мог собирать данныеХороший клієнт, буду радий працювати для нього в майбутньому.
Current freelance projects in the category Data Parsing
Parsing the YouControl website (Yukontrol)
27 USD
It is necessary to scrape companies from certain categories on the Yukontrol website, including 1) name 2) EDRPOU 3) manager 4) phone All this data is open. Data Parsing ∙ 12 hours 43 minutes back ∙ 21 proposals |
Create a dashboard in https://airtable.com/ for the performance of advertising creatives from Facebook ads.Full specification https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Databases & SQL, Data Parsing ∙ 4 days 15 hours back ∙ 19 proposals |
Creation of an Excel file for uploading products to the websites of other partners.I am interested in creating an Excel table with all parameters. Here is the website - https://heiztechnik.com.ua/ And the positions I am interested in to be transferred: Manual boilers: 1) TIS UNI 15-95 kW (10) pcs 2)TIS HARD 150-500 kW (7) pcs Pellet boilers: 1)TIS PELLET… Data Parsing ∙ 4 days 19 hours back ∙ 36 proposals |
A developer is required for parsing the catalog and automating data import.Detailed technical specifications in the attached document Please indicate the estimated cost and timeline in your response Do you have experience working with parsing large catalogs What possible difficulties or limitations do you see in this task Databases & SQL, Data Parsing ∙ 4 days 22 hours back ∙ 41 proposals |
Find a product feed (Google Merchant XML) for a website on OpenCart
16 USD
It is necessary to find a direct link to the active product feed (XML) of a competitor for Google Merchant Center Platform (CMS): OpenCart / ocStore Find the original feedRequirements for the result: Working link to the XML file Python, Data Parsing ∙ 5 days 3 hours back ∙ 27 proposals |

