Парсер, чтоб я сам мог собирать данные
124 PLNДобрый день!
Есть сайт тендерных закупок: https://smarttender.biz
Необходимо периодически парсить базу проведенных тендеров, но доступ к базе только для зарегистрированных пользователей. Запросы нужно отправлять через случайное время, например от 5 до 15 секунд, чтоб капчи не появлялись. Данные сохранять в эксель в два файла (база тендеров и база номенклатуры). И чтоб парсер я запускал сам со своего ПК на виндовсе. Мне писали как то для другой подобной задаче на питоне, вроде все работало нормально. Как получаем данные:
ФАЙЛ 1: база тендеров
1. В личном кабинете есть вот такой перечень с выбранными фильтрами. Фильтра сам ставить буду.Ваша задача парсить данные - выбранные по фильтрам. В ссылке прописываются выбранные фильтры, поэтому указывая ссылку в парсере можно получить правильный массив. Результаты отражаются по странично, т.е. по 20 позиций, т.е. парсер должен и по страницах ходить.
2. Сохраняем данные в одну строку по таким столбцам:
- номер (4339356)
- название лота (препарати для анестезії)
- квалификация (ДК 021:2015: 33600000-6Фармацевтична продукція )
- бюджет закупки (48000), т.е. одной цифрой
- № у ЦБД (UA-2019-08-07-000222-c )
-. организатор (Покровська центральна районна лікарня )
- адреса (85300, Україна, Донецька обл., Покровськ, вул.Руднєва, 73) - при "разворачивании" видно
- категория (33600000-6 Фармацевтична продукція)
- форма торгов (Допорогові закупівлі )
- статус торгов (Завершено )
- опубликовано (07.08.2019)
- Прийом пропозицій (09.08.2019 12:00)
- Аукціон (12.08.2019 12:36)
- Контактна особа від підприємства (Гулих Олександра Геннадіївна) - при "разворачивании" видно
- Телефон (+хххххххххх) - при "разворачивании" видно
- e-mail (ххххххххххххххх) - при "разворачивании" видно
- мультилот (да / нет) - в некоторых тендерах присваивается такой значек
Т.е. на примере вот этой позиции:
А при клике на серый фон разворачивается вот так:
ФАЙЛ 2: база номенклатуры
1. получаем данные проваливая в каждую позицию из массива, который собираем для файла 1. Вот так выглядит страница для сбора данных (рамками пометил какие данные собирать):
2. Сохраняем данные в одну строку по таким столбцам:
- Закупівля № (4339356) - дублируем на все строки номенклатуры
- название лота (препарати для анестезії) - дублируем на все строки номенклатуры
- статус (Завершено) - дублируем на все строки номенклатуры
- Організатор (Комунальне неприбуткове підприємство "Покровська клінічна лікарня інтенсивного лікування" Покровської міської ради Донецької області) - дублируем на все строки номенклатуры
- Код ЄДРПОУ (01990884) - дублируем на все строки номенклатуры
- Адреса (85300, Україна, Донецька обл., Покровськ (Красноармійськ), вул. Руднєва, 73) - дублируем на все строки номенклатуры
- Форма проведення закупівлі (Допорогові закупівлі) - дублируем на все строки номенклатуры
- Категорія (33600000-6 Фармацевтична продукція) - дублируем на все строки номенклатуры
- бюджет (48 000,00) - дублируем на все строки номенклатуры
- Номенклатура_назва (Дитилін, 20мг/мл, ампула №10 Код ДК021: 33600000-6 Фармацевтична продукція)
- Номенклатура_кiлькисть (100 Упаковка )
- ПІБ (Гулих Олександра Геннадіївна)- дублируем на все строки номенклатуры
- Телефон (380хххххххх) - дублируем на все строки номенклатуры
- Email (alххххххххх)- дублируем на все строки номенклатуры
ВАЖНО! Есть такие позиции как МУЛЬТИЛОТ, они помечаются вот так:
В таких позициях при проваливании сразу нет возможности увидеть номенклатуру для формирования файла 2. Там нужно провалится и потом в блоке "номенклатура" провалится в каждый лот и там собрать данные все в один общий файл 2. Вот так:
Страница отдельного лота не отличается от описанное выше
Opinia zleceniodawcy o współpracy z Mykola Dudych
Парсер, чтоб я сам мог собирать данныеНиколай внимательный к деталям и перепроверяет свою работу, рекомендую!
![]()
Opinia freelancera o współpracy z ze zleceniodawcą
Парсер, чтоб я сам мог собирать данныеХороший клієнт, буду радий працювати для нього в майбутньому.
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Baza stron na woocommercePotrzebna jest baza ukraińskich stron internetowych sklepów internetowych na woocommerce z kontaktami, które są podane na stronach. Tylko działające strony (wskaźnik: aktualizacja katalogu/treści, działająca domena) Format tabeli - adres strony, numer telefonu, e-mail. Parsowanie danych ∙ 1 dzień 9 godzin temu ∙ 20 ofert |
Stworzyć dashboard w https://airtable.com/ dotyczący efektywności reklamowych kreacji z facebook adsPełnoprawne TZ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Bazy danych i SQL, Parsowanie danych ∙ 3 dni temu ∙ 17 ofert |
Stworzenie pliku Exel do załadowania towarów na strony innych partnerów.Interesuje mnie, aby stworzyć tabelę Excel ze wszystkimi parametrami. Oto strona - https://heiztechnik.com.ua/ A pozycje, które mnie interesują, powinny być przeniesione: Kotły ręczne: 1) TIS UNI 15-95 kW (10) szt 2)TIS HARD 150-500 kW (7) szt Kotły na pelety: 1)TIS PELLET… Parsowanie danych ∙ 3 dni 4 godziny temu ∙ 34 oferty |
Wymagany programista do parsowania katalogu i automatyzacji importu danychSzczegółowe TZ w załączonym dokumencie proszę w odpowiedzi podać orientacyjną cenę i terminy realizacji czy masz doświadczenie w parsowaniu dużych katalogów jakie możliwe trudności lub ograniczenia widzisz w tym zadaniu Bazy danych i SQL, Parsowanie danych ∙ 3 dni 7 godzin temu ∙ 40 ofert |
Znaleźć feed produktowy (Google Merchant XML) dla strony na OpenCart
58 PLN
Konieczne jest znalezienie bezpośredniego linku do działającego pliku z danymi produktowymi (XML) konkurenta dla Google Merchant Center Platforma (CMS): OpenCart / ocStore Znajdź oryginalny plik z danymiWymagania dotyczące wyniku: Roboczy link do pliku XML Python, Parsowanie danych ∙ 3 dni 12 godzin temu ∙ 24 oferty |

