Збір та парсинг інформації
4200 UAHПотрібно зпарсити та зібрати структуровану інформацію з сайтів українських і закордонних ВНЗ, коледжів та платформ онлайн-курсів (Abiturients, Mudra, Coursera, Udemy тощо) з подальшою підготовкою Excel-файлів за готовою структурою.
Обсяг:
Українські коледжі — ~650+ записів
Українські ВНЗ — ~350+ записів
Закордонні ВНЗ — всі з сайту-джерела
Онлайн-курси українською — ~9 000+ записів
Онлайн-курси іноземними мовами — ~26 000+ записів
Відгуки — мін. 180 000 записів
Термін виконання: 6 днів, із поетапною здачею.
Шукаємо спеціаліста з досвідом парсингу великих обсягів даних і підготовки валідних датасетів.
Відгук замовника про співпрацю з Лукою Грачовим
Збір та парсинг інформаціїНа жаль, не змогли закрити задачу у звʼязку з хворобою виконавця
-
310 2 1 Вітаю!
Мене звати Семен, я менеджер компанії Wanord. Ми спеціалізуємося на парсерах, зборі великих масивів даних та підготовці структурованих датасетів (Excel/CSV) під готове ТЗ.
📌 Що потрібно:
Зібрати та структуровано підготувати дані з сайтів українських і закордонних ВНЗ/коледжів та платформ онлайн-курсів (Abiturients, Mudra, Coursera, Udemy тощо) із формуванням Excel-файлів за заданою структурою. Обсяги — десятки тисяч записів + мінімум 180 000 відгуків, поетапна здача протягом 6 днів.
🔧 Що ми зробимо:
Проаналізуємо вашу цільову структуру Excel-файлів і узгодимо формат полів (типи, обов’язковість, кодування, мови).
…
Розробимо окремі парсери для:
українських коледжів (~650+);
українських ВНЗ (~350+);
закордонних ВНЗ (повний список із сайту-джерела);
онлайн-курсів (UA ~9 000+, іноземні ~26 000+);
відгуків (180 000+).
Реалізуємо стійкий збір даних з урахуванням лімітів/антибот-захисту (ротація IP, паузи, логування помилок).
Зробимо чистку та валідацію даних (дублікати, порожні поля, формат дат, кодування).
Підготуємо Excel-файли строго за вашою структурою + базову перевірку якості (spot-check, випадкова вибірка).
Здамо результат поетапно: спочатку частина ВНЗ/коледжів, далі онлайн-курси, потім блок відгуків.
💼 Досвід:
Є досвід парсингу великих обсягів (сотні тисяч+ рядків), побудови стабільних парсерів, що працюють під навантаженням, та підготовки датасетів для аналітики/ML. Приклади можемо надіслати у приватні.
💰 Орієнтовний бюджет: 1500–2300 $
⏱️ Термін: до 6 днів з поетапною здачею (за умови доступу до всіх джерел та фінально узгодженої структури файлів).
Готові взятися за проєкт і відразу перейти до уточнення структури Excel та плану етапів. Напишіть у лс — надішліть шаблон файлів і джерела, узгодимо фінальний бюджет і графік здачі.
-
316 1 0 Привіт!
Маю досвід розробки Python‑скриптів для збору даних. Готовий виконати цей проект.
Пишіть в особисті повідомлення.
-
1964 25 1 Привіт, займаюсь парсингом на постійній основі. Можу допомогти вам з вирішенням вашої задачі. НАпишіть мені в особисті, узгодимо деталі.
Мінімальна ціна за етап
-
852 51 0 1 Готовий до співпраці.
Точна ціна і терміни після більш детальної інформації.
-
201 1 1 Вітаю! Можу написати простого та надійного асинхронного парсера, щоб швидше працював. Дані можу писати куди вам зручно, але в результаті щоб виходив Excel-файл потрібної структури.
-
8971 367 0 Доброго дня
Зацікавив ваш проект.
Хотілося би обговорити все більш детально.
-
248 Добрий день!
Хочу уточнити, що 6 днів — це надто короткий термін для проекту такого масштабу та обсягу даних. З мого досвіду, завдання, пов’язані з парсингом великих обсягів інформації, потребують значно більше часу для якісної реалізації.
Маю великий досвід у браузерній автоматизації з використанням інструментів Selenium та Playwright. Створював складні парсери для різних платформ, включно з динамічними та захищеними сайтами. Наприклад, розробив складний парсер для THREADS (X), який працює з обфусцованим динамічним HTML. За допомогою комп’ютерного зору ми збирали дані про кількість підписників, лайків, коментарів, репостів і директів, аналізували віральність постів, акумулювали їх у базі та створювали аналітичний дашборд. У систему входило понад шість окремих скриптів, таких як автолайкінг, коментування і моніторинг персональних тем.
Також маю досвід побудови надійних пайплайнів для очищення та зберігання великих масивів інформації, а також інтеграції з API. Працюю з інструментами обходу обмежень і забезпечую стабільність та масштабованість рішень.
Якщо потрібна допомога з підготовкою валідних і структурованих датасетів і грамотним парсингом, готовий обговорити терміни та етапи роботи, щоб забезпечити якість результату.
…
З повагою