Напишіть парсер для збору даних за посиланнями.
Потрібно написати парсер, який пройде по списку випущених сайтів і зібрати контактну інформацію.1 .Всі сайти - це фінські компанії з одним і тим же видом діяльності.Структура сайтів і дизайн різні.Рівень захисту сайтів різноманітний
2 .Збирати всі контактні дані, які є.(Порядок і наявність даних може бути різноманітним, залежно від сайту.)- Назва відділу - якщо це можливо
Ім'я імені, якщо це можливо
- обов'язки - в разі можливості
Телефон - обов'язкові дані
Електронна пошта - обов'язкові дані
3 .Парсер повинен шукати дані в футере/хедере, також, увійти в розділ "Контакти"/"Про нас" і шукати там, оскільки часто в футере/хедере може бути не дані або там тільки пошта фірми, а не CEO і т.д.
Контактні дані
- Контактні дані - (тобто Назва відділу, Посада, Назва, Телефон, Електронна пошта)
Розташування контактних даних може бути як на головній сторінці, так і на окремому призначеному сторінці.Розташування контактних даних може бути як в шапці сайту, в футері, так і в будь-якому іншому місці на сторінці.На сайті може бути тільки один телефон і один електронний лист.Вихід результатів
Вихід результатів повинен бути у вигляді CSV-файлу.
Дані повинні бути структуровані (наприклад, номер телефону і пошти) повинні бути пов'язані один з одним, щоб було зрозуміло, який номер телефону належить якому пошті.У разі можливості дані повинні бути відфільтровані від надлишкових даних (дубликатів і нерелевантних даних)
ІТОГ
Кінцевим продуктом є робочий парсер з початковим кодом і з документацією, в якому можна самостійно замінити посилання і щоб він виконував вищезазначені завдання.Додатково
До завдання прикріплений файл з частиною посилань для прикладу, а також скриншоти того, які саме дані збирати на сайті, а також приклад того, як отримані дані приблизно повинні виглядати.
Додатки 5
-
Добрый день. Можно ссылки сайтов на которых нужно брать информацию?
-
Актуальні фриланс-проєкти в категорії Парсинг даних
Консультація по парсингу підписників Instagram-акаунтівДоброго дня. Необхідно провести попередню оцінку можливості виконання наступного завдання. У мене є список Instagram-акаунтів. Мета — отримати контактні дані (в першу чергу email-адреси) користувачів, які підписані на ці акаунти. Раніше мені зустрічалися компанії та сервіси, які… Парсинг даних ∙ 2 дні 7 годин тому ∙ 12 ставок |
Потрібен спеціаліст для пошуку контактів ЛПР по УкраїніНеобхідно зібрати базу (чи готова база) контактів осіб, які приймають рішення (ЛПР), у компаніях України. Збір інформації, Парсинг даних ∙ 2 дні 11 годин тому ∙ 16 ставок |
Потрібно спартити дані з LinkedinПотрібно спартити дані з Linkedin по нашому списку. Для кожного запису потрібно знайти та зібрати доступні дані якщо такі є на Linkedin профілі включаючи фотографію профілю на соц мережі Lihnkedin, email-адресу, посилання на соціальні мережі, вебсайт компанії, номер телефону.… Парсинг даних ∙ 2 дні 17 годин тому ∙ 27 ставок |
Парсинг та класифікація данихШукаємо розробника для реалізації системи збору та структурування даних з відкритих джерел. Маємо базу власників малого бізнесу в США, яка містить ім’я людини, назву компанії, адресу та штат. Необхідно побудувати процес збагачення цих записів додатковою інформацією з публічно… Веб-програмування, Парсинг даних ∙ 2 дні 18 годин тому ∙ 41 ставка |
Svitlahata
750 UAH
Потрібно імпортувати 1819 товарів із XML/YML-фіду Prom.ua до OpenCart 3. Є готовий XML-файл, який містить назви товарів, описи, ціни, фотографії, характеристики, виробників та категорії. Необхідно: імпортувати всі товари до OpenCart 3; створити та прив’язати категорії;… CMS, Парсинг даних ∙ 3 дні 21 година тому ∙ 34 ставки |