Напишіть парсер на Python для збору емілів
Потрібно написати парсер на python, який буде йти по списку випущених сайтів і збирати всі емаїли
Всі сайти є європейськими компаніями (структура сайтів відрізняється)
1 .Парсер повинен шукати дані в футере/хедере, також, увійти в розділ "Контакти"/"Про нас" і шукати там, оскільки часто в футере/хедере може бути не дані або там тільки пошта фірми, а не CEO та інших співробітників.2. копіювати потрібно тільки емаїли, інші контактні дані пропустити, але всі емаїли з усіх сторінок повинні бути зібрані
3 .Розташування контактних даних може бути як на головній сторінці, так і на окремому призначеному сторінці.ЧетвертийРозташування контактних даних може бути як в шапці сайту, в футері, так і в будь-якому іншому місці на сторінці.Партнер повинен працювати в багатопоточному режимі
Зібрані емаїли:
1. повинні бути структуровані (кожна електронна пошта повинна бути протилежним URL сайту і не повинна бути розкинута по різних колонках в таблиці, див.Скриншот «необхідний вигляд»)
2. не мати зайвої інформації (телефони, імена і прізвища, посади, частина коду сторінки)
3. видаляти дублікати
Вихід результатів
Вихід результатів повинен бути у вигляді CSV-файлу.
ІТОГ
Кінцевим продуктом є робочий парсер з початковим кодом і з документацією, в якому можна самостійно замінити посилання і щоб він виконував вищезазначені завдання.Додатково
До завдання прикріплені скриншоти того, як саме зібрані емаїли повинні виглядати і бути структуровані.А також приклад того, як еміли не повинні виглядати.
Додатки 2
-
Доброго дня! Дуже зацікавило Ваше замолвення, готовий взятися до роботи
Буду радий співпраці! -
3840 78 0 Раніше виконував подібний проект (ви можете побачити в моїх ранніх відгуках). Навпаки, я все написав на PHP, але я можу зробити і на Python. Чи можна завантажити список сайтів?
-
322 3 0 Привіт, зацікавлений ваш проект , у мене є великий досвід збирання даних, напишу скрипт на python, роблю швидко і якісно. Готовий почати прямо зараз
-
434 9 0 Доброго дня. Прошу прислати в приватні повідомлення декілька посилань на сайти зі списку.
-
194 Добрий день !
Full-stack розробник з досвідом роботи понад 6 років, Ваш проект дуже цікавий, маю необхідний досвід для його реалізації, пропоную такі технології Node.js + Vue.js. Давайте зробимо дзвінок для детальної обговорення завдання, поділимося своєю баченням і обговоримо співпрацю, напишіть
-
2762 58 0 Добрий день .
Я займаюся розробкою парсерів.
Чекаємо Вас у особистих повідомленнях для обговорення проекту.
Актуальні фриланс-проєкти в категорії Python
Розробка програмного забезпечення з ШІПотрібно розробити програмне забезпечення для автоматичного виявлення, захоплення та супроводження об'єкта за допомогою відеокамери та поворотного механізму.Вихідні дані: Відеокамера з оптикою. Поворотний пристрій по двох осях (азимут/кут місця). Сервоприводи з керуванням через… AI та машинне навчання, Python ∙ 18 годин 52 хвилини тому ∙ 12 ставок |
ТЗ НА ДОПРАЦЮВАННЯ AI-БОТА ГЕНЕРАЦІЇ ПЕРСОНАЛЬНИХ ПІСЕНЬТЗ НА ДОПРАЦЮВАННЯ AI-БОТА ГЕНЕРАЦІЇ ПЕРСОНАЛЬНИХ ПІСЕНЬГОЛОВНА ЦІЛЬ Створити стабільний преміальний продукт, який: генерує максимально якісні персональні пісні; не вигадує факти про клієнта; працює стабільно під навантаженням; легко масштабується; дозволяє аналізувати та… Python, Розробка ботів ∙ 19 годин 57 хвилин тому ∙ 30 ставок |
Автоматизація процесів через API та PythonНижче описав поточний процес і те, до якого результату хотілося б прийти. Також прикладаю файли реального процесу, щоб краще зрозуміти, як він виглядає в реальності Поточний процес Зараз весь процес виконується вручну: завантаження/вивантаження файлів, перенесення даних… AI та машинне навчання, Python ∙ 23 години 57 хвилин тому ∙ 42 ставки |
Потрібно створити бот в тг для оплати підписки.
2000 UAH
Потрібно створити бот в телеграмі де користувач зможе оформити підписку на доступ до веб камер котрі знгаходяться у дворі. Організувати в боті оплату двух видів підписок (на місяць і на один день). Бот повинен автоматично перевірити оплату і після видавати посилання-доступу Python, Розробка ботів ∙ 1 день 12 годин тому ∙ 78 ставок |
Бізнес-логіка платформи: підтвердження занять, контроль відвідуваності та історія уроків (DjangoДоопрацювання бізнес-логіки освітньої платформи: підтвердження занять, контроль відвідуваності та історія уроків (Django + React) Необхідно реалізувати повноцінну систему підтвердження уроків, контролю відвідуваності та зберігання історії підтверджень. Важливо Перед початком… Python ∙ 4 дні тому ∙ 30 ставок |