Написать парсер на python для сбора емейлов
2000 UAHЗАДАЧА
Нужно написать парсер на python, который будет проходить по списку выданных сайтов и собирать все емейлы
Все сайты это европейские компании (структура сайтов отличается)
1. Парсер должен искать данные в футере/хедере, также, заходить в раздел "контакты"/"о нас" и искать там, так как зачастую в футере/хедере может не быть данных или там только почта фирмы, а не CEO и других сотрудников.
2. cобирать надо только емейлы, другие контактные данные пропускать, но все емейлы со всех страниц должны быть собраны
3. Расположение контактных данных могут быть как на главной странице так и на отдельной предназначенной странице.
4. Расположение контактных данных может быть как в шапке сайта, в футере, так и в любом другом месте на странице.
5. парсер должен работать в многопоточном режиме
Собранные емейлы:
1. должны быть структурированы (каждый емейл должен быть напротив соответствующего url сайта и не должен быть разбросан по разным столбцам в таблице, см. скриншот "нужный вид")
2. не иметь лишнюю информацию (телефоны, имена и фамилии, должности, часть кода страницы)
3. удалить дубликаты
ВЫВОД РЕЗУЛЬТАТОВ
Вывод результатов должен быть в виде CSV файла
ИТОГ
Конечным продуктом является рабочий парсер с исходным кодом и с документацией, в котором можно самостоятельно заменять ссылки и чтобы он выполнял вышеуказанные задачи.
ДОПОЛНИТЕЛЬНО
К заданию прикреплены скриншоты того, как именно собранные емейлы должны выглядеть и быть структурированы. А также пример того, как емейлы не должны выглядеть.
Приложения 2
-
Доброго дня! Очень заинтересован Ваш запрос, готов к работе
-
3840 78 0 Ранее выполнял подобный проект (можете посмотреть в моих ранних отзывах). Правда писал все на PHP, но могу сделать и на Python. Можете скинуть список сайтов?
-
322 3 0 Здравствуйте, заинтересовал ваш проект , имею большой опыт по сбору данных, напишу скрипт на python, сделаю быстро и качественно. Готов начать прямо сейчас
-
434 9 0 Доброго дня . Пожалуйста, отправьте в частное сообщение несколько ссылок на сайты из списка.
-
194 Добрый день!
Full-stack разработчик с опытом работы более 6 лет, Ваш проект очень интересен, имею необходимый опыт для его реализации, предлагаю такие технологии Node.js + Vue.js. Давайте сделаем звонок для детального обсуждения задачи, поделюсь своим видением и обсудим сотрудничество, пишите
-
2680 58 0 Добрый день.
Занимаюсь разработкой парсеров.
Жду Вас в личных сообщениях для обсуждения проекта.
Актуальные фриланс-проекты в категории Python
Создание Тик-ток фермы с генерацией дохода
27 000 UAH
в поиске человека, который может написать софт, для фермы тик ток, чтобы мы смогли генерировать трафик, получать доход. Ищем готовое решение с полным циклом. Python, Разработка ботов ∙ 23 часа 6 минут назад ∙ 15 ставок |
AI Commenting Platform для TikTok и Instagram.Цель проекта Разработать систему, которая позволяет управлять большим количеством аккаунтов TikTok и Instagram и автоматически публиковать релевантные комментарии под выбранными видео с использованием ИИ. Основной функционал1. Управление аккаунтами Необходимо реализовать… AI и машинное обучение, Python ∙ 2 дня 6 часов назад ∙ 22 ставки |
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 4 дня назад ∙ 43 ставки |
ИТ Автоматизация ведения VAT-отчетности
10 000 UAH
Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную… AI и машинное обучение, Python ∙ 4 дня 6 часов назад ∙ 51 ставка |
Инструмент сверки счетов с банком, картами и бухгалтеромТехническое задание: инструмент сверки счетов с банком, картами и бухгалтеромОбщая цель Нужен локальный инструмент (скрипт/небольшое приложение на Python), который запускается вручную раз в 1-2 месяца на моём компьютере и делает сверку между: Счетами, которые я выставил клиентам… Python, Десктопные приложения ∙ 4 дня 18 часов назад ∙ 43 ставки |