Написать парсер для сбора данных по ссылкам.
1470 UAHЗАДАЧА
Нужно написать парсер, который будет проходить по списку выданных сайтов и собирать контактную информацию.
1. Все сайты это финские компании с одним и тем же видом деятельности.
- Структура сайтов и дизайн разные.
- Степень защиты сайтов разная
2. Собирать надо все контактные данные, которые имеются.
(Порядок и наличие данных может быть разным, в зависимости от сайта.)
- Название отдела - по возможности
- Имя Фамилия - по возможности
- Должность - по возможности
- Телефон - обязательные данные
- Email - обязательные данные
3. Парсер должен искать данные в футере/хедере, также, заходить в раздел "контакты"/"о нас" и искать там, так как зачастую в футере/хедере может не быть данных или там только почта фирмы, а не CEO и т.д
КОНТАКТНЫЕ ДАННЫЕ
- Контактные данные - (то есть Название отдела, Должность, Имя Фамилия, телефон, email)
- Расположение контактных данных могут быть как на главной странице так и на отдельной предназначенной странице.
- Расположение контактных данных может быть как в шапке сайта, в футере, так и в любом другом месте на странице.
- На сайте может быть только один телефон и один email.
ВЫВОД РЕЗУЛЬТАТОВ
Вывод результатов должен быть в виде CSV файла
Данные должны быть структурированы (например номер телефона и почта) должны быть связаны друг с другом, чтобы было понятно, какой номер телефона принадлежит какой почте.
По возможности данные должны быть отфильтрованы от лишних данных (дубликатов и нерелевантных данных)
ИТОГ
Конечным продуктом является рабочий парсер с исходным кодом и с документацией, в котором можно самостоятельно заменять ссылки и чтобы он выполнял вышеуказанные задачи.
ДОПОЛНИТЕЛЬНО
К заданию прикреплен файл с частью ссылок для примера, а также скриншоты того какие именно данные собирать на сайте, а также пример того как полученные данные приблизительно должны выглядеть.
Приложения 5
-
Добрый день. Можно ссылки сайтов на которых нужно брать информацию?
-
Актуальные фриланс-проекты в категории Парсинг данных
Свитлагата
750 UAH
Необходимо импортировать 1819 товаров из XML/YML-фида Prom.ua в OpenCart 3. Есть готовый XML-файл, который содержит названия товаров, описания, цены, фотографии, характеристики, производителей и категории. Необходимо: импортировать все товары в OpenCart 3; создать и… CMS, Парсинг данных ∙ 4 часа 57 минут назад ∙ 22 ставки |
Парсинг данных через мобильное APIИщу человека с опытом парсинга данных через мобильное API, для парсинга e-commerce, rozetka и аналоги Задачи: 1. Перехват трафика мобильного приложения (Android) настройка прокси, анализ запросов 2. Определение нужных API endpoints куда идут запросы, какие headers… Python, Парсинг данных ∙ 1 день 23 часа назад ∙ 29 ставок |
Ищу программиста или вайб кодинг Автоматизация scraping данных 2https://drive.google.com/file/d/14tP5XWJB9acV4gn_cJrFwMpihUj3EbQz/view?usp=sharing я нечаянно на ту ссылку послал Веб-программирование, Парсинг данных ∙ 2 дня 2 часа назад ∙ 38 ставок |
Создать дашборд в https://airtable.com/ по результативности рекламных креативов из facebook adsПолноценное ТЗ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Базы данных и SQL, Парсинг данных ∙ 6 дней 20 часов назад ∙ 20 ставок |
Создание файла Exel для загрузки товаров на сайты других партнеров.Меня интересует, чтобы сделать таблицу Excel со всеми параметрами. Вот сайт - https://heiztechnik.com.ua/ И позиции, которые интересуют, чтобы были перенесены : Ручные котлы : 1) TIS UNI 15-95 кВт (10) шт 2)TIS HARD 150-500 кВт (7) шт Пеллетные котлы: 1)TIS PELLET 15-95 кВт… Парсинг данных ∙ 7 дней назад ∙ 38 ставок |