Создание парсера из html файла в excel
Привет!
Нужно из HTML файла (добавленного) извлечь номера телефонов и email
Из файла необходимо извлечь данные в Excel файл в формате:
- Номер телефона - первый столбец
- Email - второй столбец
Номеров в одной компании может быть несколько, поэтому их записываем через запятую в один столбец.
Также в номере могут быть приставки из текста, их не нужно копировать, они лишние
Формат номеров должен быть: 38 (код) номер. Например: 38 (044) 5037750
Если в номерах есть другие символы, они не нужны.
Если нет email, то не записываем его, просто фиксируем номер как строку
В результате хочу получить что-то типа: 38 (---) --- | ---@---
Приложения 1
-
Добрый день. Есть еще несколько вопросов, но готов сделать. Буду рад сотрудничеству
-
182 1 0 Без проблем реализую на Python в минимальні строки, все буде зроблено так, як Вам потрібно, за завданням.
-
111 Привет! Сделаю быстро и качественно.
Чистые данные сохраню в формате EXCEL.
-
3853 24 0 Для выполнения такой задачи, как парсинг информации из HTML файла и последующая загрузка данных в Excel, средний web-разработчик может оценить проект на уровне примерно $300-$600, зависимо от сложности HTML структуры и объема данных. Это оценка учитывает следующие элементы работы:
1. **Анализ структуры HTML**: Определение, как расположена нужная информация в документе.
2. **Разработка парсера**: Программирование скрипта, возможно с использованием Python и библиотеки BeautifulSoup или аналогичных технологий, для извлечения телефонных номеров и адресов электронной почты.
3. **Обработка данных**: Нормализация номеров телефонов к требуемому формату и обработка случаев с множественными номерами на одну компанию.
4. **Экспорт в Excel**: Использование, например, библиотеки `pandas` в Python для структурирования данных и сохранения в формате Excel.
5. **Тестирование и коррекции**: Проверка того, что все данные извлекаются корректно и сохраняются в правильном формате.
Разработчик также предусмотрит время на внесение возможных исправлений после первоначального тестирования, а также обеспечит документацию по работе скрипта. Дополнительные затраты могут включать учет сложности HTML и дополнительных требований к обработке данных, которые могут возникнуть в процессе реализации проекта.
-
4772 375 2 3 Добрый день.
Уже сделал по данному примеру, пожалуйста, предоставьте весь файл
-
3411 32 0 Добрый день.
Быстро напишу скрипт для ваших целей, вытянет все телефоны и почты из html файлов, как в приведенном примере, в excel файл по вашему шаблону.
Пишите в личные.
-
3142 11 0 Добрый час доби!
Разрабатываю парсеры на Python.
Хотел бы увидеть ссылку на сайт, с которого вам нужно получить данные.
-
1084 22 1 Добрый день
заинтересовал ваш проект
могу реализовать на Google Apps Script, будет парсить сразу в Google таблицу
-
621 11 0 Добрый день, готова выполнить данное задание очень быстро для Вас
-
2500 39 1 1 Добрый день!
Готов написать скрипт, который будет собирать из HTML контакты с помощью регулярных выражений. Сегодня он будет готово
-
330 Добрый день!
Готов выполнить ваш заказ сегодня. Для получения подробной информации, пожалуйста, напишите мне в личные сообщения!
-
489 11 0 Имею значительный опыт работы с парсингом html файлов. Могу сделать быстро и качественно.
-
639 22 0 Привет!
Много выполнял подобные задания - готов помочь
-
4077 11 0 2 Привет. Могу выполнить ваш заказ на python. Только нужны уточнения. Пишите
-
15562 214 1 Добрый день!
Для извлечения email есть уже готовый код
Для номеров сделаем.
Буду рада обсудить сотрудничество.
Сколько у вас таких файлов?
-
669 8 0 Добрый день.
Есть опыт работы с похожими задачами, выполню всё быстро и качественно, обращайтесь.
-
3356 70 1 Привет, у меня есть готовое решение, которое из html извлекает email и номера телефонов.
Обращайтесь, расскажу более подробно
-
3219 84 0 Готов взять на себя.
Но нужно уточнить детали заказа, пишите!
Реализую скриптом на python.
-
7428 230 0 Доброго. Готов выполнить
Доброго. Готов выполнить
Доброго. Готов выполнить
Доброго. Готов выполнить
Доброго. Готов выполнить
Доброго. Готов выполнить
Актуальные фриланс-проекты в категории Парсинг данных
База сайтов на woocommerceНеобходимо собрать базу украинских сайтов интернет-магазинов на woocommerce с контактами, которые указаны на сайтах. Только работающие сайты (индикатор: обновление каталога/контента, рабочий домен) Формат таблицы - адрес сайта, номер телефона, e-mail. Парсинг данных ∙ 1 день 14 часов назад ∙ 20 ставок |
Создать дашборд в https://airtable.com/ по результативности рекламных креативов из facebook adsПолноценное ТЗ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Базы данных и SQL, Парсинг данных ∙ 3 дня 5 часов назад ∙ 17 ставок |
Создание файла Exel для загрузки товаров на сайты других партнеров.Меня интересует, чтобы сделать таблицу Excel со всеми параметрами. Вот сайт - https://heiztechnik.com.ua/ И позиции, которые интересуют, чтобы были перенесены : Ручные котлы : 1) TIS UNI 15-95 кВт (10) шт 2)TIS HARD 150-500 кВт (7) шт Пеллетные котлы: 1)TIS PELLET 15-95 кВт… Парсинг данных ∙ 3 дня 9 часов назад ∙ 35 ставок |
Требуется разработчик для парсинга каталога и автоматизации импорта данныхПодробное ТЗ в прикрепленном документе прошу в отклике указать ориентировочную стоимость и сроки реализации есть ли опыт работы с парсингом крупных каталогов какие возможные сложности или ограничения вы видите в данной задаче Базы данных и SQL, Парсинг данных ∙ 3 дня 12 часов назад ∙ 40 ставок |
Найти товарный фид (Google Merchant XML) для сайта на OpenCart
700 UAH
Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл Python, Парсинг данных ∙ 3 дня 17 часов назад ∙ 25 ставок |