Парсинг номеров телефонов с сайтов
Необхідно створити програму (бажано на мові Python), яка автоматично оброблятиме список вебсайтів, наданий у форматі Excel, та здійснюватиме пошук контактних номерів телефонів, розміщених на цих ресурсах.
Результатом роботи має бути Excel-файл:
- Адреса сайту
- Знайдені телефонні номери
- Знайдене імя користувача (якщо вказано)
- Знайдена пошта користувача (якщо вказано)
Ключова мета — зібрати максимальну кількість різних номерів для кожного окремого сайту.
P.S. Уточнення по ТЗ готові обговорити.
-
430 Привет!
Готов реализовать для вас решение на Node.js, которое автоматически будет обрабатывать список вебсайтов из Excel-файла и осуществлять поиск контактных данных (номера телефонов, email, имя пользователя, если указано).
🔍 Функционал:
Чтение Excel-файла со списком сайтов (.xlsx)
Обход каждого сайта (включая вложенные страницы)
…
Парсинг HTML-контента для поиска:
📞 Телефонов (в форматах +380, (099) и подобные)
📧 Email-адресов
👤 Имени пользователя (где возможно)
Формирование нового Excel-файла с найденными данными
📁 Формат результата: | Сайт | Телефоны | Почта | Имя пользователя |
🛠 Технологии:
Node.js (JavaScript)
xlsx — для работы с Excel
axios + cheerio — для парсинга HTML
puppeteer — для динамических сайтов (где нужен headless браузер)
Регулярные выражения для ловли телефонов, email и т.д.
💡 Опционально:
Обход глубоких страниц сайта
Сбор только с поддоменов или с ограничением глубины
Логирование ошибок и повторная попытка при недоступности сайта
В будущем легко добавить:
автоматический запуск по расписанию (cron)
веб-интерфейс
интеграцию с базой данных
Готов обсудить детали и внести уточнения в ТЗ. Напишите, если нужен пример или демо.
-
852 51 0 1 Готов к сотрудничеству.
Точная цена и сроки после обсуждения деталей.
Пишу на Python
-
1323 35 1 Добрый день. Вышлите в тхт файле список доменов. У меня есть скрипт на пхп. Посмотрим что он найдет.
-
1831 46 3 Здравствуйте!
Меня заинтересовал ваш проект, у меня большой опыт работы в автоматизации/эмуляции действий пользователя (JavaScript, Selenium, Playwright), асинхронном/многопоточном парсинге (Requests, WebSockets, HTTPX, BS4), обработке информации (Openpyxl, JSON, MySQL, MongoDB) и разработке Telegram-ботов различной сложности (Telethon, Pyrogram, Aiogram).
Мы разрабатывали подобное ПО для поиска ключевых слов, почтовых адресов, номеров на сайтах/страницах;
Свяжитесь со мной для обсуждения деталей и сроков выполнения этого проекта!
-
32 Привет, напишу такую программу на Python, которая будет из excel файла с сайтами парсить в другой файл все данные. Более подробно уже в личных сообщениях
-
342 1 1 Могу реализовать эту задачу на Python — программа автоматически обработает Excel со списком сайтов, найдет телефоны, email-ы и имена пользователей (если есть) и сформирует результат в новый Excel.
Учту регулярные выражения, корректную обработку HTML, фильтрацию.
Готов(-а) сделать демо или сразу взяться за полную реализацию.
-
211 Привет! Делал похожий парсер на Python — обрабатывал сайты из Excel. Важный акцент был именно на поиск различных номеров с разных страниц сайта. Могу сделать быстро, четко и удобный Excel-отчет. Можем обсудить ТЗ
-
1877 53 0 Здравствуйте, готов выполнить ваше задание, напишу парсер, который будет собирать всю необходимую информацию и записывать данные в Excel или гуглтаблицы
-
601 6 0 Здравствуйте, заинтересовало ваше предложение. Можете предоставить возможные источники по которым будет парситься для уточнения.
-
5482 105 2 парсингом занимаюсь более 10 лет, пишу парсеры на nodejs, нечто похожее делал ранее
https://freelancehunt.com/showcase/work/parser-email-po-spisku-saytov/1933774.html
портфолио -Freelancehunt
предлагаю обсудить
Актуальные фриланс-проекты в категории Парсинг данных
Настроить модуль "Автоматическая обработка прайс-листов. v.9.5".Магазин на OcStore 2.3. установлен модуль "Автоматическая обработка прайс-листов. v.9.5". Все настроено автором модуля, но сейчас есть моменты по настройкам, которые не могу разобраться и допетрать логику работы модуля. Например, проблема с двумя языками в карточке товара, тянет… Интернет-магазины и электронная коммерция, Парсинг данных ∙ 10 часов 36 минут назад ∙ 18 ставок |
Ценообразование товаров автозапчастей от поставщиков для сайтов автозапчастей на базе Пром.Техническое задание Проект Настройка наполнения и синхронизации двух магазинов Prom.ua с поставщиками автозапчастей. Задача Необходимо реализовать загрузку и обновление товаров от поставщиков автозапчастей для двух интернет-магазинов на Prom.ua. ⸻ 1. Подключение… Парсинг данных ∙ 22 часа 25 минут назад ∙ 41 ставка |
Парсинг базы
2000 UAH
Требования к каналам: 1. Язык контента: Русский или украинский (допускается смешанный контент RU/UA) 2. Количество подписчиков: Не менее 500 подписчиков 3. Активность: Последний пост опубликован не позднее чем 32 часа назад 4. Комментарии: В канале должны быть открыты… Базы данных и SQL, Парсинг данных ∙ 23 часа 44 минуты назад ∙ 28 ставок |
Необходимо разработать Telegram-бота для мониторинга автомобилей с аукционов США (Copart, IAAI)Необходимо создать Telegram-бота для автоматического поиска и мониторинга автомобилей "BUY IT NOW" на аукционах США (Copart, IAAI). Бот должен работать в автоматическом режиме и отправлять сообщения о новых автомобилях, которые соответствуют заданным фильтрам.Основной… Парсинг данных, Разработка ботов ∙ 2 дня назад ∙ 92 ставки |
Парсинг товаров, подготовка к импорту на WPСпарсить полный каталог этих сайтов: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Все товары нужно объединить в одну обющую таблицу для импорта в WP. Каждый товар… Веб-программирование, Парсинг данных ∙ 4 дня 17 часов назад ∙ 60 ставок |