Парсер данных
250 UAHЕсть файл XML:
resdata.xml
Его конструкция имеет вид:
<?xml version="1.0" encoding="UTF-8"?>
<urlset >
<url><loc>https://site-1.ru/contacts</loc></url>
<url><loc>https://site-2.ru/contacts</loc></url>
<url><loc>https://site-3.ru/contacts</loc></url>
<url><loc>https://site-4.ru/contacts</loc></url>
<url><loc>https://site-5.ru/contacts</loc></url>
....
</urlset>
Как видно, в файле присутствуют ссылки на сайты со страницами контактов.
При срабатывании крона, происходит загрузка первой страницы из списка.
Если на странице, например, присутствует Email или mailto:[email protected]
то с помощью регулярного выражения, например:
/([a-z0-9_\.\-])+\@(([a-z0-9\-])+\.)+([a-zа-я0-9]{2,4})+/i
или какого-то другого ( важно, чтобы отсекалось всякое mailto: и оставался чистый email адрес )
забирается электронная почта и записывается в результирующий файл с такой же конструкцией как resdata.xml,
но с именем, например: resmail.xml
Часто бывает, что на странице, которая парситься бывает несколько mail адресов.
Тут важно, чтобы можно было получать эти адреса отдельно по одному в переменную,
которая будет учавствовать в функции, которую я подключу самостоятельно.
Например, на странице спарсено 3 email адреса:
1. Берем [email protected] вызываю нужную мне функцию и передаю ей в виде параметра переменную, в которой содержиться [email protected]
Записываем этот email в файл resmail.xml:
<?xml version="1.0" encoding="UTF-8"?>
<urlset >
<url><loc>[email protected]</loc></url>
</urlset>
2. Берем [email protected] вызываю нужную мне функцию и передаю ей в виде параметра переменную, в которой содержиться [email protected]
Записываем этот email в файл resmail.xml:
<?xml version="1.0" encoding="UTF-8"?>
<urlset >
<url><loc>[email protected]</loc></url>
<url><loc>[email protected]</loc></url>
</urlset>
3. Берем [email protected] вызываю нужную мне функцию и передаю ей в виде параметра переменную, в которой содержиться [email protected]
Записываем этот email в файл resmail.xml:
<?xml version="1.0" encoding="UTF-8"?>
<urlset >
<url><loc>[email protected]</loc></url>
<url><loc>[email protected]</loc></url>
<url><loc>[email protected]</loc></url>
</urlset>
1. И так при каждом срабатывании крона будет читаться очередная строка с resdata.xml;
2. Парсится со страницы email адрес(а);
3. Вызываться некоторая функция, параметром которой является один email адрес, а если на странице их несколько, то функция вызывается столько же, сколько
с одной страницы спарсено адресов. Тут в скрипте нужно указать место куда я должен буду вставить вызов своей функции.
4. Записать все спарсенные со страницы email адреса в результирующий XML файл resmail.xml
Соответственно, при следующем срабатывании крона происходит чтение следующей строки с файла resdata.xml и все выше указанное повторяется снова.
Когда resdata.xml прочитан полностью, вывести на экран надпись типа "Работа окончена", а в процессе работы скрипта, при каждом срабатывании крона
выводить на экран общее кол-во елементов в файле resdata.xml, порядковый номер элемента, который обрабатывается и кол-во записанных в файл resmail.xml адресов.
Отзыв заказчика о сотрудничестве с Алексеем Масловым
Парсер данныхРаботает быстро и качественно. Быстро разбирается в чужом коде, даже если он написан крайне бессистемно)
Отзыв фрилансера о сотрудничестве с Русланом Пуршегой
Парсер данныхЧетко сработали! Отличный заказчик!
-
591 22 0 Добрый день. 0938387175
Скайп maslenza.
По поводу сайтов понял. Написал так же в ЛС.
-
1600 38 6 4 Готов выполнить за указанный срок
Решение будет работать на сервере, обрабатывать в указанное время нужный список страниц, получать и хранить данные которые можно будет в любой момент скачать
Можно сделать админу форму для добавления новых сайтов, удаления лишних емейлов
-
Сайт покажите? В лс. Спасибо.
-
подробней в личку пожалуйста , специализируюсь на парсинге
-
Актуальные фриланс-проекты в категории PHP
Парсер expireddomains.net
5000 UAH
Нужен парсер expireddomains.net на сайте нужно сначала залогиниться, проблема в том что блокирует ИП при попытке парсить данные, нужно парсить тематические домены по списку ключевых слов, кто не уверен в своих силах не пишите PHP, Веб-программирование ∙ 1 день 14 часов назад ∙ 48 ставок |
Интеграция платежного сервиса с Sales Force
3104 UAH
На сайте стоит виджет платежной системы, его нужно интегрировать с asles fоrce что бы все требуемые параметры видели на стороне salec force Нужно сдлеать так, что бы все платежи и подписки кнтролировались через salecforec PHP, Веб-программирование ∙ 1 день 18 часов назад ∙ 40 ставок |
Домофонные системы
4000 UAH
Ищем опытного программиста BAS (1С 8.3) для доработки самописной конфигурации под бизнес-процессы нашей компании. Что нужно: — Изучить текущую самописную конфигурацию BAS 8.3 — Доработать и настроить под наши процессы — Учет: клиенты, договоры, заявки, склад, оплаты, акты… PHP, Базы данных и SQL ∙ 4 дня 17 часов назад ∙ 13 ставок |
Выгрузка товаров из 1С на prom.uaСоздать, настроить модуль выгрузки по API, товаров из 1С в кабинет и на сайт prom.ua, rozetka или другой маркетплейс на выбор, остатки, наименования, картинка из 1С, цены, автоматическая выгрузка, автоматическое обновление PHP, Базы данных и SQL ∙ 5 дней 9 часов назад ∙ 21 ставка |
Исправить проблему перевода WPMLНа сайте настроен перевод товаров через Advanced Editor. Перевод текстов в редакторе корректный, но при этом на сайте отображается некорректный текст. Если зайти в редактор страницы (на языке, на который переводим), там как раз этот текст и указан (в WordPress Editor).… PHP, Веб-программирование ∙ 6 дней 9 часов назад ∙ 37 ставок |