Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
4000 ₽

Парсер данных счетчика liveinternet и сопоставление с Wordpress

закрыт без выполнения


Привет!

нужен ПХП скрипт (не плагин WP) , Который забирает с liveinternet данные по страницам входа их суммарную посещаемость за N месяцев.  и сравнивает это со страницами самого сайта на Wordpress

файл будет исполняться из корня сайта для которого собирается статистика

вверху файла переменные:

доступы к счетчику

1. Login
2. password
3. кол-во месяцев (по умолчанию 3)

4. порог, кол-во посетителей ниже которого статья попадает в список (по умолчанию 1)

3 и 4 может быть передано как GET так и как параметры php через командную строку, если не передано то используется значение по-умолчанию


в верху файла так же подключается
wp-load.php
что даст доступ ко всем функция WP и базе данных.


первый этап работы:
собираем данные с liveinternet, можно использовать данные в формате CSV ,
https://www.liveinternet.ru/stat/DOMEN/first_pages.CSV?period=month&id=287&id=43&id=49&id=680&id=1816&per_page=100&ok=+OK+&page=7


т.е.  берем раздел "точки входа "  переключаем на суммарные данные, по месяцам, выводить по 100 на страницу.
и перебираем все страницы которые есть.
формируем общий массив ссылок и пол-во посетителей по каждой ссылке.

далее берем предыдущий месяц и складываем посещаемость с уже собранной, попутно добавляя новые страницы которых не было в массив

потом снова берем "текущий месяц"-2 и складываем всю посещаемость постранично

и так до тех пор пока не пройдем кол-во месяцев указанное в настройках

второй этап:

Получаем данные из WP - все страницы записей(постов).объединяем это с первым массивом посты у которых не было трафика - соответственно 0

На выходе 

Мне нужен массив с ID постами, у которых суммарный трафик за все собранные месяце ниже порогового.





Обновление #1 от 26 марта в 13:08
Приложил файл, в каком формате отдаются данные. это последняя страница.
последнюю старницу можно опредлеить по количеству строк, если их меьнше 100 -значит длальеш перебирать не надо.

Обновление #2 от 26 марта в 13:31
Внимание! парсинг очень простой, это формальность а не парсинг.

все данные вы получаете структурированные в формате csv , нужные страницы открываются обычным перебором.
единственное что нужно сделать это авторизоваться на сайте и везде отправлять эти кукисы.

Для примера даю доступ
https://www.liveinternet.ru/stat/ampersite.ru/first_pages.html?period=month&page=2
56D5mRff333

чтобы получить нужные данные меняете html на CSV
страницы перебираются &page=2 &page=3 &page=4 пока не будет страницы на которой меньше 100 строк данных
месяца переключаются тоже элементарно
https://www.liveinternet.ru/stat/ampersite.ru/first_pages.html?date=2019-02-28&period=month
добавляете дату нужного месяца и получаете все данные.

Приложения 1

Просмотр приложений доступен только зарегистрированным пользователям.


  1. 1 день2000 ₴
    Денис Якимчук
     774   9  0

    Здравствуйте, Владимир! Могу взяться за вашу задачу прямо сейчас. Если возможно, предоставьте в личном сообщение доступы в liveinternet и ссылку на сайт, чтобы иметь представление о том, что генерируется в csv по указанной вами ссылке.

    Украина Харьков | 26 марта в 13:43 |
  2. ставка скрыта фрилансером