Нужно написать скрипт (программку) которая будет парсить со списка сайтов (список сайтов предоставляю в виде excel-файла) контактные номера телефонов, указанные на сайтах, и возвращать excel-файл с таблицей с двумя колонками: сайты и соответствующие номера телефонов. Задача - снять как можно больше вариантов номеров для каждого сайта.
Может быть два варианта подмены основного номера на сайте:
1) Динамический коллтрекинг (Базовый принцип работы предельно простой. Каждый пользователь, который попадает на сайт видит свой телефонный номер. Этот телефонный номер не может быть отдан никому другому пока пользователь находится на сайте и плюс еще некоторое время после прекращения активности на сайте. Номер закрепляется за сессией пользователя.). В таком случае нужно имитировать сессии от "разных" пользователей, чтоб показывались разные номера. Сессию на каждом сайте нужно сымитировать 40 раз и снять 40 номеров телефона, которые подменят основной номер телефона на сайте.
2) Статически коллтрекинг (Это когда основной номер на сайте подменятеся на другой в зависимости от источника, откуда пришёл пользователь.). В таком случае всем пользователям, пришедшим с контекстной рекламы будет показываться одинаковый номер, с органической выдачи будет показываться второй одинаковый номер и т.д. Важно: если один и тот же пользователь пришёл с контекстной рекламы, а потом он же с органической выдачи (на протяжении короткого промежутка времени), то ему будет отображаться один и тот же номер (в зависимости какой источник зафиксировался за пользователем первый). Таким образом для данного варианта нужно имитировать источник прихода пользователя на сайт (добавляя к URL определённые utm-метки по типу site.com.ua/?utm_source=google&utm_medium=cpc (список таких меток предоставлю)) и имиторовать новую сессию.
В итоге скрипт должен пройтись по всему списку сайтов по первому и второму варианту и собрать как можно больше номеров телефонов.
Примечания:
- названия сайтов возвращать такими же, какими они были на входе
- номера телефонов должны быть записаны однотипно согласно маски +380*********
- в конечном excel-файле дубликаты номеров удалить