Скрипт для извлечения данных (номера телефонов и логины)
849 UAHНужен скрип для быстрого извлечения данных из файлов
файлы в формате .html
из себя представляет N файлов
Эти файлы - история переписки телеграм чата
ЗАДАЧА СКРИПТА
- Массовое извлечение телеграм логинов из тела сообщения
- Подсчет рейтинга частотности слов
- Массовое извлечение телефонных номеров из тела сообщени
АЛГОРИТМ РАБОТЫ СКРИПТ
- Скрипт просит ввести цифру какую задачу сейчас будем запускать
- скрипт спросит указать путь к папке где лежат все эти файлы
- спрашивает сколько файлов из папки обрабатывать через указать диапазон файлов от-до
- скрипт спросит куда сохранить результат
- скрипт запускает обработку данных
- скрипт в самом конце удаляет дубли
ПОЯСНЕНИЕ КАЖДОЙ ФУНКЦИИ
- Массовое извлечение телеграм логинов из тела сообщения
После того как скрипт спросил сколько файлов обратывать
бот начинает открывать по очереди каждый файл, и из тела сообщения извлекать логины телеграма
- алгорит работы:
бот открывает .html файл извлекает данные --> полученный результат записывает в файл с результатами --> после открывает следующий файл --> полученный результат записывает в файл с результатами --> задача уходит в цикличность до тех пор пока не обработает все файлы из папки
После завершения работы скрипт выдает сообщение что задача завершена
2. Подсчет рейтинга частотности слов
скрипт по очереди открывает .html и подсчитывает рейтинг частотоности слов
формат слово/количиство повторений
- алгорит работы:
сначала идет подсчет слов в одном файле
скрипт записал предварительный результат в файл
далее открывает следующий файл делает подсчет слов и прибавляет полученный результат к предыдущему и дальше задача уходит на цикличность до тех пор пока не завершится подсчет во всех файлах
3. Массовое извлечение телефонных номеров из тела сообщения
задача извлечь все возможные варианты написания телефонных номеров
На хабре нашел вот такую регулярку
/^(\+)?(\(\d{2,3}\) ?\d|\d)(([ \-]?\d)|( ?\(\d{2,3}\) ?)){5,12}\d$/
обрабатывает вот такие варианты написания http://joxi.ru/l2ZxO0dt7V6R3r
Отзыв заказчика о сотрудничестве с Andrew S.
Скрипт для извлечения данных (номера телефонов и логины)Вауууу!!!
Я впечатлен!)))
Парсит ооооочень быстро!!!
мне другой фрилансер пытался сделать подобную задачу - но там что бы обработать такой же объем данных, программе надо было сутки
а тут считанные секунды!
а тут ракета!!!!!!Аааааааафигеть )))
Спасибо огромное))
Я хотел быстро - но когда думал о скорости парсинга - я даже не мог представить себе что такая скорость будет))))
Ващеее кайф))
ОГОНЬ!
Спасибо!
Заказчики рекомендую этого Фрилансера — очень толковый исполнитель!
сделал мне меньше чем за сутки Ооочень крутой парсер!
Браво!
![]()
-
1984 156 1 Добрый вечер. Заинтересовал ваш проект Готова заняться разработкой скрипта с необходимым функционалом.
-
2498 34 1 2 Добрый вечер, Антон. Готов заняться разработкой данного по.
Есть возможность реализовать его на python или js.
Сделаю все согласно тз.
Детали проекта, а также цену и сроки предлагаю обсудить в лс
-
1767 40 0 Здравствуйте. Готов взяться за выполение. Задача понятная. ..
-

данные должны извлекаться из файлов
https://yadi.sk/d/s0pCZkMAuThTEg?w=1
все эти файлы это история переписки 1 чата за определенный период
Задача будет считаться завершенной когда из всех файлов будет извлечены/подсчитаны даныне
-

Для тех у когонет VPN
перезалил на другой файло обменник пример файлов откуда надо извлекать данные
https://mega.nz/folder/00lHTKYC#V0lxqjK6y1kHuRAI7Wyoxg
-
Актуальные фриланс-проекты в категории Парсинг данных
Парсинг товаров, подготовка к импорту на WPСпарсить полный каталог этих сайтов: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Все товары нужно объединить в одну обющую таблицу для импорта в WP. Каждый товар… Веб-программирование, Парсинг данных ∙ 14 часов 26 минут назад ∙ 34 ставки |
Шукаю програміста для опен картаДоброе время суток 1)нужно внедрить на сайте dneprkomfort.dp.ua был куплен модуль для украинских банков уже внедрили Моно банк вот пример нашего конкурента Нужно как cделать розсрочку, покупка частями (МоноБанк) Пумб, Сенс, Моно по умолчанию 2 платежа 2 мес Пумб по умолчанию 3… Веб-программирование, Парсинг данных ∙ 1 день 11 часов назад ∙ 46 ставок |
Требуется специалист по продвижению в Telegram.
1272 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 5 дней 14 часов назад ∙ 9 ставок |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 9 дней 9 часов назад ∙ 13 ставок |
Нужен специалист для поиска контактов ЛПР по УкраинеНеобходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины. Поиск и сбор информации, Парсинг данных ∙ 9 дней 13 часов назад ∙ 21 ставка |