Парсер вебстраниц с обходом капчи и рекапчи
Задача: Для телеграммбота написать парсер веб страниц определенных сайтов. С телеграмм бота поступает
запрос, этот запрос необходимо ввести в поле для поиска на сайте, спарсить полученую информацию по
ключевым словам, создать новую вебстраничку на своем сайте, заполнить ее полученой информацией и
отправить в чат телеграмм боту ссылку на эту страничку на сайте. На сайтах, с которых будет парситься
информация всегда присутствует ReCaptcha v3 и разные Captcha (парсинг будет происходить на 3-4
сайтах).
Необходимый функционал:
1) Прохождение каптчи и рекаптчи ( время на обработку не более 5 10 сек)
2) Многопоточность. Запросов может быть по 10-20 в секунду.
3) Реализовать базу данных пользователей бота для проверки оплачен ли доступ к боту. Если доступ не
оплачен предложить разовое использование или приобретение подписки.
4) Реализовать архив подготовленных данных и в случае повторения запроса любым пользователем
предложить посмотреть подготовленные данные, сформированные ранее.
Пишите примерную стоимость выполнения работы и сроки!
-
314 7 1 1 Здравствуйте, есть опыт в написании многопоточных парсеров на php (обрабатывается сразу несколько страниц). Обойти капчу можно только через платные сервисы. Пишите.
Пример парсера: http://test.parkes.org.ua/parser/. Есть интерфейс. Парсер обходит все товары донора, загружает их в базу данных престашоп (можно и в Excel файл). Пишет отчет по каждому товару в файл.
Отзывы обо мне (ссылку не разрешают поставить): fl ru
Опыт программирования (js, php) 5+ лет.
Skype: lidomedbio
-
15025 218 0 Добрый день!
Готов помочь.
Опыт в веб разработке 10 лет.
Давайте все обсудим.
skype: rootdorosh
telegram: @vasyl_dorosh
email: vasyldorosh[a]gmail.com
-
Каптчу от гугла не пройти за 5-10 секунд. Есть сервисы которые позволяют разгадывать их, но это займет время.
-
Aktualne zlecenia dla freelancerów w kategorii Programowanie stron internetowych
Szukamy specjalisty, który stworzy plik XML/YML z produktami dla marketplace'ów Rozetka i Kasta.Należy przygotować plik z towarami: nazwa, opis, cena, stany, zdjęcia, kategorie, cechy, rozmiary/kolory. Ważne: plik musi przejść walidację Rozetka i poprawnie załadować się na Kasta. Towar mamy w CRM Sitnix oraz na stronie KhoroshopTowaru jest orientacyjnie 80 sztuk… Programowanie stron internetowych ∙ 48 minut temu ∙ 12 ofert |
Strona internetowa dla sklepu z hurtową sprzedażą włosów
2450 PLN
Wymagania w załączniku Potrzebna jest strona internetowa dla hurtowni sprzedaży włosów w Polsce Wszystkie szczegóły opisane są w tzw HAIR FAMILY ТЗ.docx Programowanie stron internetowych, Projektowanie stron internetowych ∙ 1 godzina 10 minut temu ∙ 66 ofert |
Moduł dla Dle 19.1Potrzebny moduł czytnika książek w formacie fb2 dla Dle 19.1, jak na wideo - https://www.youtube.com/watch?v=4F-hFe2XsGA Istota: Przy dodawaniu wiadomości, w dodatkowym polu ładowana jest książka w formacie fb2. W pełnej wiadomości pojawia się link do czytania. Można zrobić… Programowanie stron internetowych ∙ 2 godziny 32 minuty temu ∙ 11 ofert |
Wsparcie przy Landing Page, sklep z subskrypcjami, zbieranie mailiDzień dobry, poszukuję osoby do wsparcia technicznego przy uruchomieniu strony internetowej: landing page ze sklepem oraz systemem newsletterowym. Zakres prac obejmuje: wykonanie landing page / prostej strony internetowej, uruchomienie sklepu z możliwością sprzedaży produktów… Programowanie stron internetowych ∙ 21 godzin 25 minut temu ∙ 51 ofert |
Tworzenie wtyczki do integracji z systemem POS Syrve, C#Opracować wtyczkę do systemu POS Syrve (on-premise), która jest instalowana na serwerze lokalu. Wtyczka ma: (1) przesyłać na nasz serwer dane w czasie rzeczywistym — zamówienia, statusy stolików, płatności, rachunki; (2) przyjmować polecenia od Reservble — potwierdzenia… C#, Programowanie stron internetowych ∙ 22 godziny 20 minut temu ∙ 11 ofert |