Python + Selenium. Антикапча. Парсинг гугл поиск.
Здравствуйте. Подробно дам лог с проблемой тому, кто напишет в ставке. Задача для того, кто имел опыт с ботами/парсерами, которые работали на Selenium и делали запрос в гугл поиск и использовали сервис антикапчи. У меня есть парсер на Python, запросы делает через aiohttp. Имеет локальный хост. Он делает запрос в гугл поиск. Использует для этого Selenium.
Пример проблемы. Парсер открыл Selenium, отправил поисковый запрос в гугл поиск. Появилась капча. Сервис антикапчи решил капчу. Бот гуглит дальше. Проблема в том, что Selenium иногда передает ключ решенной капчи. Но дальше бывает так, что гугл то принимает ключ, то не принимает. Даже если капча 100% решена. Пока вручную в ДРУГОЙ ВКЛАДКЕ Selenium не решу вручную капчу, бот дальше не может работать. Замечу в ДРУГОЙ ВКЛАДКЕ. Потому что в этой ВКЛАДКЕ, где была капча, она как бы умирает вручную, даже капчу не пройти. 2 раза проходишь капчу, и гугл переводит страницу: google.com/sorry/index
А сама ссылка с желтым хвостом пропадает. Вместо нее становится та короткая, что написал.
Поэтому дело не в самом сервисе или гугле. А в самом Selenium. Что-то не так с ним. Потому что! Когда вручную в нем разгадываю капчу в новой вкладке, то гугл сразу и всегда дает мне возможность гуглить дальше. В моем Selenium есть папка chrome data. Чтобы не думали, что сессия не сохраняется. В код смотрели 2 разных разработчика. И сказали, что проблему может решить только тот, кто хорошо понимает Selenium. Потому что Python не все может контролировать. Иногда, чтобы что-то исправить, нужно лезть в сам код самого Selenium, а это уже бинарный код.
Кто разрабатывал что-то на Selenium, для него выяснить такую проблему будет легко. Нужно устранить ошибки, которые в консоли парсера, возможно проблема такая из-за них, думаю их не должно быть.
Для меня все это странно. Потому что на сервисе разгадывания капчи есть подробная инструкция. Api Python + Selenium. Мы ее подробно придерживались. Кто поможет, буду всегда давать постоянную работу. Много имею различных проектов. Спасибо за внимание!
-
Невірний підхід до проблеми. Треба робити так, що б Гугл не викидав капчу)
-
У вас проблема с самим селениумом, который детектится, просмотрите фингерпринты, попробуйте использовать стелс, или поднятие реального браузера с подключением CDP сессии, рассмотрите варианты с антидектектами по типу адспавер, гологин и т.д.
Также немаловажную роль играют прокси, обязательно резидентские, никаких датацентров (которые дешевле).
-
Олексанр, у вас все ще відкрите питання?
-
Актуальные фриланс-проекты в категории Python
Разработка программного обеспечения с ИИНеобходимо разработать программное обеспечение для автоматического обнаружения, захвата и сопровождения объекта с помощью видеокамеры и поворотного механизма.Исходные данные: Видеокамера с оптикой. Поворотное устройство по двум осям (азимут/угол места). Сервоприводы с… AI и машинное обучение, Python ∙ 17 часов 17 минут назад ∙ 12 ставок |
ТЗ НА ДОПРАЦЮВАНИЕ AI-БОТА ГЕНЕРАЦИИ ЛИЧНЫХ ПЕСЕНТЗ НА ДОПРАЦЮВАННЯ AI-БОТА ГЕНЕРАЦІЇ ПЕРСОНАЛЬНИХ ПІСЕНЬГОЛОВНА ЦІЛЬ Створити стабільний преміальний продукт, який: генерує максимально якісні персональні пісні; не вигадує факти про клієнта; працює стабільно під навантаженням; легко масштабується; дозволяє аналізувати та… Python, Разработка ботов ∙ 18 часов 22 минуты назад ∙ 30 ставок |
Автоматизация процессоів через API и PhytonНиже описал текущий процесс и то, к какому результату хотелось бы прийти. Также прикладіваю файлы реалтного процесса чтобы лучше понять как он выглядит в ревльности Текущий процесс Сейчас весь процесс выполняется вручную: загрузка/выгрузка файлов, перенос данных между… AI и машинное обучение, Python ∙ 22 часа 22 минуты назад ∙ 42 ставки |
Необходимо создать бота в ТГ для оплаты подписки.
2000 UAH
Необходимо создать бота в телеграме, где пользователь сможет оформить подписку на доступ к веб-камерам, которые находятся во дворе. Организовать в боте оплату двух видов подписок (на месяц и на один день). Бот должен автоматически проверять оплату и после выдавать ссылку-доступа. Python, Разработка ботов ∙ 1 день 11 часов назад ∙ 78 ставок |
Бизнес-логикa платформы: подтверждение занятий, контроль посещаемости-и история уроков (DjangoДоработка бизнес-логики образовательной платформы: подтверждение занятий, контроль посещаемости и история уроков (Django + React) Необходимо реализовать полноценную систему подтверждения уроков, контроля посещаемости и хранения истории подтверждений. Важно Перед началом… Python ∙ 3 дня 23 часа назад ∙ 30 ставок |