Фикс 403 [Парсинг OLX]
Добрый день уважаемое сообщество.
У меня есть парсер для olx, написанный на Python.
Использую aiohttp и aiohttp_socks
Суть парсера проста:
- Переходим на страницу поиска olx (*ссылка*).
- Фильтруем по актуальности времени.
- Фильтруем по количеству просмотров (запрос на ссылка) получаем количество просмотров конкретного объявления).
- Если все хорошо, то переходим на страницу конкретного объявления и получаем нужную информацию.
- После этого отправляем в телеграм.
Использовал без прокси около 2 месяцев, все работало отлично. Потом дали бан (403 Request Blocked), начал использовать прокси (автоматическая ротация с 10 ip-адресов из файла proxie.json) и подключение через ProxyConnector. Всё работало ровно 2 недели, теперь уже конкретный бан.
Сейчас проблема в том, что даже на первом этапе я получаю блок (
Прокси уже менял на новые, user-agent(-ы) менял, и ничего.
Думал, стоит блок по guid, также его подменял - и тоже без результата.
Доступов к серверу не будет, файл парсера также не дам.
Решение: вы предоставляете мне готовый .py файл, который я запускаю у себя на сервере и проверяю подключение к *ссылка*.
Если все в порядке, проект закрываем.
P.S. запросов очень много, учтите это. Selenium не использую и не буду
-
78 Это задача на настройку антибан-обхода: прокси, заголовки, возможные антибот-защиты. При необходимости можно использовать headless-браузер (например, undetected_chromedriver), но пока не обязательно.
2. Что будет в решении:
– Один .py файл, который:
загружает страницу OLX через указанный прокси
подставляет рабочие User-Agent, куки (если нужно)
… логирует статус (например, успешный обход или 403)
3. Доступа к серверу не нужно — всё реализуем локально.
позже можно интегрировать этот обход в Ваш основной парсер
-
3853 24 0 Добрый день! Заинтересовал проект с парсером для olx. Имею опыт в сфере парсинга данных и автоматизации с использованием различных библиотек. Смогу адаптировать ваш текущий Python скрипт для обхода блокировки, внести необходимые коррективы для эффективной работы без использования Selenium. У меня есть идеи по оптимизации запросов и смене параметров доступа, чтобы минимизировать риск бана.
Мой рейт 16$ в час. Предложу решение, которое можно будет запустить на вашем сервере для тестирования эффективности нового подхода.
-
236 1 0 Добрый день
Могу предложить техническое решение из 2 компонентов:
* прокси-сервис под Linux (объясню подробнее)
* настройка скрапера (рабочая логика не нужна, кроме пары моментов, которые я предложу проверить)
-
212 Добрый день!
Ваш кейс хорошо понятен — блокировка OLX даже с прокси в последнее время значительно участилась, особенно при интенсивном парсинге.
🔧 Могу разработать .py файл, который:
работает через aiohttp + aiohttp_socks
автоматически ротує прокси из вашего proxie.json
… заменяет User-Agent, заголовки и другие следы (включая cookie, headers, referer)
максимально имитирует запросы обычного браузера (аналог браузерного fingerprint)
проверяет доступ к нужной ссылке
❗ Учитываю, что Selenium не используется, и запросов много. Настрою адаптивную задержку + поведенческую псевдослучайность, чтобы снизить риск блокировок.
💬 Если есть лог примера ответа от OLX (403/429 или др.), будет полезно для более точной настройки.
Готов предоставить .py для тестирования — только после того, как удостоверюсь в его работоспособности. Если работает — закрываем проект.
Пишите в ЛС — обсудим детали и подберем оптимальное решение для вашего парсера.
-
3219 84 0 So where is the technical assignment? This is a development from scratch if we consider that you said you won't provide the code.
-
336 Привет! Мы - SolidWay компания, и мы готовы помочь с твоим проектом парсинга OLX. У нас есть опыт работы с Python, включая библиотеки, которые ты упоминал, так что мы можем найти решение для обхода блокировок, с которыми ты сталкиваешься.
Мы понимаем, что проблема с блокировкой может требовать креативных подходов к работе с прокси и user-agent, поэтому мы готовы испытать разные методы, чтобы обеспечить необходимую функциональность парсера. Наша команда уже реализовала подобные проекты, поэтому мы знаем, что делать.
Детали, связанные с сроками и бюджетом, мы обсудим после того, как уточним все нюансы твоего запроса. Так что, давай обсудим, как мы можем помочь в решении твоей задачи!
-
Доброго дня.
Покажіть скрін того, як ви реалізуєте коннект. -
За вашими посиланнями
"Сторінку не знайдено"
-
удалено модератором
-
Актуальные фриланс-проекты в категории Python
Создание многофункционального бота в Телеграм
1000 UAH
(Все материалы предоставлю в приватные сообщения) Вот детальное описание проекта: После нажатия кнопки /start Бот присылает текст с правилами и условиями пользования (под текстом, кнопка ‘ознакомлен’) После нажатия на кнопку, следующее сообщение ‘проверка на подписку’ Три… Python, Разработка ботов ∙ 1 день 4 часа назад ∙ 87 ставок |
Найти товарный фид (Google Merchant XML) для сайта на OpenCart
700 UAH
Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл Python, Парсинг данных ∙ 3 дня 17 часов назад ∙ 25 ставок |
Розработка Тик-Ток фермы (контент-завод)Необзодимо разработать систему для централизованного управления несколькими TikTok-аккаунтами с автоматической публикацией контента, использованием индивидуальных прокси и имитацией естественной активности аккаунтов. Функциональные требования1. Управление аккаунтами Добавление… Python, Разработка ботов ∙ 4 дня 5 часов назад ∙ 19 ставок |
Улучшить работу Claude Code и работа с написанием софтаСейчас разрабатываю СРМ и Аналитику, софт. Делаю через Клод Код, но понимаю что результаты не лучшие в плане изменений. Есть 2 задачи - Нужно помочь сделать пресет по навыкам, мд и так далее чтобы улучшить качество. Взять проверенные с которыми работали, а не с интернета… AI и машинное обучение, Python ∙ 4 дня 12 часов назад ∙ 25 ставок |
Система OCRНужна система распознавания текста на почтовых конвертах (индекс кому - только числа). Текст иногда может быть рукописным. Распознавание марок (подсчет количества и номинала) Python ∙ 4 дня 15 часов назад ∙ 28 ставок |


