Фікс 403 [Парсинг OLX]
700 UAHДобрий день шановне панство.
Є в мене парсер для olx написаний на Пітоні.
Використовую aiohttp та aiohttp_socks
Суть парсера проста:
- Переходимо на сторінку пошука олх (*посилання*).
- Фільтруємо по актуальності часу.
- Фільтруємо по кількості переглядів (запит на посилання отримуємо кількість переглядів конкретного оголошення).
- Якщо все гуд, то переходимо на сторінку конкретного оголошення і отримуємо потрібну інфу.
- Після того як отримали відправляємо в телеграм.
Використовував без проксі десь 2 місяці, все працювало окей. Потім дали бан (403 Request Blocked), почав використовувати проксі (автоматична ротація з 10 ip адрес з файлу proxie.json) та підключення через ProxyConnector. Все пропрацювало рівно 2 тижні, тепер вже прям конкретний бан.
Зараз проблема в тому, що навіть на першому етапі я отримую блок (
Проксі міняв вже на нові, user-agent(-и) міняв, і ніфіга.
Думав стоїть блок по guid, також його підміняв - і теж без результату.
Доступів до серверу не буде, файл парсеру також не дам.
Рішення: ви надаєте мені готовий .py файл, який я запускаю в себе на сервері і перевіряю підключення до *посилання*.
Якщо все окей, проєкт закриваємо.
P.S. запитів дуже багато, врахуйте це. Selenium не використовую і не буду
-
78 Це завдання з налаштування обходу антибану: проксі, заголовки, можливі антибот-захисти. За потреби можна використовувати headless-браузер (наприклад, undetected_chromedriver), але поки не обов’язково.
2. Що буде у рішенні:
– Один .py файл, який:
завантажує сторінку OLX через вказаний проксі
підставляє робочі User-Agent, куки (якщо потрібно)
… логуватиме статус (наприклад, успішний обхід або 403)
3. Доступ до сервера не потрібен — все реалізуємо локально.
згодом можна інтегрувати цей обхід у Ваш основний парсер
-
3853 24 0 Добрий день! Зацікавив проект з парсером для olx. Маю досвід у сфері парсингу даних та автоматизації з використанням різних бібліотек. Зможу адаптувати ваш поточний Python скрипт для обходу блокування, внести необхідні корективи для ефективної роботи без використання Selenium. У мене є ідеї щодо оптимізації запитів і зміни параметрів доступу, щоб мінімізувати ризик бана.
Мій рейт 16$ за годину. Запропоную рішення, яке можна буде запустити на вашому сервері для тестування ефективності нового підходу.
-
236 1 0 Доброго дня
Можу запропонувати тезнічне рішення з 2 складових:
* проксі сервіс під Лінукс (поясню детальніше)
* налаштування скрапера (робоча логіка не потрібна окрім пари момент які запропоную перевірити)
-
188 Доброго дня!
Ваш кейс добре зрозумілий — блокування OLX навіть із проксі останнім часом значно почастішали, особливо при інтенсивному парсингу.
🔧 Можу розробити .py файл, який:
працює через aiohttp + aiohttp_socks
автоматично ротує проксі з вашого proxie.json
… підмінює User-Agent, заголовки та інші сліди (включно з cookie, headers, referer)
максимально імітує запити звичайного браузера (аналог браузерного fingerprint)
перевіряє доступ до потрібного посилання
❗ Врахую, що Selenium не використовується, і запитів багато. Налаштую адаптивну затримку + поведінкову псевдовипадковість, щоб знизити ризик блокувань.
💬 Якщо є лог прикладу відповіді від OLX (403/429 чи ін.), буде корисно для більш точного налаштування.
Готовий надати .py для тестування — лише після того, як упевнюсь у його працездатності. Якщо працює — закриваємо проєкт.
Пишіть у ЛС — обговоримо деталі і підберемо оптимальне рішення для вашого парсера.
-
3392 84 0 Так техзавдання де? Це ж розробка з нуля якщо враховувати що Ви сказали що код не дасте.
-
336 Привіт! Ми - SolidWay компанія, і ми готові допомогти з твоїм проектом парсинга OLX. У нас є досвід роботи з Python, включаючи бібліотеки, які ти згадував, так що ми можемо знайти рішення для обходу блокувань, з якими ти стикаєшся.
Ми розуміємо, що проблема з блокуванням може вимагати креативних підходів до роботи з проксі та user-agent, тому ми готові випробувати різні методи, аби забезпечити необхідну функціональність парсера. Наша команда уже реалізувала подібні проекти, тому ми знаємо, що робити.
Деталі, пов'язані з термінами та бюджетом, ми обговоримо після того, як уточнимо всі нюанси твого запиту. Тож, давай обговоримо, як ми можемо допомогти у вирішенні твоєї задачі!
-
Доброго дня.
Покажіть скрін того, як ви реалізуєте коннект. -
За вашими посиланнями
"Сторінку не знайдено"
-
видалено модератором
-
Актуальні фриланс-проєкти в категорії Python
Створення додаткуБажаю створити мобільний додаток для спілкування, в застосунку має бути аудіо,відео дзвінок, створення групових чатів,можливість синхронізувати з контактами телефону, налаштуваннями акаунта: привязка по мейлу, 2фа, номеру телефону,можливість налаштовувати сповіщення… Java, Python ∙ 1 година 42 хвилини тому ∙ 4 ставки |
Налаштування двосторонньої інтеграції WhatsApp з Odoo CRMВітаю! Шукаємо спеціаліста для реалізації технічного завдання з налаштування двосторонньої інтеграції месенджера WhatsApp з CRM-системою Odoo. ⚠️ Важливе технічне уточнення:Офіційний WhatsApp Business API (WABA) не розглядається. Необхідно впровадити стабільне «сіре» рішення… Python, Веб-програмування ∙ 11 годин 37 хвилин тому ∙ 19 ставок |
Парсинг даних через мобільне APIШукаю людину з досвідом парсингу даних через мобільне API, для парсингу e-commerce, rozetka та аналоги Завдання: 1. Перехоплення трафіку мобільного додатку (Android) налаштування проксі, аналіз запитів 2. Визначення потрібних API endpoints, куди йдуть запити, які headers… Python, Парсинг даних ∙ 2 дні 8 годин тому ∙ 30 ставок |
Знайти товарний фід (Google Merchant XML) для сайту на OpenCart
700 UAH
Необхідно знайти пряме посилання на діючий товарний фід (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Знайти оригінальний фідВимоги до результату: Робоче посилання на XML-файл Python, Парсинг даних ∙ 7 днів 17 годин тому ∙ 29 ставок |
Розробка Тік-Ток ферми (контент-завод)Необхідно розробити систему для централізованого управління кількома TikTok-акаунтами з автоматичною публікацією контенту, використанням індивідуальних проксі та імітацією природної активності акаунтів. Функціональні вимоги1. Управління акаунтами Додавання та видалення… Python, Розробка ботів ∙ 8 днів 4 години тому ∙ 22 ставки |


