Парсинг даних через мобільне API
Шукаю людину з досвідом парсингу даних через мобільне API, для парсингу e-commerce, rozetka та аналоги
Завдання:
1. Перехоплення трафіку мобільного додатку (Android) налаштування проксі, аналіз запитів
2. Визначення потрібних API endpoints, куди йдуть запити, які headers використовуються
3. Аналіз авторизації, як додаток отримує токен, як він оновлюється
4. Написання скрипта для автоматичного збору даних через знайдене API
5. Документація пояснити логіку, щоб я міг підтримувати рішення сам
Будь ласка, в описі або в лс напишіть реальні кейси, просто парсинг нам не підходить з технічних причин. Всім заздалегідь дякую
-
Привіт! Завдання знайоме: перехопити трафік Android-додатку через проксі, розібрати endpoints і логіку авторизації з оновленням токена, а потім зібрати на Python стабільний збір даних по rozetka та аналогам. Документацію з поясненням логіки також зроблю, щоб ви могли підтримувати рішення самі. Готовий обговорити деталі та показати кейси в особистих повідомленнях.
-
Привіт, я працював над парсингом API додатка Allo.ua для збору даних про товари - отримав 50,000+ записів щодня через мобільні endpoints
Цікаво, чи потрібно буде обходити rate limiting на Rozetka API, або у вас є особливі вимоги до частоти запитів?
Пропоную зв'язатися, я безкоштовно проконсультую вас з технічної сторони та складемо план розробки + розповім про мою команду!
-
1257 34 0 Звісно, що веб-парсинг не підходить. Там захист від бота. Розетка через Cloudflare працює. По Розетці: є бот, який працює так, як вам потрібно. Усі деталі в особисті повідомлення.
-
500 2 0 Привіт, Макс!
Ознайомився з описом проєкту. Завдання з реверс-інжинірингу мобільного API для e-commerce (Rozetka та аналоги) повністю відповідає моєму профілю. Спеціалізуюсь на Python-автоматизації, розборі мережевих протоколів і створенні стабільних парсерів.
Як я реалізую проєкт:
Перехоплення трафіку: Налаштую проксі-сервер (MITM) для аналізу захищеного трафіку Android-додатку, визначу всі ключові API-ендпоінти та необхідні заголовки (headers).
Аналіз авторизації: Розберу логіку генерації, життя та оновлення токенів, щоб автоматизувати цей процес у скрипті без ризику деавторизації.
Розробка скрипта: Напишу чистий, оптимізований асинхронний скрипт на Python для швидкого та непомітного збору даних.
… Документування: Підготую детальну та зрозумілу інструкцію по логіці роботи рішення, щоб ви могли легко підтримувати його самостійно.
Мої релевантні кейси:
Goszakup Tender Bot: Спроєктував розділену архітектуру з фоновим модулем для постійного підтримання сесій, обходу анти-бот патернів і збереження стану авторизації.
Avia Navigation Data Pipeline: Розробив асинхронну систему збору та валідації даних на FastAPI з ізольованою обробкою помилок для запобігання збоїв.
Маю глибоке розуміння роботи Linux-систем, мережевих процесів і кешування даних. Готовий обговорити деталі в чаті або технічних повідомленнях і оперативно приступити до роботи.
-
427 Вітаю! Завдання абсолютно зрозуміле. "Звичайний" парсинг HTML-коду тут не працює, оскільки веб-версія закрита WAF/Cloudflare, тому ви абсолютно праві - потрібно імітувати запити офіційного мобільного додатку.
Під капотом мобільний API - це стандартні HTTP/HTTPS запити (REST/JSON), і завдання зводиться до правильної еймуляції пристрою.
Мій стек і алгоритм реалізації:
1. Аналіз трафіку: Налаштування зв'язки (підніму Mitmproxy / Charles Proxy) для перехоплення запитів Android-додатку.
2. Обхід захисту: За необхідності розгорну Frida для декомпіляції/обходу SSL Pinning (якщо додаток перевіряє сертифікат безпеки і блокує проксі).
3. Реверс-інжиніринг: Виділення цільових ендпоінтів (каталог, картка товару, ціни), аналіз структури заголовків (headers, User-Agent, device_id) і логіки генерації/оновлення токенів авторизації.
4. Автоматизація: Написання чистого, оптимізованого скрипта на PHP (Laravel HTTP Client / cURL), який буде циклічно збирати дані в обхід будь-яких блокувань, прикидаючись реальним мобільним пристроєм.
… 5. Передача: Оформлю лаконічну документацію (який запит куди летить, які токени оновлювати), щоб ви могли легко підтримувати скрипт.
Досвід роботи з API-інтеграціями та реверсом запитів великий.
Термін: 4-5 днів (з урахуванням часу на розбір можливого SSL Pinning).
-
7123 53 0 Зробив таке для кількох e-commerce проектів: ставив mitmproxy або Charles на Android-пристрої, знімав трафік мобільного додатку і витягував потрібні ендпоінти з заголовками, токенами і параметрами запитів. Розетка зокрема має досить стабільне мобільне API, тож завдання зрозуміле. Питання: потрібен разовий аналіз і документування API, чи одразу потрібен робочий парсер, який буде автоматично відправляти запити? Готовий обговорити обсяг і терміни.
-
1251 35 1 3 Вітаю, зроблю. Вмію сніфити трафік з мобільних додатків. Присилайте повне ТЗ в особисті повідомлення, обговоримо детальніше.
-
328 Добрий день.
Займався збором даних через API та парсингом e-commerce проєктів. Можу розібратися зі структурою запитів застосунку, реалізувати збір потрібних даних і підготувати код у зрозумілому вигляді з поясненнями.
Для оцінки потрібно уточнити, з якого саме сервісу починаємо та які дані потрібно отримувати.
Після цього зможу сказати терміни та вартість.
-
727 6 0 напишіть, яке застосування я проаналізую та оціню
-
2116 20 0 Доброго дня. Завдання зрозумів: потрібен не звичайний парсинг верстки, а збір даних через внутрішнє мобільне API додатку. Тобто перехопити трафік Android-додатку, знайти реальні endpoints та їх заголовки, розібратися, як додаток отримує та оновлює токен авторизації, і на цій основі написати скрипт, який тягне дані безпосередньо через API, плюс документація, щоб ви підтримували рішення самі.
По кроках бачу так. Спочатку ставлю перехоплення трафіку додатку через проксі (mitmproxy або Charles) з підміною сертифіката, при необхідності обхожу certificate pinning, щоб побачити реальні запити. Далі розбираю, які endpoints викликає додаток, які заголовки та підписи передаються, як влаштована авторизація та оновлення токена. Потім відтворюю ці запити в Python вже без додатку, з коректними заголовками та автоматичним оновленням токена, і збираю дані в потрібному вам форматі. В кінці документую логіку запитів та токенів, щоб ви могли самі виправляти, якщо на стороні магазину щось зміниться.
Чому саме через мобільне API, а не парсинг сторінок, мені зрозуміло: внутрішнє API віддає чисті структуровані дані, на ньому менше захисту та капч, ніж на вебі, і він працює стабільніше. З реверс-інжинірингом мобільних та веб API, перехопленням трафіку та відтворенням запитів з токенами в Python працював.
Щоб оцінити точніше: яке додаток або магазини першими в пріоритеті, і які саме дані потрібні (каталог, ціни, залишки, картки товару)? І збір разовий чи регулярний за розкладом?
-
232 Доброго дня! Саме через мобільний API і працюю — піднімаю проксі (mitmproxy/Frida на Android), знімаю реальні запити застосунку, розбираю headers і схему токена (як видається й оновлюється) і вже на цьому пишу збирач напряму до API, без крихкого HTML-парсингу. По rozetka й подібних e-commerce орієнтуюсь. Документацію з логікою лишу, щоб ви могли підтримувати рішення самі. Скільки приблизно товарів і категорій треба знімати за один прогін? Від цього залежить тротлінг і терміни.
-
172 1 1 Доброго дня. Готовий виконати цей проект, маю великий досвід розробки різних додатків.
-
196 ШІ-рішення для такого збору у нас вже є практично готове, можна швидко адаптувати під ваш джерело і обговорити це в переписці біржі, я на зв'язку ))
по термінам я б запропонував перший технічний етап на 5-7 днів - перехоплення трафіку, карта запитів, перевірка авторизації, прототип збору даних через мобільне апі та коротка документація.
дивіться, тут нюанс - важливо, щоб був легальний сценарій доступу і без обходу захисту, інакше рішення може бути крихким і ризикованим.
з подібного досвіду - працювали з маркетплейсами, інтеграціями, моніторингом даних, особистими кабінетами та автоматизацією бізнес-процесів.
документацію зробимо так, щоб ви могли підтримувати рішення самі, плюс можна додати іі-контроль змін апі та сповіщення, якщо джерело змінило відповіді або авторизацію.
уточніть, будь ласка, яке саме android-додаток потрібно аналізувати і які поля по товарам потрібні в першій версії.
ще питання - чи є у вас тестовий акаунт в додатку і приклад бажаної вигрузки.
https://business.ingello.com/prime-eva - схоже по частині e-commerce, складних інтеграцій та виробничих процесів.
https://business.ingello.com/eva - ближче всього по моніторингу маркетплейсів та збору даних.
… https://business.ingello.com/vorfahr - опосередковано близько по saas та іі-автоматизації.
головна сторінка для біржі - https://systems-fl.ingello.com
-
2023 4 0 Привіт!
У мене великий досвід розробки рішень для парсингу та обробки даних (різні джерела, захист від блокувань, автоматизація). Готовий виконати поставлене завдання в найкоротші терміни.
Пропоную обговорити деталі в особистих повідомленнях.
-
738 4 0 Доброго дня. Робив парсинг захищених мобільних додатків Copart.com та getContact.com і багато інших. Дуже добре в цьому розбираюся. Зможу написати, який потрібен парсинг. Пишіть, обговоримо.
-
1970 25 1 Привіт, є досвід у перехопленні мобільного трафіку (не просто емулятор + SSL сертифікати + MITM Proxy), а повноцінне кастомне рішення, для нормального байпасу безпекових інструментів.
Скрапив багато платформ через такий метод (Глово, болт, убер фудс. Раніше навіть твіттер.)
Можу допомогти з вирішенням питання. Напишіть в особисті, обговоримо.
-
4975 41 4 1 Доброго дня!
Маю значний досвід перехоплення та аналізу трафіку мобільних API (Android), зокрема e-commerce платформ. Готовий реалізувати автоматичний парсинг даних з rozetka та аналогічних ресурсів, включаючи розшифровку авторизації та детальну документацію.
Надам реальні кейси роботи з API та проксі в ЛС. Звертайтесь для обговорення деталей.
-
328 Завдання повністю зрозуміле. Звичайний веб-скрейпінг тут дійсно не спрацює, оскільки мобільні додатки (особливо великі e-commerce типу Rozetka) мають зовсім іншу логіку авторизації, захисту та генерації токенів. Готовий реалізувати це завдання на Python.Як саме буде виконано ваш проєкт:Перехоплення трафіку: Налаштую проксі-сервер (Mitmproxy / Charles Proxy) на Android-емуляторі для повного аналізу запитів додатка. Якщо є SSL Pinning — обійду його за допомогою інструментів реверс-інжинірингу (Frida/Objection).Аналіз API: Знайду точні endpoints, виділю необхідні headers, dynamic keys та розберу логіку роботи та оновлення токенів авторизації.Автоматизація: Напишу швидкий асинхронний скрипт на Python (Aiohttp / Requests) для стабільного збору даних через знайдене мобільне API.Документація: Передам вам чистий код із детальними коментарями та інструкцією, щоб ви могли легко підтримувати скрипт самостійно.Маю сертифікат Python Essentials та успішні кейси на платформі. Готовий показати деталі аналогічних рішень в особистих повідомленнях. Напишіть мені, обговоримо деталі!
-
532 3 0 Вітаю! Маю дуже широкий досвіт як в розробці скрейперів так і в самому скрейпінгу.
1. Створимо адекватне ТЗ робіт
2. Реалізую скрейпер. використовуючи технічний стек за вашим бажанням
3. Отримаєте аналіз, данні, які будуть чітко описані та структуровані
Пишіть, обсудимо!
-
2141 85 0 Готовий співпрацювати. Є досвід збору з rozetka по API. ______
-
1168 7 0 Добрий день! Ми маємо досвід роботи з перехопленням трафіку мобільних додатків та аналізом ендпоінтів для парсингу e-commerce платформ. Реалізуємо це через налаштування проксі-серверів, декомпіляцію APK та емуляцію заголовків для обходу захисту. Готові оперативно розпочати аналіз запитів та структуризацію даних.
-
4611 52 1 Привіт, я Python - розробник, маю досвід у розробці парсерів різної складності. Можу виконати ваш проект швидко та якісно. Пишіть - обговоримо деталі. Приступити до роботи готовий вже сьогодні. Є великий досвід роботи з API.
-
1738 9 0 Вітаю. Мій підхід до цього проєкту базуватиметься на глибокому аналізі мобільного трафіку через спеціалізовані проксі-інструменти для ідентифікації прихованих API-ендпоінтів та детального вивчення механізмів авторизації, включно з управлінням токенами. Я розроблю масштабоване та відмовостійке рішення з використанням асинхронних запитів, ефективною обробкою помилок та інтеграцією стратегій для уникнення блокувань, забезпечуючи стабільний збір даних та високу продуктивність. Маю значний досвід у реверс-інжинірингу мобільних API для e-commerce платформ і володію готовими програмними модулями, які суттєво прискорять реалізацію та забезпечать надійність рішення. Фінальний результат буде супроводжуватися чіткою технічною документацією для легкої подальшої підтримки. Всі деталі реалізації, кінцевий бюджет та терміни пропоную обговорити в особистих повідомленнях.
-
2426 20 0 Доброго дня, готовий виконати ваше завдання швидко та якісно. маю великий досвід у створенні різноманітних парсерів. Напишіть у особисті повідомлення обговоримо деталі. Залюбки допоможу)
-
Игорь Т. (спілкування на форумах обмежено до 21 червня)
Если у них вшит ssl в приложуху (ssl pinning вроде) - то перехватить не получится, придется делать патч какой-то на само приложение или что-то еще думать. Мутное дело, но "не попробуешь - не узнаешь". ..
-
Ох уж фантазеры
Актуальні фриланс-проєкти в категорії Python
Power BI
700 UAH
Дашборд працює на гугл сервері, потрібно перенести всю логіку+код Які потрібні скіли: розгортання etl процесів на linux сервері + робота із BigQuery та Postgre Є робочий код, який працює на google, де є сама БД, потрібно перенести на інший сервер, можливо переписати код. Python, Бази даних та SQL ∙ 20 годин 38 хвилин тому ∙ 13 ставок |
Telegram bot для найму/пошуку працівників. Для пошуку роботи
1100 UAH
1. Загальна концепція Створення Telegram-бота для автоматизації підбору персоналу та двостороннього пошуку роботи. Система працює за принципом активного відгуку та взаємного підтвердження інтересу (Double Opt-In). У системі передбачено дві ролі: Роботодавець (Власник фірми) та… Python, Розробка ботів ∙ 2 дні 4 години тому ∙ 90 ставок |
Технічна підтримка веб-платформи (Python/Django)Є працюючий веб-проект, потрібно підтримувати і поступово приводити в порядок, без переписування з нуля. Стек проекту: Backend: Python, Django, Django Rest Framework Frontend: Next.js База даних: PostgreSQL Інфраструктура: AWS (EC2), Nginx Є інтеграції з зовнішніми API… Python, Веб-програмування ∙ 2 дні 6 годин тому ∙ 72 ставки |
Створення додаткуБажаю створити мобільний додаток для спілкування, в застосунку має бути аудіо,відео дзвінок, створення групових чатів,можливість синхронізувати з контактами телефону, налаштуваннями акаунта: привязка по мейлу, 2фа, номеру телефону,можливість налаштовувати сповіщення… Java, Python ∙ 4 дні 5 годин тому ∙ 39 ставок |
Налаштування двосторонньої інтеграції WhatsApp з Odoo CRMВітаю! Шукаємо спеціаліста для реалізації технічного завдання з налаштування двосторонньої інтеграції месенджера WhatsApp з CRM-системою Odoo. ⚠️ Важливе технічне уточнення:Офіційний WhatsApp Business API (WABA) не розглядається. Необхідно впровадити стабільне «сіре» рішення… Python, Веб-програмування ∙ 4 дні 15 годин тому ∙ 26 ставок |