Serhii D.
Рейтинг
Резюме
Привіт! Я Python-розробник, який автоматизує вашу рутину та збирає будь-які дані з мережі.
Якщо вам потрібно спарсити інтернет-магазин, зібрати базу контактів, налаштувати щоденний моніторинг цін або автоматизувати дії в браузері — я готовий допомогти.
🛠️ Мій технологічний стек:
Мова: Python
Бібліотеки та інструменти: Playwright, Requests, BeautifulSoup, JSON
Робота з даними: Експорт в Excel (xlsx), CSV, JSON
Додатково: Налаштування проксі, обхід лімітів пагінації сторінок, робота з Git/GitHub
📂 Моє портфоліо:Усі мої роботи відкриті та лежать на GitHub. Серед них — складні скрапери для міжнародних маркетплейсів, що працюють стабільно й без збоїв. Посилання на код надам у першому ж повідомленні.
Гарантую чистий код, дотримання дедлайнів та підтримку скрипта після здачі роботи. Готовий розпочати прямо зараз!
Навички та вміння
Портфоліо
-
800 UAH Rozetka скрейпінг
Парсинг данихНадійний веб-скрейпер, готовий до використання у виробничому середовищі, призначений для вилучення даних про ноутбуки з найбільшої української платформи електронної комерції (Rozetka.ua), з автоматичною синхронізацією у хмарі та вдосконаленим обходом антибот-систем.
Ключові технічні особливості:
… Cloudflare та обхід ботів: На базі Playwright та playwright-stealth для імітації реальної поведінки людини, що дозволяє успішно обходити суворі антибот-системи та капчі Turnstile.
Відмовостійка архітектура: Інтегрована з базою даних SQLite для відстеження прогресу скрейпінгу сторінка за сторінкою. Якщо скрипт переривається або виходить з ладу, він автоматично відновлює роботу з тієї самої останньої сторінки.
Автоматична синхронізація з хмарою: Пряма інтеграція з API Google Sheets (gspread) для вивантаження та форматування даних у реальному часі.
Розумна фільтрація: Попередньо налаштовані фільтри бекенду (SSD 1 ТБ, ціна < 25 000 грн, конкретні провідні бренди).
Технологічний стек: Python 3.10+, Playwright, Playwright-Stealth, SQLite, API Google Sheets.
Цей проект демонструє чітку архітектуру коду, правильну інтеграцію API, відстеження стану бази даних та професійні навички веб-автоматизації.
-
1500 UAH ebay скрейпінг
Парсинг данихАсинхронний скрейпер для ноутбуків на eBay, створений на базі Python, Playwright, SQLite та API Google Sheets.
Цей проєкт автоматично збирає дані про ноутбуки з eBay, використовуючи динамічне відтворення сторінок через проксі-API Scrape.do. Скрейпер витягує детальну інформацію про товари, таку як назва, ціна, стан, вартість доставки, місцезнаходження продавця, кількість проданих одиниць, відгуки про продавця, статус відремонтованого товару та URL-адресу товару.
… Функції:
- Асинхронний скрейпінг за допомогою Playwright
- Динамічне рендеринг JavaScript
- Інтеграція проксі-API
- Автоматична обробка пагінації
- База даних SQLite для відстеження прогресу сторінки
- Автоматизація експорту в Google Sheets
- Продовження скрейпінгу з збереженої сторінки
- Витяг структурованих даних про товар
Технологічний стек:
- Python
- Playwright
- AsyncIO
- Requests
- SQLite
- API Google Sheets
- gspread
- dotenv
Робочий процес:
1. Завантаження змінних середовища
2. Ініціалізація бази даних SQLite
3. Завантаження відтворених сторінок eBay через Scrape.do
4. Аналіз карток товарів
5. Витяг даних про товари
6. Збереження товарів у Google Sheets
7. Збереження поточного прогресу сторінки
8. Продовження до повного скрейпінгу всіх сторінок
Проєкт призначений для масштабованих завдань скрейпінгу та автоматизації в електронній комерції.
-
800 UAH Обхід reCaptcha за допомогою бота на Python
Розробка ботівБот для обходу аудіо-reCAPTCHA
Інструмент автоматизації на Python, який автоматично вирішує завдання Google reCAPTCHA v2 — ручне введення даних не потрібне.
… Бот запускає справжній браузер Chromium, імітує поведінку людини з випадковими затримками та обходить механізми виявлення ботів. Коли з’являється reCAPTCHA, він переходить до аудіозавдання, завантажує аудіофайл і транскрибує його за допомогою Google Speech Recognition — а потім миттєво надсилає відповідь.
Технологічний стек:
• Playwright — автоматизація безголовного браузера
• pydub + SpeechRecognition — обробка аудіо та транскрипція
• Захист від виявлення: вимкнений прапор AutomationControlled, підроблений User-Agent, перезапис navigator.webdriver
Особливості:
• Повністю автоматизоване вирішення від початку до кінця
• Взаємодія, схожа на людську (випадкові затримки, справжній браузер)
• Чистий модульний код — легко інтегрується у ваш проєкт
• Протестовано на офіційній демо-версії Google reCAPTCHA
-
750 UAH Amazon Скрейпінг
Парсинг данихІнтеграція з Google Sheets у режимі реального часу: використовує gspread та Batch API для синхронізації даних безпосередньо з хмарою без перевищення лімітів частоти запитів.
Збереження стану: вбудована база даних SQLite для відстеження прогресу, що дозволяє скрипту продовжувати роботу з останньої сторінки у разі переривання.
… Захист від ботів: реалізовано власні заголовки, User-Agents та затримки, що імітують поведінку людини, для забезпечення стабільного вилучення даних.
Автоматизована очистка даних: очищені та структуровані дані, включаючи URL-адреси, заголовки, варіанти, рейтинги та ціни.
-
750 UAH Otodom скрейпінг
Парсинг данихРозроблено надійний, готовий до впровадження інструмент автоматизації на Python, спеціально призначений для вилучення великих обсягів даних із сайту Otodom.pl. Цей проєкт демонструє високий рівень компетентності в галузі автоматизації браузерів, управління базами даних та структурування даних.
Ключові технічні особливості:
Постійний стан вилучення даних: інтегровано бекенд бази даних SQLite3 для відстеження прогресу вилучення даних. Це дозволяє скрипту запам'ятовувати останню оброблену сторінку, забезпечуючи миттєве відновлення роботи після перерв — критично важлива функція для надійного вилучення даних.
…
Розширена автоматизація браузера: використано Playwright для обробки динамічного контенту, обходу спливаючих вікон з запитом на згоду на використання файлів cookie та імітації людської взаємодії за допомогою плавного прокручування та випадкових затримок.
Чистий конвеєр даних: автоматично витягує та очищає складні поля, включаючи назву, ціну, ціну за м², площу, кількість кімнат та місцезнаходження.
Експорт у реальному часі: розроблено систему безперервного експорту даних, яка зберігає результати в Excel (.xlsx) після кожної сторінки, щоб запобігти втраті даних.
Якість коду: Розроблено з використанням підходу об'єктно-орієнтованого програмування (ООП) для максимальної зручності обслуговування та масштабованості.
Технічний стек:
Бекенд: Python
Автоматизація: Playwright (Chromium)
-
700 UAH Auto.ria скрейпінг
Парсинг данихУспішно зібрано та структуровано дані щодо всього українського автомобільного ринку з ресурсу AUTO.RIA.
Основні результати:
Витягнуто детальну інформацію щодо всіх оголошень про продаж автомобілів у країні.
… Структуровано складні необроблені дані у вигляді чіткої професійної таблиці Excel (XLSX) для аналізу ринку.
Впроваджено високошвидкісний асинхронний скрейпінг для обробки великих обсягів даних.