Віктор Гайоха
Рейтинг
Рівень володіння мовами
Резюме
Привіт! Я спеціалізуюся на створенні кастомних Python-скриптів, парсерів та автоматизації рутинних бізнес-процесів.
Якщо вам потрібно зібрати базу контактів з сайту, автоматизувати нудну щоденну роботу з таблицями або з'єднати кілька сервісів через API — я розроблю для вас легке, швидке та стабільне рішення.
💻 Мої основні напрямки роботи:
Парсинг та збір даних (Web Scraping): Збираю структуровану інформацію з каталогів, маркетплейсів та закритих порталів. Працюю з Python, Playwright, Selenium та BeautifulSoup. Маю успішний досвід обходу складних антибот-систем (Cloudflare, динамічний рендеринг React/Next.js).
Розробка скриптів та автоматизація: Скрипти для масового завантаження файлів, автоматизації кліків, обробки Excel-таблиць.
API-інтеграції та Telegram: Зв'язування різних платформ між собою, створення Telegram Web Apps та ботів для бізнесу.
Обробка даних: Ви ніколи не отримаєте від мене "сирий" брудний код сторінки. Я здаю ідеально чисті, готові до аналітики дані у форматах CSV, JSON або Excel.
🤝 Чому варто працювати зі мною:Мій попередній досвід у B2B продажах та управлінні власним бізнесом дозволяє мені розуміти завдання не лише з технічної сторони, а й з точки зору користі для вашої компанії. Я фокусуюся на чіткій комунікації, дотриманні дедлайнів та результаті, який просто працює так, як треба.
Пишіть у приватні повідомлення — з радістю обговорю деталі вашого проекту та запропоную оптимальне технічне рішення!
Навички та вміння
Портфоліо
-
Парсинг захищеного SPA-сайту, Обхід Cloudflare та антибот-систем
Парсинг данихМета: Зібрати 100% точні дані про понад 1000 експонентів (назва, країна, номер стенда, приховані email та телефони, категорії) з офіційного сайту Salone del Mobile.
Головні виклики:
… Агресивний антибот-захист (Cloudflare): Стандартні запити (requests/httpx) повертали 403 Forbidden. Звичайні headless-браузери (Selenium, Playwright) та навіть фреймворки на кшталт undetected-chromedriver миттєво блокувалися.
Складна SPA-архітектура (React / Next.js): На сайті не було стандартних HTML-посилань (). Уся навігація відбувалася виключно через обробники подій React (onClick), що робило традиційний збір URL неможливим. Крім того, контактні дані були заховані в несемантичних тегах (наприклад, ).
Моє рішення:
Щоб досягти ідеальної точності та обійти захист, я розробив кастомний гібридний підхід:
Підключення через Chrome DevTools Protocol (CDP): Замість запуску нового екземпляра автоматизованого браузера, мій скрипт використовував Playwright для підключення до вже запущеної, "живої" сесії Google Chrome (http://localhost:9222). Це дало 100% "траст-фактор" легітимного користувача (разом із реальними cookies, історією та відбитками Canvas). Cloudflare було обійдено без жодної розв'язаної капчі.
Інтелектуальна навігація: Скрипт візуально імітував поведінку людини — перехоплював динамічні локатори, фізично клікав мишкою для виклику React-станів та використовував внутрішній роутер сайту для повернення до списку, зберігаючи пагінацію.
Парсинг HTML: Захоплений стан сторінки оброблявся через BeautifulSoup та складні регулярні вирази (Regex) для точного витягування "битих" або погано відформатованих посилань та номерів телефонів.
Використані технології:
Python 3.12
Playwright (Sync API): взаємодія з DOM та підключення через CDP.
BeautifulSoup4 & Regex: точний пошук та витягування даних.
Pandas: структурування та експорт даних у чистий CSV (UTF-8 з BOM) та Excel.
Результат:
Скрипт повністю автономно зібрав та ідеально відформатував дані понад 1200 компаній. Створена архітектура дозволяє масштабувати парсинг без ризику отримати бан по IP.
-
Скрапер для генерації B2B лідів (Корпоративні бази даних)
Парсинг данихМета: Розробити автоматизований веб-скрапер на Python для збору структурованих контактних та фінансових даних потенційних B2B клієнтів з публічних бізнес-каталогів.
Моє рішення та технічна реалізація:
… Парсинг HTML-таблиць: Скрипт ефективно обходить сторінки каталогів та витягує необхідну інформацію зі складної табличної структури сайтів за допомогою бібліотеки BeautifulSoup.
Стабільність роботи: Для запобігання блокуванням з боку цільових серверів були налаштовані кастомні HTTP-заголовки (headers), що імітують запити від реального браузера. Це забезпечило безперебійний збір даних під час тривалих сесій.
Глибоке очищення даних: Зібрана "сира" інформація часто містила зайві символи та артефакти форматування. За допомогою бібліотеки Pandas я реалізував логіку автоматичного очищення ключових метрик. Наприклад, поля "Дохід компанії" (Revenue) та "Кількість співробітників" були програмно очищені від тексту і перетворені на строгі числові значення.
Підготовка для CRM: Фінальний датасет автоматично експортується у валідному форматі CSV із правильною структурою колонок.
Використані технології:
Python, BeautifulSoup, Pandas, HTTP Headers Configuration.
Результат:
Замовник отримав повністю автоматизований інструмент для лідогенерації. На виході формується ідеально чистий CSV-файл, який можна миттєво імпортувати в будь-яку CRM-систему без потреби у додатковій ручній обробці чи виправленні помилок форматування.
-
Розширений парсер E-commerce (Selenium та обхід антибот-захисту)
Парсинг данихМета: Розробити стійкий веб-скрапер для збору актуальних даних про товари в реальному часі з динамічних e-commerce платформ (таких як eBay) для моніторингу цін та аналітики.
Головні виклики:
… Динамічний контент: Дані завантажувалися через складні JavaScript/AJAX запити, а не просто лежали в HTML.
Антибот-системи: Платформи використовували просунуті алгоритми для блокування автоматизованих дій.
Нестабільна верстка: Структура сторінок (DOM) могла змінюватися, через що звичайні жорстко прописані парсери миттєво ламалися б.
Моє рішення:
Обхід захисту: Я використав Selenium із гнучкими stealth-конфігураціями webdriver. Щоб скрипт виглядав як жива людина, я додав імітацію природної поведінки (рандомні затримки між кліками, скролінг), що дозволило збирати дані без ризику блокування.
Стійкість коду (Fallback Selectors): Я впровадив систему динамічних резервних селекторів. Якщо інтернет-магазин незначно змінював дизайн або верстку, скрипт не падав з помилкою, а автоматично переходив на запасний варіант пошуку елемента і продовжував роботу.
Автоматична навігація: Налаштовано надійну пагінацію, що дозволило автономно зібрати сотні лістингів із безлічі сторінок за один запуск.
Глибока очистка даних: Сирі дані з інтернет-магазинів часто містять сміття. Я застосував регулярні вирази (Regex) для очищення тексту (наприклад, виділення чистої ціни без валюти і пробілів) та Pandas для сортування фінального датасету за зростанням ціни.
Використані технології: Python, Selenium (Stealth), Pandas, Regex (Регулярні вирази).
Результат:
Замовник отримав не просто скрипт, а надійний інструмент. На виході — ідеально відформатовані, відсортовані та готові до продакшену CSV-файли, які можна одразу завантажувати в аналітичні системи чи бази даних.
Відгуки та компліменти про виконані проєкти 2
7 квітня
8360 UAH
Парсинг світлин товарів для інтернет-магазину
Неймовірно задоволений співпрацею! Дуже крутий підхід, виконавець не просто чекає вказівок, а сам проявляє ініціативу та знаходить оптимальні шляхи вирішення складних питань. Завжди на зв'язку, миттєво відповідає, комунікація на висоті. Професіонал, який справді розуміється на своїй справі. Зробив усе швидко, якісно і з розумом. Однозначно буду звертатися знову!
Дякую велике!
Чудовий виконавець - зробив все швидко і чітко
Супер підтримка - йде на зустріч - отримали навіть більше, ніж було вказано в ТЗ
Будемо ще працювати!
![]()
| Відгук у відповідь
Активність
| Останні ставки 10 | Бюджет | Додано | Терміни | Ставка | |
|---|---|---|---|---|---|
|
Парсинг PDF банківських виписок
3000 UAH
|
|||||
|
Парсер PDF-книг (текст + зображення)
10 000 UAH
|
|||||
|
Розробка ШІ-асистента для автоматизованого контролю та аналітики дзвінків
17 500 UAH
|
|||||
|
Телеграм Сценарій
6657 UAH
|
|||||
|
Чат-бот телеграм для запису в студію дітейлингу
3000 UAH
|
|||||
|
Потрібно зібрати та запустити 10 сайтів за допомогою ШІ
2500 UAH
|
|||||
|
Парсинг світлин товарів для інтернет-магазину
8360 UAH
|
|||||
|
Парсинг даних товарів з сайту постачальника
2000 UAH
|
|||||
|
Автоматика/Софт для считывания PUSH-увідомлень банку (P2P, крипта, банки)
4500 UAH
|
|||||
|
Зробити парсер з алегро по ніші спецтехніки
15 000 UAH
|