Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak

Віктор Гайоха

Запропонуйте Віктору роботу над вашим наступним проєктом або зареєструйте профіль фрилансера і починайте заробляти просто зараз.

Україна Чернівці, Україна
1 місяць 6 днів тому
Вільний для роботи вільний для роботи
2 Сейфи завершені
2 місяці 1 день тому
2 замовники
вік 29 років
на сервісі 2 роки

Рейтинг

Успішних проєктів
Немає даний
Середня оцінка
Немає даний
Рейтинг
783
Парсинг даних
Python

Рівень володіння мовами

Українська Українська: носій
Русский Русский: просунутий
Polski Polski: середній
English English: базовий

Резюме

Привіт! Я спеціалізуюся на створенні кастомних Python-скриптів, парсерів та автоматизації рутинних бізнес-процесів.

Якщо вам потрібно зібрати базу контактів з сайту, автоматизувати нудну щоденну роботу з таблицями або з'єднати кілька сервісів через API — я розроблю для вас легке, швидке та стабільне рішення.

💻 Мої основні напрямки роботи:

  • Парсинг та збір даних (Web Scraping): Збираю структуровану інформацію з каталогів, маркетплейсів та закритих порталів. Працюю з Python, Playwright, Selenium та BeautifulSoup. Маю успішний досвід обходу складних антибот-систем (Cloudflare, динамічний рендеринг React/Next.js).

  • Розробка скриптів та автоматизація: Скрипти для масового завантаження файлів, автоматизації кліків, обробки Excel-таблиць.

  • API-інтеграції та Telegram: Зв'язування різних платформ між собою, створення Telegram Web Apps та ботів для бізнесу.

  • Обробка даних: Ви ніколи не отримаєте від мене "сирий" брудний код сторінки. Я здаю ідеально чисті, готові до аналітики дані у форматах CSV, JSON або Excel.

🤝 Чому варто працювати зі мною:Мій попередній досвід у B2B продажах та управлінні власним бізнесом дозволяє мені розуміти завдання не лише з технічної сторони, а й з точки зору користі для вашої компанії. Я фокусуюся на чіткій комунікації, дотриманні дедлайнів та результаті, який просто працює так, як треба.

Пишіть у приватні повідомлення — з радістю обговорю деталі вашого проекту та запропоную оптимальне технічне рішення!

Навички та вміння

Портфоліо


  • Парсинг захищеного SPA-сайту, Обхід Cloudflare та антибот-систем

    Парсинг даних
    Мета: Зібрати 100% точні дані про понад 1000 експонентів (назва, країна, номер стенда, приховані email та телефони, категорії) з офіційного сайту Salone del Mobile.

    Головні виклики:

    Агресивний антибот-захист (Cloudflare): Стандартні запити (requests/httpx) повертали 403 Forbidden. Звичайні headless-браузери (Selenium, Playwright) та навіть фреймворки на кшталт undetected-chromedriver миттєво блокувалися.

    Складна SPA-архітектура (React / Next.js): На сайті не було стандартних HTML-посилань (). Уся навігація відбувалася виключно через обробники подій React (onClick), що робило традиційний збір URL неможливим. Крім того, контактні дані були заховані в несемантичних тегах (наприклад, ).
    Моє рішення:
    Щоб досягти ідеальної точності та обійти захист, я розробив кастомний гібридний підхід:

    Підключення через Chrome DevTools Protocol (CDP): Замість запуску нового екземпляра автоматизованого браузера, мій скрипт використовував Playwright для підключення до вже запущеної, "живої" сесії Google Chrome (http://localhost:9222). Це дало 100% "траст-фактор" легітимного користувача (разом із реальними cookies, історією та відбитками Canvas). Cloudflare було обійдено без жодної розв'язаної капчі.

    Інтелектуальна навігація: Скрипт візуально імітував поведінку людини — перехоплював динамічні локатори, фізично клікав мишкою для виклику React-станів та використовував внутрішній роутер сайту для повернення до списку, зберігаючи пагінацію.

    Парсинг HTML: Захоплений стан сторінки оброблявся через BeautifulSoup та складні регулярні вирази (Regex) для точного витягування "битих" або погано відформатованих посилань та номерів телефонів.

    Використані технології:

    Python 3.12

    Playwright (Sync API): взаємодія з DOM та підключення через CDP.

    BeautifulSoup4 & Regex: точний пошук та витягування даних.

    Pandas: структурування та експорт даних у чистий CSV (UTF-8 з BOM) та Excel.

    Результат:
    Скрипт повністю автономно зібрав та ідеально відформатував дані понад 1200 компаній. Створена архітектура дозволяє масштабувати парсинг без ризику отримати бан по IP.
  • Скрапер для генерації B2B лідів (Корпоративні бази даних)

    Парсинг даних
    Мета: Розробити автоматизований веб-скрапер на Python для збору структурованих контактних та фінансових даних потенційних B2B клієнтів з публічних бізнес-каталогів.

    Моє рішення та технічна реалізація:

    Парсинг HTML-таблиць: Скрипт ефективно обходить сторінки каталогів та витягує необхідну інформацію зі складної табличної структури сайтів за допомогою бібліотеки BeautifulSoup.

    Стабільність роботи: Для запобігання блокуванням з боку цільових серверів були налаштовані кастомні HTTP-заголовки (headers), що імітують запити від реального браузера. Це забезпечило безперебійний збір даних під час тривалих сесій.

    Глибоке очищення даних: Зібрана "сира" інформація часто містила зайві символи та артефакти форматування. За допомогою бібліотеки Pandas я реалізував логіку автоматичного очищення ключових метрик. Наприклад, поля "Дохід компанії" (Revenue) та "Кількість співробітників" були програмно очищені від тексту і перетворені на строгі числові значення.

    Підготовка для CRM: Фінальний датасет автоматично експортується у валідному форматі CSV із правильною структурою колонок.

    Використані технології:
    Python, BeautifulSoup, Pandas, HTTP Headers Configuration.

    Результат:
    Замовник отримав повністю автоматизований інструмент для лідогенерації. На виході формується ідеально чистий CSV-файл, який можна миттєво імпортувати в будь-яку CRM-систему без потреби у додатковій ручній обробці чи виправленні помилок форматування.
  • Розширений парсер E-commerce (Selenium та обхід антибот-захисту)

    Парсинг даних
    Мета: Розробити стійкий веб-скрапер для збору актуальних даних про товари в реальному часі з динамічних e-commerce платформ (таких як eBay) для моніторингу цін та аналітики.

    Головні виклики:

    Динамічний контент: Дані завантажувалися через складні JavaScript/AJAX запити, а не просто лежали в HTML.

    Антибот-системи: Платформи використовували просунуті алгоритми для блокування автоматизованих дій.

    Нестабільна верстка: Структура сторінок (DOM) могла змінюватися, через що звичайні жорстко прописані парсери миттєво ламалися б.

    Моє рішення:

    Обхід захисту: Я використав Selenium із гнучкими stealth-конфігураціями webdriver. Щоб скрипт виглядав як жива людина, я додав імітацію природної поведінки (рандомні затримки між кліками, скролінг), що дозволило збирати дані без ризику блокування.

    Стійкість коду (Fallback Selectors): Я впровадив систему динамічних резервних селекторів. Якщо інтернет-магазин незначно змінював дизайн або верстку, скрипт не падав з помилкою, а автоматично переходив на запасний варіант пошуку елемента і продовжував роботу.

    Автоматична навігація: Налаштовано надійну пагінацію, що дозволило автономно зібрати сотні лістингів із безлічі сторінок за один запуск.

    Глибока очистка даних: Сирі дані з інтернет-магазинів часто містять сміття. Я застосував регулярні вирази (Regex) для очищення тексту (наприклад, виділення чистої ціни без валюти і пробілів) та Pandas для сортування фінального датасету за зростанням ціни.

    Використані технології: Python, Selenium (Stealth), Pandas, Regex (Регулярні вирази).

    Результат:
    Замовник отримав не просто скрипт, а надійний інструмент. На виході — ідеально відформатовані, відсортовані та готові до продакшену CSV-файли, які можна одразу завантажувати в аналітичні системи чи бази даних.

Відгуки та компліменти про виконані проєкти 2

Якість
Професіоналізм
Вартість
Контактність
Терміни

Неймовірно задоволений співпрацею! Дуже крутий підхід, виконавець не просто чекає вказівок, а сам проявляє ініціативу та знаходить оптимальні шляхи вирішення складних питань. Завжди на зв'язку, миттєво відповідає, комунікація на висоті. Професіонал, який справді розуміється на своїй справі. Зробив усе швидко, якісно і з розумом. Однозначно буду звертатися знову!

Якість
Професіоналізм
Вартість
Контактність
Терміни

Дякую велике!
Чудовий виконавець - зробив все швидко і чітко
Супер підтримка - йде на зустріч - отримали навіть більше, ніж було вказано в ТЗ
Будемо ще працювати!

Профіль видалено | Сейф Сейф | Відгук у відповідь

Активність

  Останні ставки 10
Парсинг PDF банківських виписок
3000 UAH
Парсер PDF-книг (текст + зображення)
10 000 UAH
Розробка ШІ-асистента для автоматизованого контролю та аналітики дзвінків
17 500 UAH
Телеграм Сценарій
6657 UAH
Чат-бот телеграм для запису в студію дітейлингу
3000 UAH
Потрібно зібрати та запустити 10 сайтів за допомогою ШІ
2500 UAH
Парсинг світлин товарів для інтернет-магазину
8360 UAH
Парсинг даних товарів з сайту постачальника
2000 UAH
Автоматика/Софт для считывания PUSH-увідомлень банку (P2P, крипта, банки)
4500 UAH
Зробити парсер з алегро по ніші спецтехніки
15 000 UAH