Оптимізувати парсинг
Оптимізувати парсинг і запропонувати рішення:
1/ Google Sheets - відбувається зупинка (або оптимізувати, або написати під збереження в файл)
2/ Збереження в файл/SQLITE
Все повинно працювати 24/7
Додатки 1
-
Привіт!
Переглянув код — проблема зрозуміла.
Google Sheets зупиняється через rate limit API: update_full_statistics
викликається при кожному новому рядку і робить 20+ запитів підряд.
Google дозволяє ~60 запитів/хвилину — звідси і зупинки.
Що зроблю:
… 1. Батчинг Sheets-запитів — накопичую рядки, пишу раз на N секунд
2. SQLite як основне локальне сховище (замість CSV)
3. Sheets оновлюється асинхронно, не блокуючи парсинг
4. Робота 24/7 без зупинок
Готовий починати зараз.
-
Доброго дня. Подивився скрипт — проблема в Google Sheets API (ліміт 429) і відсутності авто-рестарту Selenium при падінні. Додам SQLite як основне сховище, батчевий запис у Sheets і watchdog-loop — все за 700 грн, зроблю сьогодні.
-
Доброго дня, зроблю все швидко та якісно, роблю найкращі парсери, ціна 500 грн.
-
Оскільки Google Sheets має ліміти на запис пропоную писати в локальний файл або SQLITE
Готовий прямо зараз переписати скрипт
-
Привіт, я працював над оптимізацією парсингу для e-commerce платформи з 50,000+ товарів щодня - зменшив час обробки на 70% та впровадив стабільне збереження в SQLite
Чому зараз відбувається зупинка Google Sheets - через ліміти API чи великий об'єм даних?
Пропоную зв'язатися, я безкоштовно проконсультую вас з технічної сторони та складемо план розробки + розповім про мою команду!
-
423 2 0 Вітаю Alex!
Пишу парсинг на python.
Можу вам з цим допомогти.
-
288 Доброго дня!
Переглянув задачу — проблема не в парсингу, а в архітектурі: у коді занадто часті звернення до Google Sheets (кілька API-запитів кожні кілька секунд), через що спрацьовують ліміти і система зупиняється.
Можу виправити:
зробити буферизацію записів
перенести основне збереження в SQLite/CSV
залишити Google Sheets тільки для періодичної синхронізації
налаштувати стабільну роботу 24/7 без зависань
Готовий реалізувати швидко та зробити систему надійною. Можемо обговорити деталі.
-
327 Доброго дня! Готовий оптимізувати ваш парсинг під стабільну роботу 24/7. Вирішу проблему з Google Sheets (зупинки/ліміти) — або оптимізую запис через батчинг і кеш, або переведу збереження на файл/SQLite для максимальної надійності. Налаштую ефективний пайплайн збору даних з обробкою помилок, логуванням і авто-рестартом при збоях. У результаті отримаєте стабільну систему без втрат даних, яка працює безперервно. Можу також запропонувати масштабування під великі обсяги. Готовий обговорити деталі та одразу приступити.
-
586 5 0 Вітаю! Проблема зупинки Google Sheets при парсингу 24/7 мені добре знайома — це наслідок перевищення квот (Rate Limits) та нестабільності мережі. Я готовий оптимізувати ваш софт, зробивши його по-справжньому автономним.
-
295 Доброго дня!
Проблема зрозуміла — перевантаження Google Sheets і відсутність буферизації даних, через це система нестабільна 24/7.
Можу вирішити:
SQLite або файловий буфер замість постійних записів
batch-відправка в Google Sheets для зниження навантаження
черга даних між парсингом і записом
… оптимізація перерахунку статистики
авто-restart Selenium при збоях
Є досвід з Selenium і завданнями парсингу/автоматизації.
CV можу надати за необхідності.
-
256 Вітаю! Маю досвід оптимізації парсингу з Google Sheets (причини зупинок: ліміт запитів, таймаути, великий обсяг даних). Рішення: винести зберігання в SQLite або CSV-файли з ротацією, налаштувати повторні спроби при помилках, зробити логування для моніторингу 24/7. Можу переписати логіку на збереження в файл або SQLite з автопідключенням. Деталі обговоримо після перегляду поточного коду. Працюю на довгостроково. Чекаю в особистих!
-
2163 14 0 1 Вітаю! Я індивідуальний розробник із 4-річним досвідом в автоматизації (n8n, Python) та роботі з великими даними, тому оптимізую ваш парсинг, перевівши його з нестабільних Google Sheets на відмовостійку архітектуру з використанням SQLite або локального збереження у файли. Я усуну проблему зупинок через ліміти API, налаштую ротацію логів та забезпечу стабільну роботу 24/7 на VPS через PM2 або Docker, щоб процеси не переривалися; працюю через ФОП і готовий розробити надійну схему збереження даних уже сьогодні. Мої роботи: https://3magency.co/, https://jk-solution.com.ua/, https://farfieworldwide.com/,
Behance.
-
2264 18 3 Вітаю. Ваш поточний скрипт зупиняється через те, що використовує Google Sheets не за призначенням: при кожному оновленні він намагається перерахувати весь масив даних, впираючись у таймаути та жорсткі ліміти API. Для стабільної роботи 24/7 я зміню логіку збереження. Усю важку історію парсингу переведу в легку локальну базу даних, щоб розблокувати роботу Selenium, а в Google Sheets передаватиму виключно оновлену статистику та невеликий зріз останніх ігор суто для візуалізації. Це повністю зніме зайве навантаження з мережі, скрипт перестане висіти в очікуванні відповіді від Google і працюватиме автономно. Готовий реалізувати цю архітектуру швидко та без тотального переписування Вашого основного коду.
-
106 Доброго дня. Подивився задачу і сам підхід тут бачу досить зрозумілим: проблема, скоріше за все, не тільки в парсингу, а в зв'язці з Google Sheets і збереженням даних. Можу швидко розібрати поточну логіку, прибрати вузьке місце і привести це до більш стабільної схеми, щоб воно працювало нормально 24/7. Якщо по коду виявиться, що краще перенести зберігання в SQLite або файл, теж зроблю без зайвого ускладнення.
-
764 5 1 Доброго дня.
Готовий зайнятися оптимізацією. Маю досвід з парсерами, які повинні працювати стабільно 24/7, і з такими завданнями я зазвичай спочатку усуваю вузькі місця в архітектурі, а не просто “підкручую таймінги”.
За вашим поточним скриптом вже видно, що проблема, швидше за все, не тільки в самому парсингу, а в зв'язці Selenium + постійні записи/оновлення в Google Sheets + перерахунок статистики на льоту. У такому вигляді це дійсно може зупинятися або деградувати з часом.
Що можу запропонувати:
— перевести збереження в локальну SQLite / файл як основне джерело;
— винести Google Sheets в окрему синхронізацію партіями, а не в критичний потік;
… — стабілізувати цикл роботи 24/7;
— за необхідності спростити/переписати проблемну частину, щоб рішення було надійнішим.
Можу швидко переглянути поточну реалізацію і запропонувати нормальний робочий варіант без зайвого ускладнення.
-
588 2 0 Вітаю.
Переглянув ваш скрипт і бачу, що проблема сидить не лише в парсингу. У поточному циклі скрипт одночасно читає таблицю History, пише нові рядки в Google Sheets, потім знову читає Results для контролю обсягу і ще окремо перераховує всю статистику по історії. Через таку схему процес починає впиратися в часті звернення до Sheets API і стає нестабільним при довгій роботі.
Я б зайшов у це як у задачу на стабілізацію 24/7 режиму: спочатку знайти вузьке місце в ланцюжку парсинг → збереження → оновлення статистики, далі акуратно розділити гарячий цикл і фоновые оновлення, щоб скрипт не зупинявся на тривалому прогоні. Окремо перевірю, що саме дає найбільше навантаження — запис у таблицю, trim старих рядків чи повний перерахунок статистики.
ПРоблему вже бачу і можу дати робоче рішення без зайвого переписування всього проєкту.
-
172 1 1 Привіт! Готовий виконати цей проект, маю великий досвід розробки різних додатків.
-
1251 35 1 3 Пробігся очима по коду, зроблю легко. Зроблю прямо зараз.
-
434 9 0 Вітаю. Код переглянув, бачу місця де можна покращити. Буду радий допомогти, звертайтесь.
-
265 Доброго дня!
Є досвід оптимізації парсерів, роботи з Google Sheets, файлами та SQLite, а також переведення подібних процесів на більш стабільне зберігання даних для постійної роботи.
Займався завданнями, де потрібно було прибрати зупинки, знизити навантаження на Google Sheets та вибудувати більш надійну схему збереження з розрахунком на безперервну роботу 24/7.
Пропоную обговорити деталі, а також вартість і терміни в особистих повідомленнях.
-
530 2 0 Вітаю! Бачу проблеми у зависанні через часті звернення до Google Sheets та перевантажений парсинг Selenium (повторні пошуки елементів, sleep, обробка stale-елементів), тому пропоную оптимізувати збір даних (очікування через WebDriverWait, зменшення звернень до DOM), додати буферизацію та batch-запити для Sheets або винести збереження в SQLite/файл, що суттєво підвищить швидкість і стабільність роботи.
-
115 34 4 2 Зроблю на js або kotlin, встановимо на vps і буде працювати 24/7. Якщо прикладений скрипт вже працює, то можна поставити на vps його.
-
10130 117 0 Доброго дня.
Є досвід з гугл таблицями. Можу написати для вас скрипт. Пишіть, обговоримо.
-
404 1 0 Маю досвід з парсерами. Готовий в особистих запропонувати рішення та виправити/переписати ваш код. Поправки і доопрацювання вашого скрипта безкоштовні.
Швидко та недорого. Чекатиму на нашу співпрацю
-
6396 74 1 Доброго дня. Маю великий досвід в парсингу та запису гугл таблиці, також різних баз даних.
Потрібно більш детальний опис помилок, або того що саме там потрібно збирати.
Судячи зі скрипта, парсинг по хтмл тегам, це саме по собі не стабільно.
В таблиці можна одним записом писати одразу багато даних, так обходити лімити.
Звкпиайтесь, обговоремо.
Ціна та термін умовні.
-
3411 32 0 Вітаю!
Перепишу ваш скрипт під ваші потреби.
Звертайтесь за деталями в особисті
-
93808 1266 1 10 Вітаю.Є великий досвід з Python.Готовий змінити спосіб зберігання данних на SQLite.
-
4987 41 4 1 Доброго дня!
Готовий оптимізувати ваш парсинг. Вирішу проблему зупинок у Google Sheets або запропоную альтернативне збереження даних у файл/SQLite, забезпечивши стабільну роботу 24/7. Маю великий досвід з API, Google Sheets та базами даних.
Напишіть мені, обговоримо деталі.
-
726 9 1 Привіт! Ваш проект виглядає дуже цікавим. Я готовий розпочати роботу негайно і забезпечити високу якість.
-
1052 6 0 Ми можемо оптимізувати ваш парсинг під постійну роботу 24/7. Готові запропонувати кілька рішень: перенести збереження даних із Google Sheets у локальний файл або SQLite — це усуне проблему зупинки скриптів і значно підвищить стабільність. Також налаштуємо автоматичне відновлення роботи парсера у разі помилок, моніторинг та логування. Всі процеси будуть працювати на окремому сервері під наглядом системи безперебійного контролю. Готові взяти це на себе як комплексний супровід.
Актуальні фриланс-проєкти в категорії Бази даних та SQL
Створити дашборд у https://airtable.com/ по результативності рекламних креативів з facebook adsПовноцінне ТЗ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Бази даних та SQL, Парсинг даних ∙ 14 годин 47 хвилин тому ∙ 12 ставок |
Вайбкодин через Claude Code
15 533 UAH
Розробити закриту веб-платформу для корпоративних заходів з персональними запрошеннями через унікальні посилання та QR-коди. Після сканування QR-коду користувач потрапляє на персональну сторінку запрошення з привітальним повідомленням, зверненням по імені, фото та повідомленням… AI у дизайні, Бази даних та SQL ∙ 17 годин 56 хвилин тому ∙ 39 ставок |
Потрібен розробник для парсингу каталогу та автоматизації імпорту данихПодробне ТЗ в прикріпленому документі прошу в відповіді вказати орієнтовну вартість і терміни реалізації чи є досвід роботи з парсингом великих каталогів які можливі складнощі або обмеження ви бачите в даному завданні Бази даних та SQL, Парсинг даних ∙ 21 година 48 хвилин тому ∙ 33 ставки |
Потрібен Power BI спеціаліст для побудови управлінської звітності на базі BAS Бухгалтерія КОРППро компаніюМи є дистриб’ютором міжнародних спортивних брендів в Україні. Облік ведеться в BAS Бухгалтерія КОРП.Шукаємо спеціаліста, який допоможе побудувати систему управлінської звітності для керівництва компанії на базі Power BI.Важливо: нас цікавить не просто візуалізація… Бази даних та SQL, Бухгалтерські послуги ∙ 4 дні 22 години тому ∙ 6 ставок |
Технічне завдання: Інтеграція чат-бота Telegram з BAS1. Загальний опис Необхідно реалізувати інтеграцію чат-бота з системою BAS для передачі та запису даних про товари (замовлення). 2. Вхідні дані (що передає чат-бот): ID групи Назва товару (з кодом товару) Ціна товару 3. Логіка роботи: При натисканні накнопку Замовити Чат-бот… Автоматизація управління підприємством, Бази даних та SQL ∙ 5 днів 1 година тому ∙ 19 ставок |