Необхідно розпарсити пдф файл
Необхідно розпарсити пдф файл в exel таблицю за прикладом https://docs.google.com/spreadsheets/d/1bGOybbQaQ0_Wq5ccjQfpvHfr0iz8ePdI9r2i_IJakYY/edit?usp=sharing
Відповідність і назви категорій і підкатегорій можна дивитися на сайті https://balluff-ua.com/product
Далі ці дані будуть заливатися на сайт,
Зараз там проблема, багато товарів не відповідають своїй категорії, є SQL база з правильною компоновкою, але це буде другою задачею окремо оціненою і сформульованою
По парсингу, там проблема, не всі колонки симетричні, можна поки взяти за пріоритет і розпарсити тільки:
категорію Датчики (SENSORS) та її підкатегорії
підкатегорії
- Індуктивні датчики (Inductive ...)
- Ємнісні датчики (Capasitive)
- і так далі відповідно до цієї сторінки https://balluff-ua.com/product/datchiki
Додатки 2
-
Добрий день. Непросте завдання, але виключно через потребу мапінгу категорій без конкретних вказівок про це. Якщо буде детальна інструкція або альтернативний спосіб, ціна буде меншою.
Буду радий співпраці! -
Доброго дня
пропарсив кусок https://docs.google.com/spreadsheets/d/1VrUl-Fax9QFm9W7DfT-VU6OYzqEn1UxUAWqwAzPA1dA/edit?gid=0#gid=0
так?
Відпишіться
-
Вітаю! Займаюсь розробкою парсерів понад 3 роки. Зможу розпарсити ваші файли згідно з інструкціями.
Сьогодні готовий почати працювати, і завтра надати готовий результат
-
315 Готовий приступити до роботи в любий час терміни та вартість можемо обговорити відпишіть і я нвдішлю контакти для зв'язку
-
138 Доброго дня! Готовий реалізувати парсинг вашого PDF-файлу на мові C#. Маю досвід роботи з регулярними виразами (Regex) для точного витягування даних. На виході надам структурований результат (JSON/Excel/Текст). Працюю через Сейф.
-
294 1 0 Євгене, добрий день!
Вивчив ваш PDF-прайс, приклад таблиці та структуру сайту balluff-ua.com
Що саме я зроблю:
1. Синхронізація з сайтом: Я проаналізую дерево категорій на balluff-ua.com/product і налаштуваю скрипт так, щоб дані з PDF автоматично співвідносилися з потрібними розділами сайту (Датчики -> Індуктивні датчики тощо). У колонках А і B у вас буде ідеальний порядок для імпорту.
2. Вирішення проблеми «кривих» колонок: Для витягування даних використовую координатний метод (бібліотека pdfplumber). Це дозволить коректно розділити «Part number», «Ordering code» та «Price», навіть якщо в PDF текст зміщений або колонки мають різну ширину.
3. SQL-сумісність: Ви отримаєте файл (Excel/CSV), в якому дані вже структуровані під вашу SQL-базу, що виключить помилки при заливці на сайт.
Моя перевага: Я не просто копіюю текст, а створюю алгоритм, який «розуміє» ієрархію товарів.
…
Буду радий обговорити деталі!
-
172 1 1 Доброго дня. Готовий виконати цей проект, маю великий досвід розробки різних додатків.
-
372 4 0 Вітаю. Ознайомився із завданням і готовий допомогти з парсингом каталогу Balluff. Маю досвід роботи зі складною версткою PDF, де колонки розташовані несиметрично, тому для витягування даних використаю Python-скрипти, що дозволяють точно налаштувати обробку кожної сторінки та зберегти ієрархію категорій. Я врахую структуру розділу датчиків із сайту, щоб індуктивні, ємнісні та інші типи пристроїв потрапили у відповідні колонки Excel згідно з вашим прикладом. Оскільки ви згадали про наявність SQL-бази з правильною компоновкою, я також зможу в подальшому допомогти з синхронізацією цих даних для сайту, адже розумію логіку зв'язків у базах даних.
-
758 6 0 Добрий день! Маю великий досвід в парсингу документів. Підкажіть, необхідно парсити один pdf файл? Який об'єм?
В середньому можу виконати за 2-3 дні.
-
1344 6 0 Привіт!
Я розумію, що потрібно розпарсити пдф файл в exel таблицу згідно з прикладом, а потім заливати дані на сайт.
Я зроблю це за допомогою n8n, Google Sheets та Apps Script.
Напишіть деталі — уточню терміни і вартість.
-
1315 7 0 Добрий день.
Готовий взяти у роботу.
Зможу створити автоматизацію, яка зпарсить і категоризує Ваші файли.
Пишіть в особисті, обговоримо можливо нюанси і зможемо приступити
-
1239 16 0 Вітаю!
Вашу задачу зрозумів, підозрюю, що такий PDF у Вас або не один, або буде не один. Тому пропоную одразу написати парсер, який буде приймати PDF-файл на вході та видавати валідний excel-файл на виході. Вам треба буде тільки запустити скрипт та вказати йому шлях до Вашого файлу.
Мова Python.
За потреби скрипт буде скомпільовано в додаток для Windows (exe-файл)
-
702 1 0 Вітаю! Є великий досвід парсингу. Тому пропоную лояльну ціну та якісну роботу.
Пишіть)
-
826 3 0 Привіт! Я Python-розробник, спеціалізуюсь на парсингу даних та автоматизації (PDF, Web, SQL).
Що я зроблю:
1. Розберусь з кривими колонками: Напишу скрипт, який коректно обробить двоколонну верстку PDF, щоб дані не перемішались.
2. Розподілю по категоріях: Налаштую автоматичну прив'язку товарів до потрібних розділів (Індуктивні, Ємнісні тощо), орієнтуючись на структуру сайту Balluff.
3. Підготую Excel: Ви отримаєте таблицю в точності за вашим прикладом, готову до імпорту.
По другій задачі з SQL базою також готовий працювати. Пишіть в особисті повідомлення, обговоримо терміни та бюджет!
-
3920 101 0 Привіт. Готовий допомогти з цією задачею. В pdf є вся достатня інформація для роботи
1 день, 800грн
-
5860 345 0 Я можу перенести дані з PDF в Excel без "подивитися на сайті"
-
3367 148 4 1 Доброго дня.
Зроблю рішення на node js яке вірно обробить файл.
Ціна і термін договірні.
Якщо у вас є питання можете написати мені в ПП.
-
4182 198 2 5 Є досвід парсингу PDF в табличні формати з збереженням структури категорій, в тому числі з несиметричними колонками. Для цього застосовував різноманітні бібліотеки PHP та python-інструменти, інтегровані в робочі процеси.
У вашому випадку візьму за основу категорії «Датчики» та їх підкатегорії, відповідно до завдання та сайту balluff-ua.com. Остаточна Excel-таблиця буде структурована так, щоб зручно було завантажувати дані на сайт і коректно відображати категорії.
Використовую PHP зі зв'язкою Laravel, що прискорить роботу з базою (MySQL/PostgreSQL) і полегшить подальшу інтеграцію. Маю досвід у REST API та вивантаженні даних зі складних структур — це допоможе в подальшому автоматичному оновленні даних.
Пропоную спочатку зробити демо-версію парсера по вибраним категоріям, щоб впевнитися в коректності даних, а потім переходити до подальшої доопрацювання та інтеграції з БД на наступному етапі. Можу організувати процес через Docker для простоти запуску та налагодження.
Готовий обговорювати деталі та розпочати за вашим графіком.
-
693 15 0 2 Добрий день! Розпаршу ваш пдф файл в ексель швидко і якісно! Вже робив схожі проекти! Буду радий вам допомогти!)
-
240 Привіт, Євгене!
Ваш кейс: парсинг PDF-каталогу Balluff в Excel за шаблоном з Google Sheets (у вас він відкритий) + відповідність категорій/підкатегорій на balluff-ua.com/product. Старт — категорія Датчики (SENSORS) та її підкатегорії.
План:
1. Забираю PDF + таблицю-шаблон + структуру категорій з сайту balluff-ua.com. Якщо є посилання на PDF — одразу беру його; якщо файл у вкладенні в FH — надішліть у коментарях до проєкту.
2. Пишу парсер на Python (pdfplumber / tabula для таблиць + кастомна логіка для несиметричних колонок, як ви описали). Для позицій, де структура ламається, даю fallback з ручною обробкою.
3. Нормалізація: співвідношу артикулі з підкатегоріями балуфф-ua — роблю це за точним збігом коду + fallback за назвою категорії. Несопоставлені позиції позначаю окремим статусом «needs_review».
… 4. Вивантаження в Excel строго за вашим шаблоном Google Sheets: ті ж колонки, ті ж типи даних, той же формат.
5. Віддаю вам XLSX + коротке ReadMe: скільки позицій розпарсено чисто, скільки потрапило в needs_review і чому. Щоб ви одразу бачили якість.
Вартість: 3 000 UAH за парсинг Sensors та її підкатегорій у таблицю за шаблоном. Термін 3–4 робочих дні від отримання файлу.
Другу задачу (співвідношення з вашою SQL-базою правильної компоновки) готовий оцінити окремо, коли надішлете дамп схеми бази.
Надішліть у коментарях до проєкту: сам PDF (або посилання), підтвердження, що шаблон google sheets актуальний, і якщо є — приклад «правильно співвіднесеної» позиції для калібрування.
-
смотрите "можно смотреть на сайте" это значит что нужно реализовать парсинг сайта, чтобы просто посмотреть. Поэтому хотелось бы чтобы вы уточнили тз, а именно
1) распарсить пдф, и вы точно указываете пример данных из пдф и что и куда заливать в гугл таблицу
2) имея данные из пдф в нужной форме уже ставить задачу поиска этих данных на сайте и заполнить категории, либо что-то еще.
Желательно разбить это двумя подзадачами, чтобы за каждую определять свой бюджет. Ну если конечно Вы хотите по нормальному.
-
Актуальні фриланс-проєкти в категорії Парсинг даних
Збір бази дизайнерів, архітекторів та монтажних компаній по УкраїніОпис завдання: Потрібно зібрати актуальну базу контактів по Україні для подальшої B2B-комунікації. Потрібні категорії: Дизайнери інтер’єру Архітектори / архітектурні бюро Монтажні компанії Компанії, які займаються ремонтом, оздобленням, освітленням, натяжними стелями,… Парсинг даних ∙ 7 годин 57 хвилин тому ∙ 26 ставок |
Парсер телеграм-групи
1000 UAH
# Технічне завдання ## Мета проекту Необхідно розробити парсер Telegram-груп, який буде знаходити групи за заданими ключовими словами та зберігати результати в текстових файлах. ## Основний функціонал ### 1. Пошук груп Парсер повинен здійснювати пошук Telegram-груп за… Парсинг даних, Розробка ботів ∙ 10 годин 32 хвилини тому ∙ 42 ставки |
Парсинг товарів, підготовка до імпорту на WPСпарсити повний каталог цих сайтів: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Всі товари потрібно об'єднати в одну загальну таблицю для імпорту в WP. Кожен товар… Веб-програмування, Парсинг даних ∙ 1 день 2 години тому ∙ 52 ставки |
Шукаю програміста для OpenCartДоброго часу доби 1) потрібно впровадити на сайті dneprkomfort.dp.ua був куплений модуль для українських банків, вже впровадили Моно банк ось приклад нашого конкурента Потрібно як зробити розстрочку, покупка частинами (МоноБанк) Пумб, Сенс, Моно за замовчуванням 2 платежі… Веб-програмування, Парсинг даних ∙ 1 день 23 години тому ∙ 48 ставок |
Требуется спеціаліст з просування в Telegram.
1272 UAH
Завдання: інвайт реальних користувачів за базою юзернеймів у нові чати та розсилка повідомлень по цільовій базі. Цікавить тільки якісний трафік і робота з живою аудиторією — виконавців, які використовують ботів, накрутку або неякісні методи, прохання НЕ БЕСПОКІТЬ. Робота… Парсинг даних, Просування у соціальних мережах (SMM) ∙ 6 днів 2 години тому ∙ 9 ставок |