Парсинг текстового PDF з таблицями
Необхідно парсити текстовий PDF з таблицями та створити динамічний об'єкт з усіма даними, що є в документі.
В ньому знаходяться 2 основні таблиці, які можна "склеїти" в одну, а потім для кожного запису з цієї таблиці - по таблиці детальної інформації трохи нижче після основних таблиць.
По-хорошому, щоб я міг потім з цими даними працювати через Python
Заздалегідь дякую
Додатки 1
-
1 день4833 UAH1 день4833 UAH
Добрий день. Вже робив подібне, але хотілось би детальніше обговорити кінцевий формат збереження. Буду радий співпраці
Буду радий співпраці! -
5 днів4833 UAH
332 5 днів4833 UAHПривіт!
Я можу реалізувати ваш проект на Python. План роботи такий:
Парсинг PDF з таблицями з використанням бібліотек на кшталт pdfplumber, camelot або tabula-py.
Об'єднання основних таблиць в одну динамічну структуру (наприклад, список словників або DataFrame), щоб кожен запис був унікальним і готовим до обробки.
Для кожного запису основної таблиці буде прив'язана детальна інформація з нижньої таблиці.
…
Створення динамічного об'єкта/структури, з якою можна зручно працювати в Python (наприклад, через pandas або безпосередньо як об'єкти/словник).
Опціонально: можливість зберігати дані в CSV/JSON для подальшої аналітики або обробки.
Реалізація буде гнучкою, щоб ви могли легко фільтрувати, аналізувати і модифікувати дані після парсингу.
Готовий обговорити деталі PDF і терміни реалізації.
-
3 дні6041 UAH
1002 5 1 3 дні6041 UAHДоброго дня, можу це реалізувати і додати ШІ для нормалізації, напишіть в лс
-
1 день4591 UAH
267 1 день4591 UAHПривіт,
Я завершив ваше завдання. З тексту PDF з таблицями я створив динамічний об'єкт Python і єдину злиту підсумкову таблицю: дві основні таблиці з'єднані за ecu_code, і для кожного запису прикріплено відповідний розділ … ДЕТАЛІ.
Результати:
Чистий CLI скрипт (меню/аргументи) з структурованими логами та README.
Результати в двох форматах:
… ecu_summary_merged.csv — злитий підсумок (основні таблиці + поля “(CONT…)”).
ecu_merged.json — динамічний об'єкт: summary_merged[] плюс details{} на кожен ecu_code.
Перевірено на вашому документі: парсинг є послідовним, багаторядкові поля (наприклад, CVNS) обробляються.
Запустіть локально (якщо потрібно):
python parse_ecu_pdf.py --input "Details Report.pdf" --outdir "out" --log "out/run.log"
# або інтерактивно:
python parse_ecu_pdf.py --menu
Вкладено:
parse_ecu_pdf.py
ecu_summary_merged.csv
ecu_merged.json
(за бажанням) короткий скрінкаст/скріншоти
Я також можу надати вихід у форматі XLSX та/або мінімальний веб-інтерфейс для перегляду та пошуку.
Файли готові до передачі.
-
4 дні4845 UAH
297 2 0 4 дні4845 UAHПривіт. Готовий реалізувати парсер для вашого PDF-документа.
Зроблю:
– Читання та обробку основного PDF з таблицями
– Об'єднання двох основних таблиць в одну
– Прив'язку до кожного запису своєї детальної інформації
– Вивід у вигляді Python-об'єкта або pandas DataFrame, з яким можна легко працювати
Робота буде чиста, код зрозумілий. Напишіть в особисті повідомлення — все покажу і уточнимо деталі.
-
1 день4833 UAH
2225 32 0 1 день4833 UAHДобрий день. Уже зробив даний парсер. Все готово.
Добрий день. Уже зробив даний парсер. Все готово.
+++++++++++++++++++++++++++++++++++++++++++++
-
3 дні4833 UAH
2248 63 2 2 3 дні4833 UAHВітаю!
є досвід роботи з різними типами даних
зможу допомогти як з текстовими даними так і з зображеннями
-
1 день4833 UAH
3313 70 1 1 день4833 UAHДоброго дня.
Я можу створити об'єкт з інформацією в pdf, пропоную зробити json файл. Також можу зробити будь-який інший формат, якщо є необхідність.
Напишіть мені, щоб обговорити, в якому форматі буде краще працювати далі з даними.
-
3 дні4833 UAH
171 3 дні4833 UAHДоброго дня!
Можу реалізувати рішення на Python для парсингу PDF:
- витягнути основні таблиці,
- об’єднати їх в одну,
- додати детальну інформацію з наступних таблиць,
- зберегти результат у зручному форматі (наприклад, DataFrame або JSON) для подальшої роботи.
Буду радий уточнити деталі завдання та узгодити формат фінального результату.
-
1 день4833 UAH
2426 20 0 1 день4833 UAHДоброго дня готовий виконати швидко та якісно, напишіть у особисті повідомлення обговоримо деталі. Залюбки допоможу)
-
1 день4833 UAH
2223 18 3 1 день4833 UAHДоброго дня, вже розробляв подібні парсери, зроблю з використанням Python + pdfplumber + pandas DataFrame. Якщо зацікавило - пишіть, з радістью обговорю детальніше.
-
2 дні4833 UAH
1328 35 1 2 дні4833 UAHДоброго дня. Вже робив подібний проект. Але на пхп. Якщо не принципово що пхп, звертайтеся, зроблю
-
4 дні5195 UAH
2788 42 1 4 дні5195 UAHМої вітання, Артем
Вам потрібна утіліта до якої ви будете звертатися із свого пайтон коду на кшталт
parser -pdf path/to/my.pdf
і отримувати дані у структурованому форматі (якийсь спеціалізований класс)?
Можливо стану у нагоді..
-
1 день4833 UAH
1495 13 0 1 день4833 UAHВітаю! Зможу реалізувати. Відпишіть в приват щоб обговорити всі деталі. Буду рад співпраці!
-
3 дні4833 UAH
9972 117 0 3 дні4833 UAHПривіт.
Я розробник NodeJS. Готовий взятися. Пишіть, обговоримо.
-
1 день4833 UAH
2991 73 4 2 1 день4833 UAHДоброго дня! Реалізую такий парсер на Python!!!!!!!!!!!
Звертайтесь!!!!!!
Актуальні фриланс-проєкти в категорії Python
Автоматичне публікування відео в соціальні мережі за розкладомТехнічне завдання (ТЗ)Автоматична публікація відео в соціальні мережі за розкладомОпис проектуПотрібен скрипт/бот (Python бажано, або будь-яке інше рішення на ваш вибір — головне стабільність і простота підтримки), який автоматично публікує відео з папки в соціальні мережі та… Python, Розробка ботів ∙ 6 годин 19 хвилин тому ∙ 37 ставок |
Бот по прийому/пошуку анкет
1250 UAH
Якщо коротко: Створити бота, в якому можна буде створити та знайти анкету, бот повинен мати реферальні посилання тощо, все нижче розписав Бот зі сторони клієнта: перед кнопкою /старт текст в центрі чату: Що може зробити цей бот? Ласкаво просимо в Sugar Secret Agency!… Python, Розробка ботів ∙ 8 годин 21 хвилина тому ∙ 41 ставка |
Шукаємо розробника для створення торгового бота/чат-ботаШукаємо розробника для створення торгового бота / чат-бота. Потрібен IT-спеціаліст, який зможе розробити бота для аналізу ринку 24/7 та надсилання торгових сигналів по золоту, індексах, Bitcoin і Forex-парах. Головна вимога - спеціаліст має розумітися в трейдингу, MetaTrader… Python, Розробка ботів ∙ 1 день 3 години тому ∙ 36 ставок |
≈5 мікросервісів на FastAPI + правки та рефакторинг
15 719 UAH
Є проект, що складається приблизно з ~11 мікросервісів на FastAPI з інтеграціями, який більш ніж на половину готовий. Завдання - доробити решту ~5 мікросервісів (конкретніше - subscription/billing та інтеграція з Revenuecat, захист від зловживань для білінгу, Notifications,… Python, Веб-програмування ∙ 1 день 8 годин тому ∙ 40 ставок |
Power BI
700 UAH
Дашборд працює на гугл сервері, потрібно перенести всю логіку+код Які потрібні скіли: розгортання etl процесів на linux сервері + робота із BigQuery та Postgre Є робочий код, який працює на google, де є сама БД, потрібно перенести на інший сервер, можливо переписати код. Python, Бази даних та SQL ∙ 2 дні 14 годин тому ∙ 15 ставок |