Парсинг текстового PDF с таблицами
4904 UAHНеобходимо парсить текстовый PDF с таблицами и создать динамический объект со всеми данными что есть в документе.
В нем находится 2 таблицы основные которые можно "склеить" в одну и потом для каждой записи из этой таблицы - по таблице детальной информации чуть ниже после основных таблиц.
По хорошему чтобы я мог потом с этими данными работать через Python
Заранее спасибо
Приложения 1
-
1 день4904 UAH1 день4904 UAH
Добрый день. Уже делал подобное, но хотелось бы подробнее обсудить конечный формат сохранения. Буду рад сотрудничеству
-
5 дней4904 UAH
332 5 дней4904 UAHЗдравствуйте!
Я могу реализовать ваш проект на Python. План работы такой:
Парсинг PDF с таблицами с использованием библиотек вроде pdfplumber, camelot или tabula-py.
Объединение основных таблиц в одну динамическую структуру (например, список словарей или DataFrame), чтобы каждая запись была уникальной и готовой к обработке.
Для каждой записи основной таблицы будет привязана детальная информация из нижней таблицы.
…
Создание динамического объекта/структуры, с которой можно удобно работать в Python (например, через pandas или напрямую как объекты/словарь).
Опционально: возможность сохранять данные в CSV/JSON для последующей аналитики или обработки.
Реализация будет гибкой, чтобы вы могли легко фильтровать, анализировать и модифицировать данные после парсинга.
Готов обсудить детали PDF и сроки реализации.
-
3 дня6130 UAH
1002 5 1 3 дня6130 UAHДобрый день, могу это реализовать и добавить ИИ для нормализации, напишите в лс
-
1 день4658 UAH
267 1 день4658 UAHЗдравствуйте,
Я завершил вашу задачу. Из текстового PDF с таблицами я создал динамический объект Python и одну объединенную сводную таблицу: две основные таблицы соединены по ecu_code, и для каждой записи прикреплен соответствующий раздел … ДЕТАЛИ.
Результаты:
Чистый CLI-скрипт (меню/аргументы) с структурированными логами и README.
Результаты в двух форматах:
… ecu_summary_merged.csv — объединенная сводка (основные таблицы + поля “(CONT…)”).
ecu_merged.json — динамический объект: summary_merged[] плюс details{} на каждый ecu_code.
Проверено на вашем документе: парсинг последовательный, многострочные поля (например, CVNS) обрабатываются.
Запуск локально (если необходимо):
python parse_ecu_pdf.py --input "Details Report.pdf" --outdir "out" --log "out/run.log"
# или интерактивно:
python parse_ecu_pdf.py --menu
Прикреплено:
parse_ecu_pdf.py
ecu_summary_merged.csv
ecu_merged.json
(по желанию) короткий скринкаст/скриншоты
Я также могу предоставить вывод в формате XLSX и/или минимальный веб-интерфейс для просмотра и поиска.
Файлы готовы к передаче.
-
4 дня4916 UAH
297 2 0 4 дня4916 UAHЗдравствуйте. Готов реализовать парсер для вашего PDF-документа.
Сделаю:
– Чтение и обработку основного PDF с таблицами
– Объединение двух основных таблиц в одну
– Привязку к каждой записи своей детальной информации
– Вывод в виде Python-объекта або pandas DataFrame, з яким можна легко працювати
Работа будет чистая, код понятный. Напишите в личку — всё покажу и уточним детали.
-
1 день4904 UAH
2225 32 0 1 день4904 UAHДобрый день. Уже сделал данный парсер. Все готово.
Добрый день. Уже сделал данный парсер. Все готово.
+++++++++++++++++++++++++++++++++++++++++++++
-
3 дня4904 UAH
2248 63 2 2 3 дня4904 UAHПривет!
есть опыт работы с различными типами данных
смогу помочь как с текстовыми данными, так и с изображениями
-
1 день4904 UAH
3318 70 1 1 день4904 UAHЗдравсвтувуйте.
Смогу создать объект с информации в pdf, предлагаю сделать json файл. Также могу любой другой формат сделать если есть необходимость
Напишите мне чтобы обсудить в каком формате будет лучше работать дальше с данными
-
3 дня4904 UAH
171 3 дня4904 UAHДобрый день!
Могу реализовать решение на Python для парсинга PDF:
- извлечь основные таблицы,
- объединить их в одну,
- добавить детальную информацию из следующих таблиц,
- сохранить результат в удобном формате (например, DataFrame или JSON) для дальнейшей работы.
Буду рад уточнить детали задания и согласовать формат финального результата.
-
1 день4904 UAH
2426 20 0 1 день4904 UAHДоброго дня, готов выполнить быстро и качественно, напишите в личные сообщения, обсудим детали. С удовольствием помогу)
-
1 день4904 UAH
2248 18 3 1 день4904 UAHДобрый день, уже разрабатывал подобные парсеры, сделаю с использованием Python + pdfplumber + pandas DataFrame. Если заинтересовало - пишите, с радостью обсудим подробнее.
-
2 дня4904 UAH
1328 35 1 2 дня4904 UAHДобрый день. Уже делал подобный проект. Но на пхп. Если не принципиально что пхп, обращайтесь сделаю
-
4 дня5271 UAH
2858 42 1 4 дня5271 UAHМои приветствия, Артем
Вам нужна утилита, к которой вы будете обращаться из своего питон-кода, вроде
parser -pdf path/to/my.pdf
и получать данные в структурированном формате (какой-то специализированный класс)?
Возможно, стану в нагоде..
-
1 день4904 UAH
1495 13 0 1 день4904 UAHПривет! Смогу реализовать. Напишите в личку, чтобы обсудить все детали. Буду рад сотрудничеству!
-
3 дня4904 UAH
10038 117 0 3 дня4904 UAHЗдравствуйте.
Я NodeJS разработчик. Готов взяться. Пишите, обсудим.
-
1 день4904 UAH
3008 73 4 2 1 день4904 UAHДобрый день! Реализую такой парсер на Python!!!!!!!!!!!
Обращайтесь!!!!!!
Актуальные фриланс-проекты в категории Python
Телеграм-бот для найма/поиска работников. Для поиска работы
1100 UAH
1. Общая концепция Создание Telegram-бота для автоматизации подбора персонала и двустороннего поиска работы. Система работает по принципу активного отклика и взаимного подтверждения интереса (Double Opt-In). В системе предусмотрены две роли: Работодатель (Владелец фирмы) и… Python, Разработка ботов ∙ 4 часа 28 секунд назад ∙ 37 ставок |
Техническая поддержка веб-платформы (Python/Django)Есть работающий веб-проект, нужно поддерживать и постепенно приводить в порядок, без переписывания с нуля. Стек проекта: Backend: Python, Django, Django Rest Framework Frontend: Next.js База данных: PostgreSQL Инфраструктура: AWS (EC2), Nginx Есть интеграции с внешними API… Python, Веб-программирование ∙ 6 часов 9 минут назад ∙ 33 ставки |
Разработка веб-сервиса с платным доступом к онлайн-чатуДобрый день, необходимо разработать веб-сервис, который включает: * персональные ссылки для пользователей; * страницу с описанием услуги; * оплату через PayPal; * онлайн-чат в реальном времени; * отображение видео на странице пользователя; * учет оплаченного времени и… Python, Веб-программирование ∙ 1 день 7 часов назад ∙ 67 ставок |
Создание приложенияЖелаю создать мобильное приложение для общения, в приложении должны быть аудио, видео звонок, создание групповых чатов, возможность синхронизировать с контактами телефона, настройками аккаунта: привязка по email, 2fa, номеру телефона, возможность настраивать уведомления… Java, Python ∙ 2 дня 5 часов назад ∙ 36 ставок |
Настройка двусторонней интеграции WhatsApp с Odoo CRMЗдравствуйте! Ищем специалиста для реализации технического задания по настройке двусторонней интеграции мессенджера WhatsApp с CRM-системой Odoo. ⚠️ Важное техническое уточнение: Официальный WhatsApp Business API (WABA) не рассматривается. Необходимо внедрить стабильное «серое»… Python, Веб-программирование ∙ 2 дня 15 часов назад ∙ 23 ставки |