Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Парсинг текстового PDF с таблицами

4904 UAH

Приложения 1

Просмотр приложений доступен только зарегистрированным пользователям.
  1. 10738
     149  0

    1 день4904 UAH

    Добрый день. Уже делал подобное, но хотелось бы подробнее обсудить конечный формат сохранения. Буду рад сотрудничеству

  2. 332  
    5 дней4904 UAH

    Здравствуйте!

    Я могу реализовать ваш проект на Python. План работы такой:

    Парсинг PDF с таблицами с использованием библиотек вроде pdfplumber, camelot или tabula-py.

    Объединение основных таблиц в одну динамическую структуру (например, список словарей или DataFrame), чтобы каждая запись была уникальной и готовой к обработке.

    Для каждой записи основной таблицы будет привязана детальная информация из нижней таблицы.

    Создание динамического объекта/структуры, с которой можно удобно работать в Python (например, через pandas или напрямую как объекты/словарь).

    Опционально: возможность сохранять данные в CSV/JSON для последующей аналитики или обработки.

    Реализация будет гибкой, чтобы вы могли легко фильтровать, анализировать и модифицировать данные после парсинга.

    Готов обсудить детали PDF и сроки реализации.

  3. 1002    5  1
    3 дня6130 UAH

    Добрый день, могу это реализовать и добавить ИИ для нормализации, напишите в лс

  4. 267  
    1 день4658 UAH

    Здравствуйте,
    Я завершил вашу задачу. Из текстового PDF с таблицами я создал динамический объект Python и одну объединенную сводную таблицу: две основные таблицы соединены по ecu_code, и для каждой записи прикреплен соответствующий раздел … ДЕТАЛИ.

    Результаты:

    Чистый CLI-скрипт (меню/аргументы) с структурированными логами и README.

    Результаты в двух форматах:

    ecu_summary_merged.csv — объединенная сводка (основные таблицы + поля “(CONT…)”).

    ecu_merged.json — динамический объект: summary_merged[] плюс details{} на каждый ecu_code.

    Проверено на вашем документе: парсинг последовательный, многострочные поля (например, CVNS) обрабатываются.

    Запуск локально (если необходимо):

    python parse_ecu_pdf.py --input "Details Report.pdf" --outdir "out" --log "out/run.log"
    # или интерактивно:
    python parse_ecu_pdf.py --menu


    Прикреплено:

    parse_ecu_pdf.py

    ecu_summary_merged.csv

    ecu_merged.json

    (по желанию) короткий скринкаст/скриншоты

    Я также могу предоставить вывод в формате XLSX и/или минимальный веб-интерфейс для просмотра и поиска.


    Файлы готовы к передаче.

  5. 297    2  0
    4 дня4916 UAH

    Здравствуйте. Готов реализовать парсер для вашего PDF-документа.

    Сделаю:
    – Чтение и обработку основного PDF с таблицами
    – Объединение двух основных таблиц в одну
    – Привязку к каждой записи своей детальной информации
    – Вывод в виде Python-объекта або pandas DataFrame, з яким можна легко працювати

    Работа будет чистая, код понятный. Напишите в личку — всё покажу и уточним детали.

  6. 2225    32  0
    1 день4904 UAH

    Добрый день. Уже сделал данный парсер. Все готово.
    Добрый день. Уже сделал данный парсер. Все готово.
    +++++++++++++++++++++++++++++++++++++++++++++

  7. 2248    63  2   2
    3 дня4904 UAH

    Привет!
    есть опыт работы с различными типами данных
    смогу помочь как с текстовыми данными, так и с изображениями

  8. 3318    70  1
    1 день4904 UAH

    Здравсвтувуйте.
    Смогу создать объект с информации в pdf, предлагаю сделать json файл. Также могу любой другой формат сделать если есть необходимость
    Напишите мне чтобы обсудить в каком формате будет лучше работать дальше с данными

  9. 171  
    3 дня4904 UAH

    Добрый день!
    Могу реализовать решение на Python для парсинга PDF:
    - извлечь основные таблицы,
    - объединить их в одну,
    - добавить детальную информацию из следующих таблиц,
    - сохранить результат в удобном формате (например, DataFrame или JSON) для дальнейшей работы.
    Буду рад уточнить детали задания и согласовать формат финального результата.

  10. 2426    20  0
    1 день4904 UAH

    Доброго дня, готов выполнить быстро и качественно, напишите в личные сообщения, обсудим детали. С удовольствием помогу)

  11. 2248    18  3
    1 день4904 UAH

    Добрый день, уже разрабатывал подобные парсеры, сделаю с использованием Python + pdfplumber + pandas DataFrame. Если заинтересовало - пишите, с радостью обсудим подробнее.

  12. 1328    35  1
    2 дня4904 UAH

    Добрый день. Уже делал подобный проект. Но на пхп. Если не принципиально что пхп, обращайтесь сделаю

  13. 2858    42  1
    4 дня5271 UAH

    Мои приветствия, Артем
    Вам нужна утилита, к которой вы будете обращаться из своего питон-кода, вроде
    parser -pdf path/to/my.pdf
    и получать данные в структурированном формате (какой-то специализированный класс)?
    Возможно, стану в нагоде..

  14. 1495    13  0
    1 день4904 UAH

    Привет! Смогу реализовать. Напишите в личку, чтобы обсудить все детали. Буду рад сотрудничеству!

  15. 10038    117  0
    3 дня4904 UAH

    Здравствуйте.

    Я NodeJS разработчик. Готов взяться. Пишите, обсудим.

  16. 3008    73  4   2
    1 день4904 UAH

    Добрый день! Реализую такой парсер на Python!!!!!!!!!!!
    Обращайтесь!!!!!!

  17. Еще 8 ставок скрыто

Актуальные фриланс-проекты в категории Python

Телеграм-бот для найма/поиска работников. Для поиска работы

1100 UAH

1. Общая концепция Создание Telegram-бота для автоматизации подбора персонала и двустороннего поиска работы. Система работает по принципу активного отклика и взаимного подтверждения интереса (Double Opt-In). В системе предусмотрены две роли: Работодатель (Владелец фирмы) и…

PythonРазработка ботов ∙ 4 часа 28 секунд назад ∙ 37 ставок

Техническая поддержка веб-платформы (Python/Django)

Есть работающий веб-проект, нужно поддерживать и постепенно приводить в порядок, без переписывания с нуля. Стек проекта: Backend: Python, Django, Django Rest Framework Frontend: Next.js База данных: PostgreSQL Инфраструктура: AWS (EC2), Nginx Есть интеграции с внешними API…

PythonВеб-программирование ∙ 6 часов 9 минут назад ∙ 33 ставки

Разработка веб-сервиса с платным доступом к онлайн-чату

Добрый день, необходимо разработать веб-сервис, который включает: * персональные ссылки для пользователей; * страницу с описанием услуги; * оплату через PayPal; * онлайн-чат в реальном времени; * отображение видео на странице пользователя; * учет оплаченного времени и…

PythonВеб-программирование ∙ 1 день 7 часов назад ∙ 67 ставок

Создание приложения

Желаю создать мобильное приложение для общения, в приложении должны быть аудио, видео звонок, создание групповых чатов, возможность синхронизировать с контактами телефона, настройками аккаунта: привязка по email, 2fa, номеру телефона, возможность настраивать уведомления…

JavaPython ∙ 2 дня 5 часов назад ∙ 36 ставок

Настройка двусторонней интеграции WhatsApp с Odoo CRM

Здравствуйте! Ищем специалиста для реализации технического задания по настройке двусторонней интеграции мессенджера WhatsApp с CRM-системой Odoo. ⚠️ Важное техническое уточнение: Официальный WhatsApp Business API (WABA) не рассматривается. Необходимо внедрить стабильное «серое»…

PythonВеб-программирование ∙ 2 дня 15 часов назад ∙ 23 ставки

Заказчик
Artem Ro
Польша Польша  1  0
Проект опубликован
9 месяцев 27 дней назад
299 просмотров
Метки
  • data parsing
  • pandas
  • python
  • PDF