Разработка парсера PDF-документа (одна форма)
1122 UAHЗадание: разработать парсер PDF-документов (одна форма)
Описание задачи:
Есть PDF-документ с фиксированной структурой (одна и та же форма).
Необходимо написать скрипт, который:
- Извлекает данные из определённых полей (в документе есть и текст, и изображения/сканированные части);
- Формирует результат в JSON-модель (структурированный набор данных);
Требования:
- Опыт работы с PDF-документами, где есть текст и изображения (желательно знание OCR);
- Код должен быть понятным и простым в использовании;
- Технологии — на усмотрение разработчика (Python, Node.js, и т.п.).
Формат результата:
- Исходный код (скрипт/программа);
- Пример JSON-файла с результатом.
Срок: как можно скорее 🙂
Бюджет: минимальный (предлагайте свои варианты).
Приложения 1
-
1 день1122 UAH1 день1122 UAH
Готов реализовать вашу задачу на Python в течение дня: максимально быстро и удобно, с возможностью использования непосредственно с вашего ПК. Начинаем?
-
1 день1122 UAH
250 1 день1122 UAHМогу быстро разработать парсер под вашу форму: Python с PyMuPDF для текста и для сбора картинок, с экспортом в JSON. На выходе получите чистый скрипт, README и примером готового JSON;
-
2 дня2243 UAH
166 2 дня2243 UAHЗдравствуйте. Меня зовут Владислав, я студент на специальности Инженерия ПО. Изучал написание парсеров с использованием Python. Готов взяться за работу, дабы сделать это максимально быстро и пополнить свое портфолио такого рода проектами
-
7 дней6730 UAH
1315 7 0 7 дней6730 UAHДобрий день.
Готов взять Ваш проект в работу.
Смогу разработать для Вас такой парсер при помощи no-code/low-code инструментов.
Пишите в ЛС, обсудим все детали и подберём для Вас лучшее решение.
-
3 дня2243 UAH
166 3 дня2243 UAHПривет! 👋
Могу разработать парсер PDF-документов с фиксированной структурой, который будет:
считывать текстовые поля,
при необходимости — распознавать данные со сканированных частей (OCR через Tesseract),
формировать структурированный JSON-файл с результатом.
… Пишу на Python (библиотеки pdfplumber, PyMuPDF, pytesseract). Код будет чистым, с примером использования.
-
1 день2243 UAH
3066 23 1 3 1 день2243 UAHЗдравствуйте, Андрей! Решение задачи извлечения данных из PDF — это не просто технический вызов, но и возможность сделать рабочий процесс максимально эффективным и автоматизированным. Используя опыт в разработке парсеров и интеграции OCR технологий, я предложу скрипт, который захватит все необходимые данные и конвертирует их в аккуратный JSON. Код будет лёгким в поддержке и адаптации, опираясь на лучшие практики Full-Stack разработки. Понимаю важность быстроты и готов обеспечить скорейший результат. Обсудим детали и начнём работать над этим полезным инструментом?
-
1 день1122 UAH
176 1 0 1 день1122 UAHЗдравствуйте! Умею работать с PDF-документами, включая извлечение текста и данных через OCR. Задача понятна, структура фиксированная. Бюджет меня устраивает. Готов приступить сразу.
-
1 день1122 UAH
264 1 день1122 UAHЗдравствуйте!
Опытный разработчик Node.js, специализируюсь на парсинге PDF-документов и автоматизации обработки данных.
Что могу предложить:
Разработка надёжного парсера для PDF с фиксированной структурой (в т.ч. сканированные документы);
Извлечение текста и изображений с помощью OCR (Tesseract, AWS Textract, Google Vision);
… Формирование чистой JSON-модели данных по заранее согласованной структуре;
Быстрая настройка под конкретную форму и понятный, легко расширяемый код.
-
1 день2243 UAH
9927 117 0 1 день2243 UAHЗдравствуйте.
Делаю парсеры на NodeJS. Готов взяться. Пишите, обсудим.
-
1 день1122 UAH
511 3 0 1 день1122 UAHЗдравствуйте. Готов сделать на python. Имею опыт работы с парсерами, в том числе пдф. Если готовы обсудить - пишите в лс
-
2 дня3365 UAH
3305 70 1 2 дня3365 UAHЗдравствуйте.
Создам парсер, буду использовать Node.js
Готов обсудить
-
3 дня1122 UAH
690 5 1 3 дня1122 UAHДоброго дня!
Готовий взятися за ваш проєкт. Я детально проаналізував наданий приклад (кредитний звіт НБКИ) і маю для вас хороші новини.
Документ має цифрову текстову основу, а не є сканованим зображенням. Це означає, що для вилучення даних не потрібен OCR (оптичне розпізнавання). Це значно спрощує завдання, гарантує 100% точність розпізнавання тексту готовий обговорити деталі в лс
-
3 дня3365 UAH
957 5 0 1 3 дня3365 UAHДобрый день.
Готов разработать для вас стабильный скрипт, который будет бесперебойно работать, ранее уже реализовывал проект, где работал с PDF файлами в коде.
Пишите в личные сообщения для обсуждения всех деталей.
Буду рад сотрудничеству!
-
1 день1122 UAH
147 1 0 1 день1122 UAHДобрый день!
Готов сделать парсер документа на Python с сохранением данных в JSON.
-
2 дня8974 UAH
264 2 дня8974 UAHДобрый день
напишу скрипт на пхп, есть готовые свои функции разбора ПДФ, опыт огромный
-
1 день1122 UAH
2211 18 3 1 день1122 UAHДобрый день. Занимаюсь автоматизацией процессов на Python. Имею опыт обработки данных в PDF файлах, так же опыт работы с OCR. Для финальной оценки сроков и цены хотелось бы услышать больше деталей про поля с которыми будем работать, это так же поможет оценить взаимодействие с OCR, некоторые сервисы имеют достаточно щедрые бесплатные тарифы. Пишите - с радостью обсужу все и помогу.
-
1 день1122 UAH
656 9 0 1 день1122 UAHДоброе утро, Андрей!
В целом задание понятно, для точного ответа по срокам и цене, хотелось бы уточнить некоторые вопросы, которые у меня возникли после анализа вашего задания.
Пишите в личные сообщения – обсудим детали и ваши пожелания.
Актуальные фриланс-проекты в категории Парсинг данных
Парсинг товаров, подготовка к импорту на WPСпарсить полный каталог этих сайтов: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Все товары нужно объединить в одну обющую таблицу для импорта в WP. Каждый товар… Веб-программирование, Парсинг данных ∙ 2 часа 46 минут назад ∙ 26 ставок |
Шукаю програміста для опен картаДоброе время суток 1)нужно внедрить на сайте dneprkomfort.dp.ua был куплен модуль для украинских банков уже внедрили Моно банк вот пример нашего конкурента Нужно как cделать розсрочку, покупка частями (МоноБанк) Пумб, Сенс, Моно по умолчанию 2 платежа 2 мес Пумб по умолчанию 3… Веб-программирование, Парсинг данных ∙ 1 день назад ∙ 46 ставок |
Требуется специалист по продвижению в Telegram.
1272 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 5 дней 2 часа назад ∙ 9 ставок |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 8 дней 21 час назад ∙ 13 ставок |
Нужен специалист для поиска контактов ЛПР по УкраинеНеобходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины. Поиск и сбор информации, Парсинг данных ∙ 9 дней 1 час назад ∙ 21 ставка |