Разработка парсера PDF-документа (одна форма)
1123 UAHЗадание: разработать парсер PDF-документов (одна форма)
Описание задачи:
Есть PDF-документ с фиксированной структурой (одна и та же форма).
Необходимо написать скрипт, который:
- Извлекает данные из определённых полей (в документе есть и текст, и изображения/сканированные части);
- Формирует результат в JSON-модель (структурированный набор данных);
Требования:
- Опыт работы с PDF-документами, где есть текст и изображения (желательно знание OCR);
- Код должен быть понятным и простым в использовании;
- Технологии — на усмотрение разработчика (Python, Node.js, и т.п.).
Формат результата:
- Исходный код (скрипт/программа);
- Пример JSON-файла с результатом.
Срок: как можно скорее 🙂
Бюджет: минимальный (предлагайте свои варианты).
Приложения 1
-
1 день1123 UAH1 день1123 UAH
Готов реализовать вашу задачу на Python в течение дня: максимально быстро и удобно, с возможностью использования непосредственно с вашего ПК. Начинаем?
-
1 день1123 UAH
250 1 день1123 UAHМогу быстро разработать парсер под вашу форму: Python с PyMuPDF для текста и для сбора картинок, с экспортом в JSON. На выходе получите чистый скрипт, README и примером готового JSON;
-
2 дня2245 UAH
166 2 дня2245 UAHЗдравствуйте. Меня зовут Владислав, я студент на специальности Инженерия ПО. Изучал написание парсеров с использованием Python. Готов взяться за работу, дабы сделать это максимально быстро и пополнить свое портфолио такого рода проектами
-
7 дней6736 UAH
1315 7 0 7 дней6736 UAHДобрий день.
Готов взять Ваш проект в работу.
Смогу разработать для Вас такой парсер при помощи no-code/low-code инструментов.
Пишите в ЛС, обсудим все детали и подберём для Вас лучшее решение.
-
3 дня2245 UAH
166 3 дня2245 UAHПривет! 👋
Могу разработать парсер PDF-документов с фиксированной структурой, который будет:
считывать текстовые поля,
при необходимости — распознавать данные со сканированных частей (OCR через Tesseract),
формировать структурированный JSON-файл с результатом.
… Пишу на Python (библиотеки pdfplumber, PyMuPDF, pytesseract). Код будет чистым, с примером использования.
-
1 день2245 UAH
3126 23 1 3 1 день2245 UAHЗдравствуйте, Андрей! Решение задачи извлечения данных из PDF — это не просто технический вызов, но и возможность сделать рабочий процесс максимально эффективным и автоматизированным. Используя опыт в разработке парсеров и интеграции OCR технологий, я предложу скрипт, который захватит все необходимые данные и конвертирует их в аккуратный JSON. Код будет лёгким в поддержке и адаптации, опираясь на лучшие практики Full-Stack разработки. Понимаю важность быстроты и готов обеспечить скорейший результат. Обсудим детали и начнём работать над этим полезным инструментом?
-
1 день1123 UAH
176 1 0 1 день1123 UAHЗдравствуйте! Умею работать с PDF-документами, включая извлечение текста и данных через OCR. Задача понятна, структура фиксированная. Бюджет меня устраивает. Готов приступить сразу.
-
1 день1123 UAH
264 1 день1123 UAHЗдравствуйте!
Опытный разработчик Node.js, специализируюсь на парсинге PDF-документов и автоматизации обработки данных.
Что могу предложить:
Разработка надёжного парсера для PDF с фиксированной структурой (в т.ч. сканированные документы);
Извлечение текста и изображений с помощью OCR (Tesseract, AWS Textract, Google Vision);
… Формирование чистой JSON-модели данных по заранее согласованной структуре;
Быстрая настройка под конкретную форму и понятный, легко расширяемый код.
-
1 день2245 UAH
9927 117 0 1 день2245 UAHЗдравствуйте.
Делаю парсеры на NodeJS. Готов взяться. Пишите, обсудим.
-
1 день1123 UAH
511 3 0 1 день1123 UAHЗдравствуйте. Готов сделать на python. Имею опыт работы с парсерами, в том числе пдф. Если готовы обсудить - пишите в лс
-
2 дня3368 UAH
3305 70 1 2 дня3368 UAHЗдравствуйте.
Создам парсер, буду использовать Node.js
Готов обсудить
-
3 дня1123 UAH
690 5 1 3 дня1123 UAHДоброго дня!
Готовий взятися за ваш проєкт. Я детально проаналізував наданий приклад (кредитний звіт НБКИ) і маю для вас хороші новини.
Документ має цифрову текстову основу, а не є сканованим зображенням. Це означає, що для вилучення даних не потрібен OCR (оптичне розпізнавання). Це значно спрощує завдання, гарантує 100% точність розпізнавання тексту готовий обговорити деталі в лс
-
3 дня3368 UAH
957 5 0 1 3 дня3368 UAHДобрый день.
Готов разработать для вас стабильный скрипт, который будет бесперебойно работать, ранее уже реализовывал проект, где работал с PDF файлами в коде.
Пишите в личные сообщения для обсуждения всех деталей.
Буду рад сотрудничеству!
-
1 день1123 UAH
147 1 0 1 день1123 UAHДобрый день!
Готов сделать парсер документа на Python с сохранением данных в JSON.
-
2 дня8982 UAH
264 2 дня8982 UAHДобрый день
напишу скрипт на пхп, есть готовые свои функции разбора ПДФ, опыт огромный
-
1 день1123 UAH
2211 18 3 1 день1123 UAHДобрый день. Занимаюсь автоматизацией процессов на Python. Имею опыт обработки данных в PDF файлах, так же опыт работы с OCR. Для финальной оценки сроков и цены хотелось бы услышать больше деталей про поля с которыми будем работать, это так же поможет оценить взаимодействие с OCR, некоторые сервисы имеют достаточно щедрые бесплатные тарифы. Пишите - с радостью обсужу все и помогу.
-
1 день1123 UAH
656 9 0 1 день1123 UAHДоброе утро, Андрей!
В целом задание понятно, для точного ответа по срокам и цене, хотелось бы уточнить некоторые вопросы, которые у меня возникли после анализа вашего задания.
Пишите в личные сообщения – обсудим детали и ваши пожелания.
Актуальные фриланс-проекты в категории Парсинг данных
Шукаю програміста для опен картаДоброе время суток 1)нужно внедрить на сайте dneprkomfort.dp.ua был куплен модуль для украинских банков уже внедрили Моно банк вот пример нашего конкурента Нужно как cделать розсрочку, покупка частями (МоноБанк) Пумб, Сенс, Моно по умолчанию 2 платежа 2 мес Пумб по умолчанию 3… Веб-программирование, Парсинг данных ∙ 4 часа 29 минут назад ∙ 19 ставок |
Требуется специалист по продвижению в Telegram.
1285 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 4 дня 6 часов назад ∙ 9 ставок |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 8 дней 1 час назад ∙ 13 ставок |
Нужен специалист для поиска контактов ЛПР по УкраинеНеобходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины. Поиск и сбор информации, Парсинг данных ∙ 8 дней 6 часов назад ∙ 21 ставка |
Необходимо спарсить данные из LinkedinНеобходимо спарсить данные с Linkedin по нашему списку. Для каждой записи нужно найти и собрать доступные данные, если такие есть на Linkedin профиле, включая фотографию профиля в соцсети Linkedin, email-адрес, ссылки на социальные сети, вебсайт компании, номер телефона. Все… Парсинг данных ∙ 8 дней 12 часов назад ∙ 28 ставок |