Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Необходимо распарсить пдф файл


Приложения 2

Просмотр приложений доступен только зарегистрированным пользователям.
  1. 10738
     149  0

    7 дней5000 UAH

    Добрый день. Непростая задача, но исключительно из-за необходимости маппинга категорий без конкретных указаний на это. Если будет детальная инструкция или альтернативный способ, цена будет меньше.

  2. 2197
     97  0

    1 день2000 UAH

    Добрый день
    пропарсив кусок https://docs.google.com/spreadsheets/d/1VrUl-Fax9QFm9W7DfT-VU6OYzqEn1UxUAWqwAzPA1dA/edit?gid=0#gid=0
    так?
    Отпишитесь

  3. 3529
     31  0

    1 день2000 UAH

    Здравствуйте! Занимаюсь разработкой парсеров более 3 лет. Смогу распарсить ваши файлы согласно инструкциям.

    Сегодня готов начать работать, и завтра предоставить готовый результат.

  4. 315  
    10 дней2500 UAH

    Готов приступить к работе в любое время, сроки и стоимость можем обсудить, напишите, и я вышлю контакты для связи.

  5. 138  
    2 дня700 UAH

    Здравствуйте! Готов реализовать парсинг вашего PDF-файла на языке C#. Имею опыт работы с регулярными выражениями (Regex) для точного извлечения данных. На выходе предоставлю структурированный результат (JSON/Excel/Текст). Работаю через Сейф.

  6. 297    1  0
    2 дня2500 UAH

    Евгений, добрый день!
    Изучил ваш PDF-прайс, пример таблицы и структуру сайта balluff-ua.com

    Что именно я сделаю:
    1. Синхронизация с сайтом: Я проанализирую дерево категорий на balluff-ua.com/product и настрою скрипт так, чтобы данные из PDF автоматически сопоставлялись с нужными разделами сайта (Датчики -> Индуктивные датчики и т.д.). В колонках А и B у вас будет идеальный порядок для импорта.
    2. Решение проблемы «кривых» колонок: Для извлечения данных использую координатный метод (библиотека pdfplumber). Это позволит корректно разделить «Part number», «Ordering code» и «Price», даже если в PDF текст смещен или колонки имеют разную ширину.
    3. SQL-совместимость: Вы получите файл (Excel/CSV), в котором данные уже структурированы под вашу SQL-базу, что исключит ошибки при заливке на сайт.

    Мое преимущество: Я не просто копирую текст, а создаю алгоритм, который «понимает» иерархию товаров.

    Буду рад обсудить детали!

  7. 172    1  1
    1 день5000 UAH

    Добрый день. Готов выполнить данный проект есть большой опыт разработки различных приложений.

  8. 372    4  0
    3 дня4000 UAH

    Здравствуйте. Ознакомился с заданием и готов помочь с парсингом каталога Balluff. Имею опыт работы со сложной версткой PDF, где колонки расположены несимметрично, поэтому для извлечения данных использую Python-скрипты, которые позволяют точно настроить обработку каждой страницы и сохранить иерархию категорий. Я учту структуру раздела датчиков с сайта, чтобы индуктивные, емкостные и другие типы устройств попали в соответствующие колонки Excel согласно вашему примеру. Поскольку вы упомянули о наличии SQL-базы с правильной компоновкой, я также смогу в дальнейшем помочь с синхронизацией этих данных для сайта, так как понимаю логику связей в базах данных.

  9. 758    6  0
    4 дня4000 UAH

    Добрый день! У меня большой опыт в парсинге документов. Подскажите, необходимо парсить один pdf файл? Какой объем?

    В среднем могу выполнить за 2-3 дня.

  10. 1344    6  0
    7 дней25 000 UAH

    Привет!
    Я понимаю, что нужно распарсить pdf файл в excel таблицу согласно примеру, а затем загружать данные на сайт.
    Я сделаю это с помощью n8n, Google Sheets и Apps Script.
    Напишите детали — уточню сроки и стоимость.

  11. 1315    7  0
    3 дня6000 UAH

    Добрый день.
    Готов взять в работу.
    Смогу создать автоматизацию, которая спарсит и категоризирует ваши файлы.
    Пишите в личные сообщения, обсудим возможные нюансы и сможем приступить.

  12. 1252    16  0
    1 день3500 UAH

    Здравствуйте!
    Я понял вашу задачу, подозреваю, что такой PDF у вас либо не один, либо будет не один. Поэтому предлагаю сразу написать парсер, который будет принимать PDF-файл на входе и выдавать валидный excel-файл на выходе. Вам нужно будет только запустить скрипт и указать ему путь к вашему файлу.
    Язык Python.
    При необходимости скрипт будет скомпилирован в приложение для Windows (exe-файл).

  13. 702    1  0
    3 дня4000 UAH

    Здравствуйте! У меня большой опыт парсинга. Поэтому предлагаю лояльную цену и качественную работу. Пишите)

  14. 886    3  0
    3 дня2000 UAH

    Здравствуйте! Я Python-разработчик, специализируюсь на парсинге данных и автоматизации (PDF, Web, SQL).

    Что я сделаю:
    1. Разберусь с кривыми колонками: Напишу скрипт, который корректно обработает двухколонную верстку PDF, чтобы данные не перемешались.
    2. Распределю по категориям: Настрою автоматическую привязку товаров к нужным разделам (Индуктивные, Емкостные и т.д.), ориентируясь на структуру сайта Balluff.
    3. Подготовлю Excel: Вы получите таблицу в точности по вашему примеру, готовую к импорту.

    По второй задаче с SQL базой также готов работать. Пишите в личку, обсудим сроки и бюджет!

  15. 3967    101  0
    1 день800 UAH

    Привет. Готов помочь с этой задачей. В pdf есть вся достаточная информация для работы. 1 день, 800 грн.

  16. 5883    345  0
    1 день1000 UAH

    Могу перенести данные из PDF в Excel без "посмотреть на сайте"

  17. 3309    147  4   1
    1 день2000 UAH

    Добрый день.
    Сделаю решение на node js, которое правильно обработает файл.
    Цена и срок договорные.
    Если у вас есть вопросы, можете написать мне в личные сообщения.

  18. 4182    198  2   5
    2 дня5000 UAH

    Есть опыт парсинга PDF в табличные форматы с сохранением структуры категорий, в том числе с несимметричными колонками. Для этого применял разнообразные библиотеки PHP и python-инструменты, интегрированные в рабочие процессы.

    В вашем случае возьму за основу категории «Датчики» и их подкатегории, согласно заданию и сайту balluff-ua.com. Итоговая Excel-таблица будет структурирована так, чтобы удобно было загружать данные на сайт и корректно отображать категории.

    Использую PHP со связкой Laravel, что ускорит работу с базой (MySQL/PostgreSQL) и облегчит дальнейшую интеграцию. Имею опыт в REST API и выгрузке данных из сложных структур — это поможет в дальнейшем автоматическом обновлении данных.

    Предлагаю сначала сделать демо-версию парсера по выбранным категориям, чтобы убедиться в корректности данных и потом переходить к дальнейшей доработке и интеграции с БД по следующему этапу. Могу организовать процесс через Docker для простоты запуска и отладки.

    Готов обсуждать детали и приступить по вашему графику.

  19. 693    15  0   2
    2 дня1600 UAH

    Добрый день! Разберу ваш пдф файл в эксель быстро и качественно! Уже делал похожие проекты! Буду рад вам помочь!)

  20. 240  
    4 дня3000 UAH

    Здравствуйте, Евгений!

    Ваш кейс: парсинг PDF-каталога Balluff в Excel по шаблону из Google Sheets (у вас он открыт) + соответствие категорий/подкатегорий на balluff-ua.com/product. Старт — категория Датчики (SENSORS) и её подкатегории.

    План:

    1. Забираю PDF + таблицу-шаблон + структуру категорий с сайта balluff-ua.com. Если есть ссылка на PDF — сразу беру её; если файл во вложении в FH — пришлите в комментах к проекту.
    2. Пишу парсер на Python (pdfplumber / tabula для таблиц + кастомная логика для несимметричных колонок, как вы описали). Для позиций, где структура ломается, даю fallback с ручной обработкой.
    3. Нормализация: сопоставляю артикулы с подкатегориями балуфф-ua — делаю это по точному совпадению кода + fallback по названию категории. Несопоставленные позиции помечаю отдельным статусом «needs_review».
    4. Выгрузка в Excel строго по вашему шаблону Google Sheets: те же колонки, те же типы данных, тот же формат.
    5. Отдаю вам XLSX + короткое ReadMe: сколько позиций распарсено чисто, сколько попало в needs_review и почему. Чтобы вы сразу видели качество.

    Вартість: 3 000 UAH за парсинг Sensors и её подкатегорий в таблицу по шаблону. Срок 3–4 рабочих дня от получения файла.

    Вторую задачу (сопоставление с вашей SQL-базой правильной компоновки) готов оценить отдельно, когда пришлёте дамп схемы базы.

    Пришлите в комментариях к проекту: сам PDF (или ссылку), подтверждение, что шаблон google sheets актуален, и если есть — пример «правильно сопоставленной» позиции для калибровки.

  21. Еще 7 ставок скрыто
  • Vladimir B
    17 апреля, 19:04 |

    смотрите "можно смотреть на сайте" это значит что нужно реализовать парсинг сайта, чтобы просто посмотреть. Поэтому хотелось бы чтобы вы уточнили тз, а именно 

    1) распарсить пдф, и вы точно указываете пример данных из пдф и что и куда заливать в гугл таблицу

    2) имея данные из пдф в нужной форме уже ставить задачу поиска этих данных на сайте и заполнить категории, либо что-то еще.


    Желательно разбить это двумя подзадачами, чтобы за каждую определять свой бюджет.  Ну если конечно Вы хотите по нормальному.

Актуальные фриланс-проекты в категории Парсинг данных

Требуется специалист по продвижению в Telegram.

1298 UAH

Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа…

Парсинг данныхПродвижение в социальных сетях (SMM) ∙ 7 часов 18 минут назад ∙ 3 ставки

Сбор B2B базы данных компаний в Германии

1818 UAH

Цель: Получение списка потенциальных работодателей (клиентов) для B2B рассылки. Регион: Мюнхен (München) + радиус 50 км. Требуемые ниши: Строительные компании (Bauunternehmen) Пищевые предприятия (Lebensmittelhersteller, мясокомбинаты, пекарни) Логистика и складские…

Парсинг данныхПродажи и генерация лидов ∙ 9 часов 34 минуты назад ∙ 20 ставок

База данных перевозчиков

Интересует сбор базы данных перевозчиков по Украине за 2026 год, включая цистерны, тенты, зерновозы и другие. Желательно разработать таблицу.

Поиск и сбор информацииПарсинг данных ∙ 10 часов 52 минуты назад ∙ 25 ставок

Консультация по парсингу подписчиков Instagram-аккаунтов

Здравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались…

Парсинг данных ∙ 4 дня 2 часа назад ∙ 12 ставок

Нужен специалист для поиска контактов ЛПР по Украине

Необходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины.

Поиск и сбор информацииПарсинг данных ∙ 4 дня 6 часов назад ∙ 18 ставок

Заказчик
Евгений Дед
Украина Одесса  84  0
Проект опубликован
2 месяца 3 дня назад
443 просмотра
Метки
  • Excel
  • PDF
  • SQL