Парсинг pdf файлов
4 USDЕсть задания для начинающих Python программистов
Дано:
написанный класс, который парсит pdf текст на части.
Надо:
1 при помощи написанного класса спарсить текст,
2 получить оттуда данные с помощью регулярок по ключевым словам.
3 записать эти данные в переменные
4 Проверить правильность данных вручную(визуально) на 15 идентичных(похожих) pdf файлах.
Пример:
Я даю вам 15 pdf файлов от какой-то фирмы 'РОГА И КОПЫТА' которые имеют примерно одинаковый формат(на 90%),
так же вы получаете класс который парсит этот pdf и имена переменных,которые надо оттуда( из pdf) достать.
Так же вы получаете пример работающего парсер файла, чтобы посмотреть, как это должно выглядеть.
Вы с помощью уже написанных мною методов и божей помощи достаете эти данные, сверяете их с данными в pdf(глазами) , со всеми 15 почередно, радуетесь,что все работает, отдаете их мне и получаете деньги.
эту оперецию можно проделывать много раз, т к фирм которые присылают различного рода pdf много.
Для обработки 1 фирмы у меня уходит около 3 часов.
Для этой работы не требуется супер знаний о Python. Начального или продвинутого уровня вролне достаточно.
Что получаете вы - опыт и немного денег
Что получаю я - могу заняться более важными делами.
Работа Монотонная.
ВНИМАНИЕ - оплата производится за фирму.
те Проверили 15 pdf от одной фирмы - > получии деньги. -> взяли вторую фирму(или не взяли) ->третью
-
875 51 0 1 Здравствуйте.
Можно посмотреть пример файлов и кода чтобы оценить примерный объем работы ?
-
461 17 2 1 Есди толькл оажи опыта) Взялся бы
работал с pdfminer.six :):):):)
-
2225 32 0 Доброго вечора. Маю такий досвід уже з pdf файлами. Можна подивитися на конкретні pdf , на їх структуру та на ключові фрази. Дякую. Пишіть в приват.
-
Регулярки у вас есть ?
-
Добрый день.
А можно скинуть пару файлов-примеров, желательно от разных фирм, и результат их обработки в личку? Хотел бы взглянуть.
-
Current freelance projects in the category Python
Data parsing through mobile APILooking for a person with experience in data parsing through mobile API, for parsing e-commerce, rozetka and similar sites. Tasks: 1. Intercepting traffic from the mobile application (Android), setting up a proxy, analyzing requests. 2. Identifying the necessary API endpoints… Python, Data Parsing ∙ 1 day 13 hours back ∙ 25 proposals |
Find a product feed (Google Merchant XML) for a website on OpenCart
16 USD
It is necessary to find a direct link to the active product feed (XML) of a competitor for Google Merchant Center Platform (CMS): OpenCart / ocStore Find the original feedRequirements for the result: Working link to the XML file Python, Data Parsing ∙ 6 days 22 hours back ∙ 28 proposals |
Development of a TikTok farm (content factory)It is necessary to develop a system for centralized management of multiple TikTok accounts with automatic content publishing, using individual proxies and simulating natural account activity. Functional Requirements1. Account Management Adding and removing TikTok accounts.… Python, Bot Development ∙ 7 days 10 hours back ∙ 22 proposals |
Improve the performance of Claude Code and work on software development.I am currently developing CRM and Analytics software. I am using Claude Code, but I understand that the results are not the best in terms of changes. There are 2 tasks - Need help creating a preset for skills, MD, and so on to improve quality. Take verified ones that have been… AI & Machine Learning, Python ∙ 7 days 16 hours back ∙ 28 proposals |
OCR systemA system for recognizing text on postal envelopes (index for whom - only numbers). The text can sometimes be handwritten. Recognition of stamps (counting quantity and denomination) Python ∙ 7 days 19 hours back ∙ 28 proposals |