Парсинг pdf файлов
200 UAHЕсть задания для начинающих Python программистов
Дано:
написанный класс, который парсит pdf текст на части.
Надо:
1 при помощи написанного класса спарсить текст,
2 получить оттуда данные с помощью регулярок по ключевым словам.
3 записать эти данные в переменные
4 Проверить правильность данных вручную(визуально) на 15 идентичных(похожих) pdf файлах.
Пример:
Я даю вам 15 pdf файлов от какой-то фирмы 'РОГА И КОПЫТА' которые имеют примерно одинаковый формат(на 90%),
так же вы получаете класс который парсит этот pdf и имена переменных,которые надо оттуда( из pdf) достать.
Так же вы получаете пример работающего парсер файла, чтобы посмотреть, как это должно выглядеть.
Вы с помощью уже написанных мною методов и божей помощи достаете эти данные, сверяете их с данными в pdf(глазами) , со всеми 15 почередно, радуетесь,что все работает, отдаете их мне и получаете деньги.
эту оперецию можно проделывать много раз, т к фирм которые присылают различного рода pdf много.
Для обработки 1 фирмы у меня уходит около 3 часов.
Для этой работы не требуется супер знаний о Python. Начального или продвинутого уровня вролне достаточно.
Что получаете вы - опыт и немного денег
Что получаю я - могу заняться более важными делами.
Работа Монотонная.
ВНИМАНИЕ - оплата производится за фирму.
те Проверили 15 pdf от одной фирмы - > получии деньги. -> взяли вторую фирму(или не взяли) ->третью
-
875 51 0 1 Здравствуйте.
Можно посмотреть пример файлов и кода чтобы оценить примерный объем работы ?
-
461 17 2 1 Есди толькл оажи опыта) Взялся бы
работал с pdfminer.six :):):):)
-
2225 32 0 Доброго вечора. Маю такий досвід уже з pdf файлами. Можна подивитися на конкретні pdf , на їх структуру та на ключові фрази. Дякую. Пишіть в приват.
-
Регулярки у вас есть ?
-
Добрый день.
А можно скинуть пару файлов-примеров, желательно от разных фирм, и результат их обработки в личку? Хотел бы взглянуть.
-
Актуальні фриланс-проєкти в категорії Python
Парсинг даних через мобільне APIШукаю людину з досвідом парсингу даних через мобільне API, для парсингу e-commerce, rozetka та аналоги Завдання: 1. Перехоплення трафіку мобільного додатку (Android) налаштування проксі, аналіз запитів 2. Визначення потрібних API endpoints, куди йдуть запити, які headers… Python, Парсинг даних ∙ 1 день 17 годин тому ∙ 26 ставок |
Знайти товарний фід (Google Merchant XML) для сайту на OpenCart
700 UAH
Необхідно знайти пряме посилання на діючий товарний фід (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Знайти оригінальний фідВимоги до результату: Робоче посилання на XML-файл Python, Парсинг даних ∙ 7 днів 3 години тому ∙ 28 ставок |
Розробка Тік-Ток ферми (контент-завод)Необхідно розробити систему для централізованого управління кількома TikTok-акаунтами з автоматичною публікацією контенту, використанням індивідуальних проксі та імітацією природної активності акаунтів. Функціональні вимоги1. Управління акаунтами Додавання та видалення… Python, Розробка ботів ∙ 7 днів 14 годин тому ∙ 22 ставки |
Покращити роботу Claude Code та роботу з написанням програмного забезпеченняЗараз розробляю СРМ та Аналітику, софт. Роблю через Клод Код, але розумію, що результати не найкращі в плані змін. Є 2 задачі - Потрібно допомогти зробити пресет по навичкам, мд і так далі, щоб покращити якість. Взяти перевірені, з якими працювали, а не з інтернету перші. - В… AI та машинне навчання, Python ∙ 7 днів 21 година тому ∙ 28 ставок |
Система OCRПотрібна система розпізнавання тексту на поштових конвертах (індекс кому - лише числа). Текст інколи може бути рукописним Розпізнавання марок (підрахунок кількості та номіналу) Python ∙ 8 днів тому ∙ 28 ставок |