Split PDF на страницы. AWS lambda, S3.
Шаги:
S3 Триггер: Запуск Lambda функции при загрузке нового PDF в S3.
Функция Lambda:
Загрузить PDF из S3.
Разделить PDF на отдельные страницы.
Для каждой страницы:
Извлечь текст.
Найти шаблон в тексте, соответствующий имени файла (username_patternname_pdfname.pdf).
Сохранить результаты в базу данных или журнал.
Опционально удалить PDF после обработки.
Рассмотрение аспектов:
Сложность шаблонов: Подготовка к обработке простых и сложных шаблонов.
Масштабирование: Возможное использование очередей (SQS) для обработки больших объемов.
Безопасность: Настройка прав доступа для S3 и Lambda.
База данных: Выбор соответствующей базы данных (DynamoDB, RDS).
-
593 15 0 Привет, готов выполнить.
Работал с AWS и также делал себе парсер invoce в pdf это почти то же самое, есть немного идей относительно шаблона не совсем хорошо брать шаблоны по имени файла могут быть проблемы какие-то в кавычках потом детектировать будет сложно. Также интересно посмотреть что за pdf, и предлагаю сразу удобное сохранение шаблонов в S3 чтобы потом можно было удобно свои добавлять.
-
278 2 1 Привет. Я программист с опытом коммерческой разработки проектов различной сложности более 10 лет.
У меня есть небольшой опыт работы с AWS и я могу написать скрипт для работы с pdf файлами. Поиск по шаблонам не проводил, придется разбираться.
Обращайтесь.
-
1928 29 1 1 Good day! Write to me with any questions, always in touch. I also recommend checking out my portfolio!
Актуальные фриланс-проекты в категории Python
Найти товарный фид (Google Merchant XML) для сайта на OpenCart
700 UAH
Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл Python, Парсинг данных ∙ 8 часов 56 минут назад ∙ 19 ставок |
Розработка Тик-Ток фермы (контент-завод)Необзодимо разработать систему для централизованного управления несколькими TikTok-аккаунтами с автоматической публикацией контента, использованием индивидуальных прокси и имитацией естественной активности аккаунтов. Функциональные требования1. Управление аккаунтами Добавление… Python, Разработка ботов ∙ 20 часов 22 минуты назад ∙ 15 ставок |
Улучшить работу Claude Code и работа с написанием софтаСейчас разрабатываю СРМ и Аналитику, софт. Делаю через Клод Код, но понимаю что результаты не лучшие в плане изменений. Есть 2 задачи - Нужно помочь сделать пресет по навыкам, мд и так далее чтобы улучшить качество. Взять проверенные с которыми работали, а не с интернета… AI и машинное обучение, Python ∙ 1 день 2 часа назад ∙ 21 ставка |
Система OCRНужна система распознавания текста на почтовых конвертах (индекс кому - только числа). Текст иногда может быть рукописным. Распознавание марок (подсчет количества и номинала) Python ∙ 1 день 6 часов назад ∙ 22 ставки |
Ищу White-label решение Букмекерской конторы под аренду |