Распаковка и сборка документов.
Здравствуйте!
Нужно написать код (Python), который будет брать документ (pdf или docs), извлекать из него текст, передавать его в другой сервис для перевода, а затем снова собирать тот же документ, но уже с переведенным текстом.
Пример выходного документа прилагается.
Очень важно, чтобы не нарушалась структура документа. Именно из-за этого пункта я ищу специалиста, потому что просто извлечь текст, даже с фото, я могу и сам)
То есть простыми словами, нужен инструмент, который будет разбирать и заново собирать файл, но уже с другим текстом.
Цена обсуждается.
ps: Коллеги, очень прошу писать только если вы делали это или уверены, что сделаете, заранее спасибо.
Приложения 1
-
571 2 0 Здравствуйте Сергей,
Для того чтобы не ломать структуру документа, нужно при чтении документа запоминать, сколько символов было на каждой из строк, а также записывать параметры отступов и абзацев. В результате, кроме текста, мы будем иметь параметры отступов и количество символов в каждой строке.
Затем получаем переведенный на другой язык текст из сервиса переводов,
И вот тут нам нужно будет подключить OpenAI API, и для него создадим промпт такого образца "Этот текст {{{перевод текста}}} отформатируй по следующей схеме {{{числовое описание форматирования строк}}} где ключ это номер строки, а 3 числа в значении это левый отступ, количество символов в строке, правый отступ"
таким образом мы благодаря ChatGPT сможем максимально близко подогнать переведенный вариант к оригиналу.
У меня большой опыт в решении алгоритмических задач и нестандартное мышление.
С радостью выполню это задание и отвечу на все вопросы.
…
С уважением
Георгий
-
643 5 0 Привет, Сергей!
Меня зовут Роман, и у меня есть опыт в разработке подобных инструментов на Python. Я готов выполнить ваше задание с максимальным вниманием к деталям, чтобы текст в документах был переведен без нарушения их структуры, включая форматирование, изображения, таблицы и другие элементы.
Я предлагаю такой подход:
1. Извлеку текст из документов формата PDF или DOCX, сохраняя всю структуру.
2. Использую проверенные API для перевода текста (Google Translate или другие).
…
3. Переведенный текст будет снова собран в документ с тем же форматированием, без потерь структуры.
4. Вы получите полностью готовый переведенный документ в том же формате.
Мой опыт позволяет гарантировать качественный результат.
Буду рад помочь вам с этим проектом! Если вас заинтересует мое предложение, готов приступить к работе.
С уважением,
Роман
-
219 1 1 Здравствуйте, могу помочь написать данный скрипт, год назад делал подобный только через бота на Python Aiogram.
Пишите в личные сообщения. Обсудим все детали работы.
-
237 2 1 Здравствуйте!
Готов взяться за работу, буду весьма признателен если предоставите это мне.
Примеры работ можете глянуть в портфолио, если требуется - можно в лс подробнее поговорить про опыт.
-
Не думаю що можна зробити щоб працювало адекватно.
Буде втрачатись форматування тексту.
З pdf буде особливо помітно. Про картинки у документі взагалі мовчу.
-
Можливо, але ви кажете "не думаю", тобто ви не впевненні.
У мене це наскопопом не вийшло але я і сам не впевен, що 100% не реально, часу у мене обмаль тому і пропрацьоввую всі варіанти.
З іншими форматами не вийде. PDF або DOCS і є орігінал.
Від замовника є чітке ТЗ - він хоче софт, в який він закидує документ і отримує документ без витрати додкового часу на форматування. -
Я дякую вам пане Єгору за зворотній зв'язок. Що стосується ціни, там написано - ціна обговорюється, але я не думаю що вам не варто її пропонувати.
Не думаю - це перекладається, як я впевен)
Також, завдяки іншим виконавцям, налаштованим на роботу а не *базар-вокзал*, я вже бачу що це доволі трівіальна задача.
Не треба проецірувати свій досвід як аксіому, бо ми всі можемо помилятися. -
Актуальные фриланс-проекты в категории Python
Ищем разработчика для создания торгового бота/чат-ботаИщем разработчика для создания торгового бота / чат-бота. Нужен IT-специалист, который сможет разработать бота для анализа рынка 24/7 и отправки торговых сигналов по золоту, индексам, Bitcoin и Forex-парам. Главное требование - специалист должен разбираться в трейдинге,… Python, Разработка ботов ∙ 15 часов 43 секунды назад ∙ 28 ставок |
~5 микросервисов на FastAPI + правки и рефакторинг
15 682 UAH
Есть проект состоящий примерно из ~11 микросервисов на FastAPI с интеграциями, который более, чем на половину готов. Задача доделать остальные ~5 микросервисов (более конкретно - subscription/billing и интеграция с Revenuecat, abuse protection для биллинга, Notifications,… Python, Веб-программирование ∙ 20 часов 20 минут назад ∙ 34 ставки |
Power BI
700 UAH
Дашборд работает на гугл сервере, нужно перенести всю логику+код Какие нужны скиллы: развертывание etl процессов на linux сервере + работа с BigQuery и Postgre Есть рабочий код, который работает на google, где есть сама БД, нужно перенести на другой сервер, возможно переписать… Python, Базы данных и SQL ∙ 2 дня 2 часа назад ∙ 15 ставок |
Телеграм-бот для найма/поиска работников. Для поиска работы
1100 UAH
1. Общая концепция Создание Telegram-бота для автоматизации подбора персонала и двустороннего поиска работы. Система работает по принципу активного отклика и взаимного подтверждения интереса (Double Opt-In). В системе предусмотрены две роли: Работодатель (Владелец фирмы) и… Python, Разработка ботов ∙ 3 дня 10 часов назад ∙ 94 ставки |
Техническая поддержка веб-платформы (Python/Django)Есть работающий веб-проект, нужно поддерживать и постепенно приводить в порядок, без переписывания с нуля. Стек проекта: Backend: Python, Django, Django Rest Framework Frontend: Next.js База данных: PostgreSQL Инфраструктура: AWS (EC2), Nginx Есть интеграции с внешними API… Python, Веб-программирование ∙ 3 дня 12 часов назад ∙ 73 ставки |