Преобразовать отсканированный PDF в текстовый файл
Я ищу, чтобы преобразовать старые PDF-документы из сканов в текстовые документы.
Вы можете использовать OCR для извлечения и частично справиться с задачей, но документ нужно будет очистить.
Я указал работу как почасовую, но на самом деле это будет по страницам, чем больше страниц будет преобразовано, тем лучше, если вы будете быстрее, то заработаете больше за час.
У меня есть разные уровни в зависимости от качества PDF.
Я включаю 2 страницы в качестве примеров некоторых из самых сложных случаев, с которыми вы столкнетесь.
Пожалуйста, приведите примеры вашей работы и вашу стратегию преобразования.
-
3 дня88 717 UAH
561 4 0 3 дня88 717 UAHЗдравствуйте) Меня интересует ваш проект. Буду рада с вами работать. Если что, на связи ;)
-
5 дней88 717 UAH
215 1 0 5 дней88 717 UAHЯ очень заинтересован в вашем проекте. Как разработчик, который создал индивидуальный инструмент извлечения данных на основе ИИ (pdf2table.com), у меня есть значительное техническое преимущество для этой работы. Хотя публичная версия моего SaaS специализируется на экспорте в Excel, основной движок работает на продвинутых LLM (Больших Языковых Моделях). Это означает, что извлечение идеально чистого, простого текста из ваших сканов полностью соответствует моей настройке. Я не полагаюсь только на стандартный "глупый" OCR; мой ИИ-управляемый конвейер на самом деле понимает контекст текста, что позволяет ему умно обрабатывать сложные макеты и неаккуратные сканы. Из-за этого я могу обрабатывать большие объемы намного быстрее, чем стандартный фрилансер по вводу данных, с значительно более высокой точностью. Вот моя стратегия конверсии: 1. Извлечение на основе ИИ: Я пропущу отсканированные документы через бэкенд моего движка pdf2table. ИИ извлечет текст, умно сохраняя логический порядок чтения и основную структуру (абзацы, списки). 2. Контекстная очистка: В отличие от стандартного OCR, ИИ автоматически устраняет большинство распространенных артефактов (например, исправляет сломанные символы на основе контекста, удаляет неуместные номера страниц/заголовки). Я дополню это целевыми скриптами для любых постоянных проблем, уникальных для ваших документов. 3. Ручная проверка качества (QA): Автоматизированный конвейер выполняет тяжелую работу, давая мне время вручную просмотреть и доработать текст, полностью сосредоточившись на тех "наихудших" ухудшенных страницах, которые вы упомянули. Примеры моей работы: Поскольку каждый отсканированный документ уникален, лучшее доказательство моего качества — это живой тест. Пожалуйста, отправьте мне 2 "наихудших" примера страниц, которые вы упомянули в описании работы. Я пропущу их через свою ИИ-систему и вручную доработаю, отправив вам чистый текст сразу же. Это продемонстрирует как мою скорость, так и финальное качество, которого вы можете ожидать. Я готов обрабатывать большие объемы и масштабировать процесс по мере необходимости. Давайте обсудим уровни и начнем с тестовых страниц!
Актуальные фриланс-проекты в категории Копирайтинг
Написание текста (прототипа) для лендинга преподавателя немецкого языкаЗдравствуйте! Ищу копирайтера, который напишет текст для моего личного сайта. Я преподаю немецкий язык, и мне нужен не просто сплошной текст, а именно текстовый прототип (структурированный текст по блокам), чтобы потом я могла сразу передать этот документ дизайнеру. О моих… Копирайтинг ∙ 6 часов 14 минут назад ∙ 24 ставки |
Сценарий рекламы для радиоЗдравствуйте! Мы — Радио Голос надежды. В настоящее время работаем над созданием рекламного ролика о Библии, который будет звучать в нашем прямом эфире. Ищем человека, который мог бы помочь с написанием сценария: разработать идею, структуру и текст для аудиорекламы. Будем… Копирайтинг, Написание сценария ∙ 1 день 3 часа назад ∙ 32 ставки |
Написание медицинских статейДобрый вечер У меня есть сайт https://dr-pryma.com/ необходимо регулярное наполнение медицинскими статьями на разные темы, статьи должны быть релевантными для гугла, с релевантными ключевыми словами и по популярным поисковым запросам. Копирайтинг ∙ 1 день 23 часа назад ∙ 72 ставки |
Необходимо качественно оформить карточки товаров для магазина мангалов на Хорошоп.Добрый день. Необходимо качественно оформить карточки товаров для магазина мангалов на Хорошоп. Для теста прошу оформить 3 товара. Необходимо: SEO Title. Meta Description. H1. Уникальное описание. Характеристики. Преимущества товара. Комплектация. Рекомендации по… Копирайтинг, Поисковое продвижение (SEO) ∙ 4 дня 2 часа назад ∙ 31 ставка |
Ищем контент-специалист в сфере wellness, саморазвития и энергетических практикМы ищем копирайтера для проекта в сфере КФС (пластины Кольцова), энергетических практик и wellness-направления. Что нужно делать: на основе предоставленной нами информации написать несколько живых и интересных текстов: статьи, посты для Instagram и Facebook. Важно не просто… Копирайтинг, Написание статей ∙ 5 дней 7 часов назад ∙ 19 ставок |