Система OCR Python
Є дві платформи які чудово радять собі з "image to text":
На жаль жодна з них не надає API до своїх сервісів, тому мені потрібен виконавець який зможе повторити функціонал цих сервісів.
В описі ви знайдете архів, дерево якого виглядає наступним чином:
- imagetotext
- easy.txt
- medium.txt
- hard.txt
- prepostseo
- easy.txt
- medium.txt
- hard.txt
- easy.jpg
- medium.jpg
- hard.jpg
Де:
- файли .jpg - це чеки
- файли .txt - це результат "image to text" для кожної з платформ
Зауважте що текстові файли для обох платформ ідентичні - це вказує на те, що можливо вини використовують ту саму бібліотеку. Цією бібліотекою може бути "tesseract-ocr", але не факт - повторити результати цих платформ даною бібліотекою не вдалось.
Завдання виконавця зробити скрипт в python, який для зображень easy/medium/hard.jpg поверне текст ідентичний тому що поданий в архіві
Приложения 1
-
3021 80 1 1 Доброго дня, зацікавило ваше завдання.
Маю досвід виконання декількох подібних проектів.
Якщо вам потрібна максимальна якість розпізнавання то тут доведеться використовувати платне api
А безкоштовним альтернативою буде використання tesseract з попередньою обробкою зображень.
Все заложить від ваших вимог, об'єму і бюджету
-
Для tesseract-ocr вдавалось отримати хороші результати шляхом підбору градацій чорного та білого https://www.youtube.com/watch?v=ncGezERTdXM . Є ще така штука https://pypi.org/project/easyocr/ Так от воно брало ті куски, які не получалось розпізнати tesseract-ocr і дуже рідко але не могло розпізнати куски тексту які були ідеальні для розпізнавання. Це все дані станом на 2021. Єдина проблема, що на CPU розпізнавання картинки займало 30 секунд, хоча tesseract-ocr обробляв ту ж картинку за 1 секунду.