Распознаватель текста с картинок (многопоточный)
11 000 UAHПривет, коллеги
Есть интересная задача. Мне нужна многопоточная программа для распознавания заданных фраз с картинок мощностями CPU и\или GPU (если можете сделать для одного из них - уже хорошо)
Прототип интерфейса программы - прикрепил под проектом (для примера)
Общий алгоритм потока (для ориентира):
1. Смотрит в папку "Input", ищет картинку.
1.1 Если не находит: в статус программы выводит "Папка с картинками пустая", ждёт минуту и повторяет пункт 1
1.2 Если находит: берет картинку, файл удаляет, пишет в статус программы "Распознаю: %image_name%" и переходит на пункт 2
2. Определяет выбранный режим распознавания CPU и\или GPU
3. Берет в массив все фразы заданные в textArea и пробует найти их на картинке без зависимости от регистра
3.1 Если не находит - переходит к пункту 4
3.2 Если находит - сохраняет картинку с тем же названием в папку "Output", в подпапку с именем этой фразы, переходит к пункту 4
4. Обновляет статистику распознавания
5. Profit. Заново
Железо и системы на котором планирую запускать ваш софт:
- AMD 5900X / 64gb / RTX 3070TI / Win 10
- I7 8700 / 32gb / WinServer 2019
- I9 9900K / 64gb / WinServer 2019
И напоследок. Нужно найти баланс между качеством распознавания и скоростью, так как с помощью вашего творения будут распознаваться миллионы картинок, поэтому нужно найти оптимальное техническое решение. Допускаю, что можно применять методы для подготовки картинки к распознаванию.
Если у вас есть профессиональное виденье по этому поводу и возможность реализовать - отзовитесь, пожалуйста, под проектом 😉
UPD. Указал примеры картинок. Фразы для поиска в их названии
Приложения 2
Отзыв заказчика о сотрудничестве с Сергеем Стаднийчуком
Распознаватель текста с картинок (многопоточный)Реализация как всегда на высоте! Спасибо большое Сергею. Профи своего дела
Отзыв фрилансера о сотрудничестве с Сергеем Шульгой
Распознаватель текста с картинок (многопоточный)Все хорошо. Понятная задача.
-
262 Здравствуйте! Готов взяться за проект! Подробности предпочитаю обсуждать в ЛС.
-
ставка скрыта фрилансером
-
970 18 2 Здравствуйте. Уже имел опыт применения OCR(распознавание текста с картинок). Желательно, что бы это было не что-то вроде капчи, а нормально написанный текст на картинке, тогда вероятность распознавания будет 90%+. С ТЗ я ознокомился, по UI вопросов нет. Но нам все равно нужно обсудить некоторые детали. Обращайтесь, буду рад помочь!
-
Обсуждали в личных сообщениях.
Обсуждали в личных сообщениях.
Обсуждали в личных сообщениях.
-
для такого задания, не интерфейс нужно прикладывать а несколько картинок образцов.
-
Працював над подібною задачею. Там теж були складні картинки з різними фонами https://prnt.sc/214b2uc https://prnt.sc/214avca https://prnt.sc/214byvc але дані були більш менш структуровані, а не так як у вас. Була спроба використовувати tessaract ocr. На CPU (1 потік) на одну картинку йшло 1 секунда. Але правда приходилось під різні фони прописати правила перетворення в Ч/Б зображення чи негатив, яскравіше, темніше тобто універсальності не получилось - задача була получати майже 100% точність розпізнавання в певних місцях. Була спроба використати https://github.com/JaidedAI/EasyOCR Там вже розпізнавало без різних попередніх налаштувань, але проблема що на CPU (1 потік) - 35-50 секунд і не було структури. І деякі прості картинки не могло розпізнати в той час як tessaract без проблем. Можете погратись тут https://www.jaided.ai/easyocr/ Зверніть увагу на обмеження для картинки (1500 пікселів)