Створення OpenCV + Tesseract
Створення OpenCV + Tesseract
Мета парсера: витягти інформацію певних клітин і внести в базу даних (таблиця ексел)
Ускладнення: позиція вікна варіюється на робочому столі, а також в деяких випадках інтерфейс вікна змінюється. OpencCV використовується для пошуку зацікавлених полів за допомогою сегментації зображення, фільтрації знайдених полів і створення окремих зображень (в ОЗУ) для передачі в tesseract.
Точність розпізнаваності: >95%. Приблизно 5% помилки - "вина" tesseract, але використовувалася стандартна база без навчання. Впевнений, що з навчанням можна досягти щонайменше 99%. Точність розташування клітин становить 100%.
Порівняння з шаблоном (template matching) і машинне навчання (machine learning) не використовується. Навчання з вчителем (supervised learning) можна використовувати для пошуку всіх зацікавлених полів, але для даного прикладу це, ймовірно, було б оберкіл.
#OpenCV #tesseract #C++ #Парсінг #Win32API
Мета парсера: витягти інформацію певних клітин і внести в базу даних (таблиця ексел)
Ускладнення: позиція вікна варіюється на робочому столі, а також в деяких випадках інтерфейс вікна змінюється. OpencCV використовується для пошуку зацікавлених полів за допомогою сегментації зображення, фільтрації знайдених полів і створення окремих зображень (в ОЗУ) для передачі в tesseract.
Точність розпізнаваності: >95%. Приблизно 5% помилки - "вина" tesseract, але використовувалася стандартна база без навчання. Впевнений, що з навчанням можна досягти щонайменше 99%. Точність розташування клітин становить 100%.
Порівняння з шаблоном (template matching) і машинне навчання (machine learning) не використовується. Навчання з вчителем (supervised learning) можна використовувати для пошуку всіх зацікавлених полів, але для даного прикладу це, ймовірно, було б оберкіл.
#OpenCV #tesseract #C++ #Парсінг #Win32API