Розпізнавання тексту з зображення в текст
-
Если более подробно , скрипт делает скрин всего рабочего стола ( изображение что отображается на мониторе данной машины таблица базы данных ) после распознает весь текст ( текст на украинском языке, размер шрифта может меняться от 8 и выше ) таблица с множеством sku, после чего как на экране появилось ключевое слово ( их в среднем используется в поиске до 7—10 слов ) бот кидает скрин в телеграмм группу , на скрине должно быть выделено это слово цветной ячейкой . К примеру ключевое слово «е27.12вт» это слово для поиска может появиться одновременно в разных столбцах , к примеру е27.12вт 3 Шт в складе 1 днепр . И потом со временем данная товарная позиция появиться е27.12вт 200 Шт склад 7 Полтава . От момента появления на экране слова до получения его в группе телеграмм должно проходить не более 2-4 секунды ( железо и скорость интернет позволяет это осуществить ) после того как было отправлены скрины и слова запросы : е27.12вт 3 Шт в склад 1 днепр, е27.12вт 200 Шт в склад 7 Полтава — скрипт проверяет постоянно изображение на экране и сверяет какие слова он отправил какие нет , что бы бот не спамил по 100 смс с одним и тем же словом запроса того же склада . Данная позиция е27.12вт 3 Шт в складе 1 днепр висит в таблице пока не осуществица отгрузка , может 3 минуты а может и 5 часов , что бы все это время бот не дублировал данную позицию , так же необходима функция со словами исключениями , прописать в поиске е27.12вт+днепр и все позиции которые будут появляться в таблице со словом «днепр»в группу телеграмм отправляться не должно .
—все процессы должны обрабатываться на данном компьютере где будет установлен скрип. ( никаких web или онлайн посторонних служб в просторах интернет )-какую структуру распознания планируете задействовать ?
-
Обязательно нужно через скриншоты это делать ?нельзя просто просмотреть базу скриптом и найти все нужные данные ?
-
Судя по тз, общая логика бота вообще не проблема.
Да, занимает какое-то время, но творческих изысков не требует.
Но самая дикая боль это возможные ошибки распознавания. Что тессеракт, что easyocr (да и любые другие) могут ошибиться в букве или цифре. И может не так страшно если бот найдет не совсем то. А вот беда если не найдет то что нужно.
Если можно гарантировать однотипность текста (например, размер, шрифт, форматирование (жирный, курсив, цвет текста, цвет фона), то можно подобрать алгоритм, который все же сможет без ошибок, или с минимальным кол-вом ошибок находить искомое.
Также желательно позволить боту скидывать ложно-положительные результаты. Или результаты близкие к искомому (отличающиеся на 1 символ). Но нужно ли это на самом деле - только во время тестов станет понятно.
И еще боль, что распознать весь экран - процедура довольно длительная. Но может за 4 сек бот и управится, но не факт. Смотря какое разрешение и как много текста на экране. Желательно, чтоб бот точно знал в каких областях экрана будет искомый текст (скажем, конкретные колонки)
И еще желательно наличие видеокарты и передать вычисления на видеокарту (easyocr позволяет такое сделать).
Жаль я ближайшую неделю-две загружен, и поэтому пишу сюда а не делаю ставку. -
и как сказал Михайло П. выше, надежнее все-таки как-то читать не распознаванием.
Может если даже у Вас нет админ доступа к базе, но база на компе, или база онлайн и грузится в виде веб-страницы, то лучше подумать как оттуда вытянуть данные, чем распознавать текст.
Единственный случай, когда реально подходит Ваш вариант с распознаванием текста - это если у Вас доступ к просмотру базы в виде удаленного рабочего стола - тогда Вы на свой комп просто получаете изображение, и больше никаких данных.
Может еще такой тупой вариант, если возможность как-то взаимодействовать с базой есть: заставить бота условно говоря выделять видимую область данных, копировать в буфер обмена, и анализировать эти скопированные данные. -
Уточніть деталі:
1. Опишіть процес перегляду таблиці. Плавна прокрутка (колесом мишкі) або пересуванням бігунка? чи шляхом переходу через клавіш "Page Up" "Page down"? Чи всю таблицю видно на екрані вцілому одразу і вона не виходить за межі екрану?2. Яке розширення екрану на віддаленій машині (иам, де реально знаходиться таблиця)?
3. Яка відеокарта на локальній машині, де буде працювати код?
-
Актуальні фриланс-проєкти в категорії AI та машинне навчання
Розробка AI-агента з продажу для інтернет-магазину на PrestaShop 1.6 з інтеграцією KeyCRMШукаємо розробника або невелику команду для створення AI-консультанта з продажу для інтернет-магазину навчальної літератури. Сайт працює на PrestaShop 1.6, CRM — KeyCRM. Потрібен не звичайний чат-бот із готовими відповідями, а AI-продавець, який допомагатиме клієнту підібрати… AI та машинне навчання, Інтернет-магазини та електронна комерція ∙ 1 година 26 хвилин тому ∙ 20 ставок |
Консультація по створенню агента AI для прискорення вирішення рутинних завдань - 60 хвилин
700 UAH
Консультація щодо створення агента AI для прискорення вирішення рутинних завдань. Я створив агента для автоматичного заповнення договору - це просто, однак є більш складні завдання, які б хотілося також передати GPT-агентам, і є кілька питань, які б хотілося обговорити з… AI та машинне навчання ∙ 21 година 26 хвилин тому ∙ 14 ставок |
Автоматичний постінг сторіз в інстаграмДоброго дня, Потрібна допомога із налаштуванням автоматичного постингу історій в інстаграм. В архіві інстаграм вже є історії що були опубліковані, ії треба робити повторний перепостинг AI та машинне навчання, Розробка ботів ∙ 2 дні 6 годин тому ∙ 25 ставок |
Створення АІ асистента для комунікації із КлієнтамиПотрібно створити АІ асистента для комунікації із Клієнтами. Вікно чату буде розташовано на нашому сайті, далі йде спілкування з ботом. Питання по продукції, налаштуванням, можливостям і т.д. У випадку коли невідома інформація чи запит, відповідь на який має тільки менеджер -… AI та машинне навчання, Консультування з AI ∙ 3 дні 1 година тому ∙ 35 ставок |
Шукаю відеомонтажера, який створює ролики ІІСтворення AI-відео для стоматологів та інших експертів Мета: Створення коротких вертикальних відео для Instagram Reels, Facebook Reels, TikTok та YouTube Shorts, які пояснюють складні теми простими словами та утримують увагу глядача завдяки поєднанню AI-анімації та відео… AI та машинне навчання ∙ 3 дні 9 годин тому ∙ 2 ставки |