Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Распознавания текста с картинки в текст

10 000 UAH

  1. 571    6  1   1
    5 дней10 000 UAH

    Добрый день.
    Занимаюсь программированием на Python больше 3х лет. Разрабатываю программы и ботов для автоматизации различных задач. Разрабатывал множество разных программ.
    Давайте обсудим
    Хорошего дня!

  2. Еще 4 ставки скрыты
  • Александр Нескажук
    11 ноября 2023, 4:28 |

    Если более подробно , скрипт делает скрин всего рабочего стола ( изображение что отображается на мониторе данной машины таблица базы данных  ) после распознает  весь текст ( текст на украинском языке, размер шрифта может меняться от 8 и выше  ) таблица с множеством sku, после чего как на экране появилось ключевое слово ( их в среднем используется в поиске до 7—10 слов ) бот кидает скрин в телеграмм группу , на скрине должно быть выделено это слово цветной ячейкой . К примеру ключевое слово «е27.12вт» это слово для поиска может появиться одновременно в разных столбцах , к примеру е27.12вт 3 Шт в складе 1 днепр . И потом со временем данная товарная позиция появиться е27.12вт 200 Шт склад 7 Полтава . От момента появления на экране слова до получения его в группе телеграмм должно проходить не более 2-4 секунды ( железо и скорость интернет позволяет это осуществить ) после того как было отправлены скрины и слова запросы : е27.12вт 3 Шт в склад 1 днепр, е27.12вт 200 Шт в склад 7 Полтава — скрипт проверяет постоянно изображение на экране и сверяет какие слова он отправил какие нет , что бы бот не спамил по 100 смс с одним и тем же словом запроса того же склада . Данная позиция е27.12вт 3 Шт в складе 1 днепр висит в таблице пока не осуществица отгрузка , может 3 минуты а может и 5 часов , что бы все это время бот не дублировал данную позицию , так же необходима функция со словами исключениями , прописать в поиске е27.12вт+днепр и все позиции которые будут появляться в таблице со словом «днепр»в группу телеграмм отправляться не должно .
    —все процессы должны обрабатываться на данном компьютере где будет установлен скрип. ( никаких web или онлайн посторонних служб в просторах интернет ) 

    -какую структуру распознания планируете задействовать ?   

  • Михайло П.
    11 ноября 2023, 7:43 |

    Обязательно нужно через скриншоты это делать ?нельзя просто просмотреть базу скриптом и найти все нужные данные ?

  • Александр Нескажук
    11 ноября 2023, 7:55 |

    К сожалению только через распознание текста ((( 

  • Роман Сльота
    11 ноября 2023, 8:20 |

    Судя по тз, общая логика бота вообще не проблема.
    Да, занимает какое-то время, но творческих изысков не требует.
    Но самая дикая боль это возможные ошибки распознавания. Что тессеракт, что easyocr (да и любые другие) могут ошибиться в букве или цифре.  И может не так страшно если бот найдет не совсем то. А вот беда если не найдет то что нужно.
    Если можно гарантировать однотипность текста (например, размер, шрифт, форматирование (жирный, курсив, цвет текста, цвет фона), то можно подобрать алгоритм, который все же сможет без ошибок, или с минимальным кол-вом ошибок находить искомое.
    Также желательно позволить боту скидывать ложно-положительные результаты. Или результаты близкие к искомому (отличающиеся на 1 символ). Но нужно ли это на самом деле - только во время тестов станет понятно.
    И еще боль, что распознать весь экран - процедура довольно длительная. Но может за 4 сек бот и управится, но не факт. Смотря какое разрешение и как много текста на экране. Желательно, чтоб бот точно знал в каких областях экрана будет искомый текст (скажем, конкретные колонки)
    И еще желательно наличие видеокарты и передать вычисления на видеокарту (easyocr позволяет такое сделать).
    Жаль я ближайшую неделю-две загружен, и поэтому пишу сюда а не делаю ставку.

  • Александр Нескажук
    11 ноября 2023, 9:27 |

    За 5 лет попыток , у нас где-то 15—20 скриптов , из них 2 работают на 60%, в данный момент мы вышли на интервал времени от появления ключевого слова на экране до получения его в телеграмм группе 6 секунд в круг ( переодически бывает затяжка 10—20сек и даже минута ) при этом на экране одинаковое количество символов , это на тессеракте , скрип. Cuda 1 минута круг . При этом скрипт запускается на одной и той же машине , интернет стабильный. И при этом все скрипты спамят ужасно , одно слово может повторяться в телегу до 100 раз за 15 минут , 

  • Роман Сльота
    11 ноября 2023, 9:57 |

    Было бы любопытно поэкспериментировать))
    Если через недельку вопрос будет актуальным - может скинете мне в личку 5-10 скринов (желательно с разными возможными размерами текста, если уж нельзя гарантировать 1 размер), и десяток  тестовых sku, которые есть на этих скринах. Если получится эффективно (быстро и с высокой точностью) настроить распознавание текста, то может придумаем что-то толковое по итогу.

    Скрины в PNG формате будут нужны.
    Но что-то мне подсказывает что с 8 размером шрифта результат будет не достаточно хорошим. Ну... не попробуем - не узнаем)))))

  • Роман Сльота
    11 ноября 2023, 8:27 |

    и как сказал Михайло П.  выше, надежнее все-таки как-то читать не распознаванием.
    Может если даже у Вас нет админ доступа к базе, но база на компе, или база онлайн и грузится в виде веб-страницы, то лучше подумать как оттуда вытянуть данные, чем распознавать текст.
    Единственный случай, когда реально подходит Ваш вариант с распознаванием текста - это если у Вас доступ к просмотру базы в виде удаленного рабочего стола - тогда Вы на свой комп просто получаете изображение, и больше никаких данных.
    Может еще такой тупой вариант, если возможность как-то взаимодействовать с базой есть: заставить бота условно говоря выделять видимую область данных, копировать в буфер обмена, и анализировать эти скопированные данные.

  • Александр Нескажук
    11 ноября 2023, 9:46 |

    Из всей таблицы ключевые sku занимают видимый размер рабочего стола в соотношении 20/80%,   в размере : торговый столбец размерами 15 см ширина 30 длина , при размере монитора 60*33, 

    у данного операциониста который ведет статистику спроса товара и передает остатки в отдел безопасности для сверки наличия определенной группы товаров на складе , так и службе доставки

     доступ к базе полностью отсутствует , так как там в куче находится :  медок так и ндс, данные контрагентов и всех подрядчиков и субподрядчиков и все данные складов и торговых точек конечному потребителю, 

    и все это закольцовано в собственную базу 1с . Аналитик просто сидит переключается между компьютерами операторов , при этом часть по старинке фиксирует в журнал ручками а часть по запросу СБ уже сортирует в телеграмм .

  • Роман Сльота
    11 ноября 2023, 10:05 |

    раз переключается между компами, значит по удаленке грубо говоря. При этом он вероятно и с экраном то не взаимодействует, т.е. не контролирует мышку и клавиатуру оператора, к которому подключился. В этой ситуации и правда только комп.зрение.
    Но размер мониторов роли не играет. Роль играет разрешение монитора. А точнее даже сколько пикселей занимает 1 символ. При высоком разрешении если символ занимает хотя бы 8-10 пикселей в ширину - это хорошо. А если меньше, то вероятность ошибки оооочень большая. При этом значение имеет как разрешение монитора оператора, так и сотрудника СБ, у которого бот будет запущен.
    Надо начинать с анализа того что есть, и если результат будет не удовлетворительным, то обсуждать что можно сделать, чтоб его улучшить.
    Может достаточно изменить разрешение экрана оператора, или купить ему новый монитор с более высоким разрешением)) Но это все во время тестов только можно понять. 

  • Роман Сльота
    11 ноября 2023, 10:13 |

    И все-таки вопрос унификации изображения неплохо бы таки рассмотреть.
    Может накладно всем покупать мониторы с высоким разрешением, скажем, но можно заставить всех сидеть на одном разрешении, которое есть на всех мониторах всех операторов (скажем, стандартное 1366*768), и при этом заставить всех по умолчанию только один размер текста использовать при просмотре.
    При этом если он в самой базе в одном столбце под одним размером, а в другом - под другим, - тут уже можно приспособиться.
    Короче задача больше творческая чем техническая

  • Олександр Адамчук
    11 ноября 2023, 13:01 |

    Уточніть деталі:
    1. Опишіть процес перегляду таблиці. Плавна прокрутка (колесом мишкі) або пересуванням бігунка? чи шляхом переходу через клавіш "Page Up" "Page down"? Чи всю таблицю видно на екрані вцілому одразу і вона не виходить за межі екрану?

    2. Яке розширення екрану на віддаленій машині (иам, де реально знаходиться таблиця)?

    3. Яка відеокарта на локальній машині, де буде працювати код?

  • Александр Нескажук
    11 ноября 2023, 13:53 |

    1)Процесс просмотра таблицы : выглядит как стандартная работа между excel и 1с. 

    2) прокрутка в основном осуществляется скролом мышки , но прокрутку мало используют так как в большинстве случаев одновременно не так много открытых заявок и все помещается и отображается где-то на 50—60 строках( рабочей среды  таблицы ) больше применимо пкм+обновить и все закрытые заявки сами пропадают .
    3)в данный момент используется nvidia gtx 1660 super, пробовали nvidia quadro2000 (для теста работы с ядрами cuda - не показало даже среднего результата ) для сравнения 1660 от 7—8 секунд процесс , на квадро первые 30 мин работы 10+ спустя пару часов цикл 60+ секунд а то и 10—15 минут 

  • Олександр Адамчук
    11 ноября 2023, 14:48 |

    Підкажіть ще:
    Скільки разів на годину може оновлюватися інформація в таблиці?
    Чи завжди відкрита таблиця на віддаленій машині? Чи може бути, так, що вікно з таблицею згортають та переглядають іншу інформацію?

  • Александр Нескажук
    11 ноября 2023, 15:16 |

    Это не предсказуемо ,  как торговый агент с точки вбил заказ на отгрузку товара так и появилась заявка в таблице , если среднее вывести то каждую минуту происходят изменения в таблице а то и пару раз за минуту , если торговые были где-то в сельской местности , то как появился интернет у них в планшетах так и начинает сыпать может по 100 позиций в минуту 

    .сворачивают таблицу когда или сервер не доступен или по каким-то техническим неполадкам .
    ничего другого кроме рабочих программ открывать не могут так как там нет ничего кроме офисных программ ( но попытки бывали использования вайбера и легких игр ) 

  • Олександр Адамчук
    11 ноября 2023, 15:57 |

    Скиньте приклад (скрін) з виділеним текстом, що цікавить в особисті, будь ласка

Актуальные фриланс-проекты в категории AI и машинное обучение

Ищу ментора / преподавателя по ComfyUI для онлайн-обучения (работа через RunPod)

700 UAH

Добрый день. Ищу практикующего специалиста и ментора, который поможет мне освоить работу с ComfyUI. Главная особенность моего запроса — работа будет происходить полностью в облаке, без загрузки программы на локальный компьютер. Я планирую арендовать видеокарту через сервис…

AI и машинное обучение ∙ 6 часов 18 минут назад ∙ 1 ставка

ИИ-агент технолога спортивного питания

Агент помогает разрабатывать рецептуры новых продуктов спортивного питания — протеиновых батончиков, протеинов, предтреников, изотоников, батончиков и т.д. Главная особенность: агент знает законодательство разных стран и автоматически учитывает его при создании рецептуры. То…

AI и машинное обучениеВеб-программирование ∙ 6 часов 42 минуты назад ∙ 41 ставка

Интеграция системы аналитики с Базой данных в Таблицах

5000 UAH

Необходимо довести текущую систему аналитики до стабильного рабочего состояния. Сейчас данные из CRM, телефонии и рекламных кабинетов подтягиваются через Supabase через МСП, затем в гугл таблицы, но часть процессов еще приходится контролировать вручную. Это нужно убрать.1.…

AI и машинное обучениеРазработка ботов ∙ 21 час 7 минут назад ∙ 28 ставок

Прописать мета данные АЛЬТ при помощи ИИ

Сайт на Laravel , на сайте много изображений, для которых нужно прописать корректные по семантики и релевантные для странице АЛЬТ описание изображения в автоматическом режиме, с возможностью проверки

AI и машинное обучениеPHP ∙ 1 день 3 часа назад ∙ 32 ставки

N8n - автоматизация обработки запросов интернет-магазина на Shopify

2000 UAH

Ищу специалиста по n8n для построения рабочего процесса, который автоматически обрабатывает входящие запросы клиентов нашего Shopify-магазина: классифицирует их, подтягивает данные заказа из Shopify и маршрутизирует на правильное действие (автоответ, тикет, уведомление…

AI и машинное обучение ∙ 2 дня 2 часа назад ∙ 24 ставки

Заказчик
Проект опубликован
2 года назад
193 просмотра