Rozpoznawanie tekstu i obrazów, OCR
Zadanie jest takie:
Jest aplikacja do gier na Windows działająca przez internet. Jak rozumiem, trzeba zrobić zrzut ekranu okna i rozpoznać wszystkie dane z obrazka (Obrazy, teksty, wszystkie dane) i zapisać je w formie tekstu w logu.
Od razu powiem, że prawdopodobnie zadanie nie jest proste i wymaga umiejętności.
Jeśli jesteś doświadczonym programistą w tym kierunku, czekam na twoją aplikację!
Jestem gotów na bezpieczną transakcję. Najważniejsze to terminy i jakość. Bardzo ważne, abyś był w kontakcie w ciągu dnia i otwarcie mówił o postępach projektu.
-
2 dni1106 PLN
173 2 dni1106 PLNCześć Viktor,
Widziałem zadanie i jest dość ekscytujące. To coś, co mnie interesuje, ponieważ łączy gry z zaawansowaną technologią, taką jak przetwarzanie obrazu. Pracuję w branży deweloperskiej od ponad dekady, zajmując się takimi rzeczami, więc rozumiem, jak trudne to może być. Robienie zrzutów ekranu, wyodrębnianie wszelkiego rodzaju danych — tekstów, obrazów, co tylko chcesz — i ich rejestrowanie to nie lada wyzwanie. Ale uwierz mi, to wykonalne z odpowiednimi narzędziami i metodami.
W tym celu rozważyłbym OCR (Optical Character Recognition). Tesseract OCR jest solidny do wyodrębniania tekstu, a ja używałem go wcześniej do rozpoznawania danych w czasie rzeczywistym. Jest to oprogramowanie open-source i konfigurowalne, co czyni go dobrym wyborem do czegoś takiego. Jeśli interfejs użytkownika jest skomplikowany, mogę również użyć OpenCV do rozpoznawania obrazów, mapowania elementów, a nawet znajdowania wzorców w układzie okna aplikacji do gier.
Jeśli interfejs gry aktualizuje się dynamicznie, coś takiego jak PyAutoGUI mogłoby obsługiwać zautomatyzowane interakcje i zrzuty ekranu. Połączenie go z bibliotekami takimi jak NumPy może przyspieszyć i zwiększyć dokładność wyodrębniania danych. Dla ekranów bogatych w tekst, pytesseract jest świetnym towarzyszem dla OpenCV. Ta kombinacja dobrze sprawdziła się w moich wcześniejszych projektach związanych z automatyzacją GUI i rejestrowaniem danych.
Jednym z pomysłów, które mogłyby to poprawić, jest dodanie rozpoznawania na żywo, jak system rejestrowania na żywo. Zamiast tylko robić zrzut ekranu, mógłby ciągle monitorować aplikację, wyodrębniając dane w miarę ich zmiany. W ten sposób nie ma ryzyka pominięcia czegoś krytycznego w szybkim tempie gry.
…
Jestem dostępny, aby zacząć teraz, i mogę pracować ponad 40 godzin tygodniowo, więc jest mnóstwo czasu, aby skupić się i zrobić to dobrze. Jasna komunikacja to oczywistość — pozostaję w kontakcie przez cały czas, bez luk. Terminy i jakość są dla mnie niepodlegające negocjacjom.
Czekam na rozpoczęcie pracy nad tym z tobą. Zróbmy to.
Jobert
-
5 dni1106 PLN
5164 210 0 5 dni1106 PLNDzień dobry.
Może będę mógł pomóc. Czy możesz przesłać więcej szczegółów dotyczących projektu?
Z jaką aplikacją trzeba będzie pracować, jakie dane są potrzebne, w jakim formacie należy je dostarczyć?
-
5 dni1106 PLN
117 5 dni1106 PLNCześć! Z radością podejmę się tego projektu. Mam doświadczenie w opracowywaniu takich rozwiązań.
-
7 dni1106 PLN
1170 14 0 7 dni1106 PLNCześć!
Mam znaczące doświadczenie w opracowywaniu rozwiązań opartych na AI.
Sukcesywnie zrealizowałem podobny projekt dotyczący rozpoznawania tekstu i UI z zrzutów ekranu.
Proszę o sprecyzowanie, o jaką aplikację (grę) chodzi — najprawdopodobniej będę mógł Ci pomóc.
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
N8n - automatyzacja przetwarzania zapytań sklepu internetowego na Shopify
164 PLN
Szukam specjalisty z n8n do zbudowania workflow, który automatycznie przetwarza przychodzące zapytania klientów naszego sklepu Shopify: klasyfikuje je, pobiera dane zamówienia z Shopify i kieruje do odpowiedniej akcji (automatyczna odpowiedź, ticket, powiadomienie dla zespołu).… AI i uczenie maszynowe ∙ 2 godziny 48 minut temu ∙ 11 ofert |
Należy stworzyć bota w Telegramie z asystentem AITrzeba stworzyć bota, który będzie robił deepfake'i przez podłączone API serwisu do deepfake'ów (zmiana twarzy lub zdjęcia) AI i uczenie maszynowe, AI consult ∙ 5 godzin 19 minut temu ∙ 21 ofert |
Szukam osoby, która pomoże mi zrozumieć Wybkodowanie.
82 PLN
Potrzebuję osoby do stałych konsultacji w VibeCoding, interesuje mnie zajęcie się tym kierunkiem - jako hobby. Ale potrzebuję trenera, który pokaże i doradzi, co i jak działa. AI i uczenie maszynowe ∙ 7 godzin 31 minut temu ∙ 16 ofert |
Rozwój konwejera Telegram w n8n: Auto-generacja treści, montaż, tworzenie opisów i auto-publikacja
820 PLN
1. Cel Opracowanie automatycznego systemu na bazie lokalnego n8n (Mac M4) i bota Telegram. Bot przyjmuje pliki multimedialne i tezy, a AI samodzielnie generuje scenariusz, unikalny opis pod każde wideo, nagrywa filmy moim głosem, montuje je i publikuje w mediach… AI i uczenie maszynowe, AI consult ∙ 21 godzin 46 minut temu ∙ 20 ofert |
Bot Telegram do automatycznych rozmów kwalifikacyjnych dla weterynarzy z integracją OpenAI
82 PLN
Cel: maksymalnie zautomatyzować wstępną selekcję kandydatów bez udziału pracodawcy. 1. Kandydat przechodzi przez link do bota Telegram i rozpoczyna rozmowę zespołem /start. 2. Bot kolejno zadaje 18 wcześniej ustalonych pytań. 3. Odpowiedzi przyjmowane są tylko w formie… AI i uczenie maszynowe, Tworzenie chatbota ∙ 1 dzień 4 godziny temu ∙ 83 oferty |