ZIKIT
Specyfikacja Techniczna (ST): Moduł Smart OCR
Cel: Zautomatyzować wprowadzanie danych o wydatkach (Kwota, Data, Kategoria) na podstawie zdjęcia paragonu wykonanego przez użytkownika
Etap 1: Optymalizacja przechwytywania obrazu (Frontend — Kamera)
Etap 2: Przetwarzanie i Rozpoznawanie danych (Backend — Serwer)
a teraz językiem zamawiającego
Już kończymy oprogramowanie, ale nie ma tam rozpoznawania paragonów, musimy stworzyć specyfikację techniczną. Tak więc - osoba (użytkownik) fotografuje paragon i musimy:
1. Pomóc mu sfotografować paragon - na telefonie powinna być jakaś ramka lub coś podobnego, a przy prawidłowym ustawieniu i ostrości ta ramka powinna stać się zielona i może zrobić zdjęcie
2. Ocenić jakość zdjęcia i poinformować go - czy jesteśmy zadowoleni z jakości, czy nie
3. Musimy rozpoznać na zdjęciu kwotę całkowitą i datę (hebrajski - pomożemy w czym możemy)
4. Musimy zrozumieć, do jakiej kategorii wydatków przypisać ten konkretny wydatek (będzie ich niewiele, nie więcej niż 5-7, tzn. będą one uproszczone - np. jedzenie, odzież, transport, media, wypoczynek, dzieci i ????)
5. Musimy rozdzielić te informacje po odpowiednich polach programu
6. Musimy poprosić użytkownika o sprawdzenie i potwierdzenie lub zmianę rozpoznanych przez nas danych
W pierwszym przybliżeniu to całe zadanie
-
10 dni3717 PLN10 dni3717 PLN
Witam!
Jestem gotowa szybko i jakościowo zrealizować zadanie. Zawsze jestem w kontakcie i szybko uwzględnię wszystkie życzenia.
-
7 dni2602 PLN
2403 8 0 7 dni2602 PLNCześć, jest podobny bot do telegramu, który rozpoznaje paragony zakupowe (jakiekolwiek), klasyfikuje je do wcześniej ustalonych kategorii + według własnego uznania. Google OCR + gemini AI. Dokładność 99,99%. Czas rozpoznawania do 2 sekund. Mogę pokazać przykład. W projekcie trzeba omówić szczegóły, co już zostało zrobione.
-
4 dni5575 PLN
252 4 dni5575 PLNModuł Smart OCR — Propozycja Biznesowa
Nazywam się Christopher Bruce, założyciel ActuarialOS, firmy zajmującej się analizą finansową i inżynierią oprogramowania, koncentrującej się dokładnie na tego rodzaju wyzwaniach. Proponuję architekturę dla Twojego systemu OCR jako propozycję.
Proponujemy Moduł Smart OCR do automatyzacji wprowadzania danych wydatków z zdjęć paragonów, dostarczając bezproblemowe, gotowe do produkcji i skalowalne rozwiązanie. W swojej istocie system jest oparty na zbiorze danych, wydobywając kanoniczną strukturę dla każdego paragonu: {Kwota, Data, Kategoria} + metadane + walidacja użytkownika. Ten zbiór danych jest kręgosłupem wszystkich operacji.
Moduł zawiera:
Interfejs Użytkownika do Przechwytywania i Wskazówek: Strumień kamery w czasie rzeczywistym z nałożonym ramką; ramka zmienia kolor na zielony, gdy paragon jest wyrównany, ostro i dobrze oświetlony; prowadzi użytkowników do przechwytywania wysokiej jakości obrazów.
…
Silnik Oceny Jakości: Ocena rozmycia, przechylenia i oświetlenia; dostarcza informacji zwrotnej, aby zapewnić, że tylko użyteczne obrazy przechodzą dalej.
Silnik OCR i Ekstrakcji Pól: Rozpoznaje kwotę, datę (w tym formatowanie hebrajskie) i opcjonalne metadane; generuje dane strukturalne z wynikami pewności dla każdego pola.
Klasyfikacja Kategorii: Przypisuje każdy wydatek do zdefiniowanych kategorii (Jedzenie, Transport, Odzież, Czas wolny, Usługi, Dzieci, Inne) z oceną pewności.
Warstwa Walidacji Użytkownika: Wypełnia rozpoznane pola do przeglądu i korekty; aktualizuje kanoniczny zbiór danych zweryfikowanymi wartościami.
Warstwa Integracji: Bezpieczne API łączące frontend, backend i główny system; wspiera skalowalność, przetwarzanie wsadowe i analizy.
System jest modułowy i rozszerzalny: nowe kategorie, układy, języki lub metadane mogą być dodawane bez zmiany rdzenia silnika. Wyniki pewności, rejestrowanie błędów i walidacja użytkownika zapewniają wysoką dokładność, podczas gdy strukturalne wyjścia integrują się bezproblemowo z analizą finansową, księgowością lub systemami raportowania.
Wyniki: w pełni wdrożony silnik Smart OCR, interfejs do przechwytywania i walidacji na froncie, rozpoznawanie i klasyfikacja w backendzie, strukturalne dane wyjściowe oraz API gotowe do integracji. Rozwiązanie jest skalowalne, solidne i skoncentrowane na użytkowniku, przekształcając każde zdjęcie paragonu w użyteczne, zweryfikowane dane wydatków.
Mogę to dostarczyć szybko, w ciągu 7 dni. Posiadam wiedzę i zoptymalizowane procesy, aby to zrealizować.
Z poważaniem, Christopher
-
2 dni2602 PLN
9340 20 0 1 2 dni2602 PLNDzień dobry, napiszę dla was Smart OCR. Mam doświadczenie w pisaniu OCR dla wyciągów bankowych, wszystko działa szybko i dokładnie z integracją Azure OCR + OpenAI GPT-4o w startupie klienta. Proszę o kontakt, omówimy szczegóły. Będę zadowolony ze współpracy.
-
12 dni37 167 PLN
12784 4 2 12 dni37 167 PLNCześć,
Mogę zbudować moduł Smart OCR do przechwytywania zdjęć paragonów, sprawdzania jakości oraz wyodrębniania kwoty, daty i kategorii.
Mam doświadczenie w integrowaniu systemów rozpoznawania i walidacji danych z przyjaznym interfejsem użytkownika/UX.
Mogę zapewnić, że wyodrębnione dane są poprawnie wypełnione i umożliwić użytkownikom ich potwierdzenie lub edytowanie.
Jestem pewny, że dostarczę niezawodne i dokładne rozwiązanie dla twojej platformy.
Z poważaniem,
-
2 dni1487 PLN
172 1 1 2 dni1487 PLNWitaj! Jestem gotów zrealizować ten projekt, mam duże doświadczenie w tworzeniu różnych aplikacji.
-
7 dni2973 PLN
248 7 dni2973 PLNCześć!
Zrealizujemy moduł Smart OCR za 800 $ w ciągu 7 dni.
Mamy już doświadczenie w opracowywaniu systemów z rozpoznawaniem obrazów, automatyzacją przeglądarki i rozwiązaniami zabezpieczeń. Realizujemy pełny cykl:
— optymalizacja przechwytywania obrazu z ramką i autofokusem (zielona indikacja jakości zdjęcia),
— ocena jakości zdjęcia i powiadomienie użytkownika,
— rozpoznawanie kwoty i daty na paragonie (w tym wsparcie dla hebrajskiego),
— automatyczna klasyfikacja według kategorii wydatków (jedzenie, transport, media itp.),
— wypełnianie odpowiednich pól i weryfikacja przez użytkownika.
…
Zapewnimy wygodny UI/UX i stabilną część serwerową z rozszerzeniem na przyszłe funkcje.
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
Zbudować model klasyfikacji klientów1. Są dane klientów w Mongo/SQL (około 20 000 zapisów z surowymi danymi). 2. Należy na ich podstawie zbudować cechy i model klasyfikacji klientów na grupy behawioralne. 3. Projekt wykonać w Pythonie. AI i uczenie maszynowe, Python ∙ 1 dzień 11 godzin temu ∙ 29 ofert |
Integracja modułów skanerów stomatologicznych w CRM
2235 PLN
Opracowaliśmy system CRM do współpracy z dentystami i laboratoriami. Należy zintegrować usługi iTero, sirona, medit i inne, aby pliki były automatycznie pobierane. AI i uczenie maszynowe, Java ∙ 1 dzień 13 godzin temu ∙ 22 oferty |
Stworzyć zespół agentów AIChcę stworzyć sobie zespół agentów AI, którzy będą pomagać w codziennym życiu, kontrolować procesy biznesowe, analizować raporty itd. AI i uczenie maszynowe ∙ 1 dzień 16 godzin temu ∙ 28 ofert |
Automatyzacja IT prowadzenia raportowania VAT
828 PLN
Konieczne jest opracowanie systemu do automatyzacji przenoszenia danych o sprzedaży z CRM do systemu księgowego Wafeq. System ma importować raporty bankowe i płatnicze, automatycznie uzgadniać płatności z fakturami, generować faktury do raportowania VAT oraz minimalizować pracę… AI i uczenie maszynowe, Python ∙ 1 dzień 17 godzin temu ∙ 39 ofert |
Opracowanie agenta AI do sprzedaży dla sklepu internetowego na PrestaShop 1.6 z integracją KeyCRMSzukamy dewelopera lub małego zespołu do stworzenia AI-konsultanta sprzedaży dla internetowego sklepu z literaturą edukacyjną. Strona działa na PrestaShop 1.6, CRM — KeyCRM. Potrzebny jest nie zwykły chatbot z gotowymi odpowiedziami, ale AI-sprzedawca, który pomoże klientowi… AI i uczenie maszynowe, Sklepy internetowe i e-commerce ∙ 1 dzień 22 godziny temu ∙ 39 ofert |