ZIKIT
Specyfikacja Techniczna (ST): Moduł Smart OCR
Cel: Zautomatyzować wprowadzanie danych o wydatkach (Kwota, Data, Kategoria) na podstawie zdjęcia paragonu wykonanego przez użytkownika
Etap 1: Optymalizacja przechwytywania obrazu (Frontend — Kamera)
Etap 2: Przetwarzanie i Rozpoznawanie danych (Backend — Serwer)
a teraz językiem zamawiającego
Już kończymy oprogramowanie, ale nie ma tam rozpoznawania paragonów, musimy stworzyć specyfikację techniczną. Tak więc - osoba (użytkownik) fotografuje paragon i musimy:
1. Pomóc mu sfotografować paragon - na telefonie powinna być jakaś ramka lub coś podobnego, a przy prawidłowym ustawieniu i ostrości ta ramka powinna stać się zielona i może zrobić zdjęcie
2. Ocenić jakość zdjęcia i poinformować go - czy jesteśmy zadowoleni z jakości, czy nie
3. Musimy rozpoznać na zdjęciu kwotę całkowitą i datę (hebrajski - pomożemy w czym możemy)
4. Musimy zrozumieć, do jakiej kategorii wydatków przypisać ten konkretny wydatek (będzie ich niewiele, nie więcej niż 5-7, tzn. będą one uproszczone - np. jedzenie, odzież, transport, media, wypoczynek, dzieci i ????)
5. Musimy rozdzielić te informacje po odpowiednich polach programu
6. Musimy poprosić użytkownika o sprawdzenie i potwierdzenie lub zmianę rozpoznanych przez nas danych
W pierwszym przybliżeniu to całe zadanie
-
10 dni3635 PLN10 dni3635 PLN
Witam!
Jestem gotowa szybko i jakościowo zrealizować zadanie. Zawsze jestem w kontakcie i szybko uwzględnię wszystkie życzenia.
-
7 dni2544 PLN
2382 8 0 7 dni2544 PLNCześć, jest podobny bot do telegramu, który rozpoznaje paragony zakupowe (jakiekolwiek), klasyfikuje je do wcześniej ustalonych kategorii + według własnego uznania. Google OCR + gemini AI. Dokładność 99,99%. Czas rozpoznawania do 2 sekund. Mogę pokazać przykład. W projekcie trzeba omówić szczegóły, co już zostało zrobione.
-
4 dni5452 PLN
276 4 dni5452 PLNModuł Smart OCR — Propozycja Biznesowa
Nazywam się Christopher Bruce, założyciel ActuarialOS, firmy zajmującej się analizą finansową i inżynierią oprogramowania, koncentrującej się dokładnie na tego rodzaju wyzwaniach. Proponuję architekturę dla Twojego systemu OCR jako propozycję.
Proponujemy Moduł Smart OCR do automatyzacji wprowadzania danych wydatków z zdjęć paragonów, dostarczając bezproblemowe, gotowe do produkcji i skalowalne rozwiązanie. W swojej istocie system jest oparty na zbiorze danych, wydobywając kanoniczną strukturę dla każdego paragonu: {Kwota, Data, Kategoria} + metadane + walidacja użytkownika. Ten zbiór danych jest kręgosłupem wszystkich operacji.
Moduł zawiera:
Interfejs Użytkownika do Przechwytywania i Wskazówek: Strumień kamery w czasie rzeczywistym z nałożonym ramką; ramka zmienia kolor na zielony, gdy paragon jest wyrównany, ostro i dobrze oświetlony; prowadzi użytkowników do przechwytywania wysokiej jakości obrazów.
…
Silnik Oceny Jakości: Ocena rozmycia, przechylenia i oświetlenia; dostarcza informacji zwrotnej, aby zapewnić, że tylko użyteczne obrazy przechodzą dalej.
Silnik OCR i Ekstrakcji Pól: Rozpoznaje kwotę, datę (w tym formatowanie hebrajskie) i opcjonalne metadane; generuje dane strukturalne z wynikami pewności dla każdego pola.
Klasyfikacja Kategorii: Przypisuje każdy wydatek do zdefiniowanych kategorii (Jedzenie, Transport, Odzież, Czas wolny, Usługi, Dzieci, Inne) z oceną pewności.
Warstwa Walidacji Użytkownika: Wypełnia rozpoznane pola do przeglądu i korekty; aktualizuje kanoniczny zbiór danych zweryfikowanymi wartościami.
Warstwa Integracji: Bezpieczne API łączące frontend, backend i główny system; wspiera skalowalność, przetwarzanie wsadowe i analizy.
System jest modułowy i rozszerzalny: nowe kategorie, układy, języki lub metadane mogą być dodawane bez zmiany rdzenia silnika. Wyniki pewności, rejestrowanie błędów i walidacja użytkownika zapewniają wysoką dokładność, podczas gdy strukturalne wyjścia integrują się bezproblemowo z analizą finansową, księgowością lub systemami raportowania.
Wyniki: w pełni wdrożony silnik Smart OCR, interfejs do przechwytywania i walidacji na froncie, rozpoznawanie i klasyfikacja w backendzie, strukturalne dane wyjściowe oraz API gotowe do integracji. Rozwiązanie jest skalowalne, solidne i skoncentrowane na użytkowniku, przekształcając każde zdjęcie paragonu w użyteczne, zweryfikowane dane wydatków.
Mogę to dostarczyć szybko, w ciągu 7 dni. Posiadam wiedzę i zoptymalizowane procesy, aby to zrealizować.
Z poważaniem, Christopher
-
2 dni2544 PLN
9392 20 0 1 2 dni2544 PLNDzień dobry, napiszę dla was Smart OCR. Mam doświadczenie w pisaniu OCR dla wyciągów bankowych, wszystko działa szybko i dokładnie z integracją Azure OCR + OpenAI GPT-4o w startupie klienta. Proszę o kontakt, omówimy szczegóły. Będę zadowolony ze współpracy.
-
12 dni36 346 PLN
12862 4 2 12 dni36 346 PLNCześć,
Mogę zbudować moduł Smart OCR do przechwytywania zdjęć paragonów, sprawdzania jakości oraz wyodrębniania kwoty, daty i kategorii.
Mam doświadczenie w integrowaniu systemów rozpoznawania i walidacji danych z przyjaznym interfejsem użytkownika/UX.
Mogę zapewnić, że wyodrębnione dane są poprawnie wypełnione i umożliwić użytkownikom ich potwierdzenie lub edytowanie.
Jestem pewny, że dostarczę niezawodne i dokładne rozwiązanie dla twojej platformy.
Z poważaniem,
-
2 dni1454 PLN
184 1 1 2 dni1454 PLNWitaj! Jestem gotów zrealizować ten projekt, mam duże doświadczenie w tworzeniu różnych aplikacji.
-
7 dni2908 PLN
224 7 dni2908 PLNCześć!
Zrealizujemy moduł Smart OCR za 800 $ w ciągu 7 dni.
Mamy już doświadczenie w opracowywaniu systemów z rozpoznawaniem obrazów, automatyzacją przeglądarki i rozwiązaniami zabezpieczeń. Realizujemy pełny cykl:
— optymalizacja przechwytywania obrazu z ramką i autofokusem (zielona indikacja jakości zdjęcia),
— ocena jakości zdjęcia i powiadomienie użytkownika,
— rozpoznawanie kwoty i daty na paragonie (w tym wsparcie dla hebrajskiego),
— automatyczna klasyfikacja według kategorii wydatków (jedzenie, transport, media itp.),
— wypełnianie odpowiednich pól i weryfikacja przez użytkownika.
…
Zapewnimy wygodny UI/UX i stabilną część serwerową z rozszerzeniem na przyszłe funkcje.
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
Znalezienie i wdrożenie najlepszych projektów dla 4 maszyn Mac Mini M4
834 PLN
Znajdowanie i wdrażanie najlepszych projektów dla 4 maszyn Mac Mini M4Witam,Szukam doświadczonego technicznego freelancera, który rozumie sprzęt Mac Mini M4, DePIN, węzły blockchain, wnioskowanie AI, systemy automatyzacji, Docker i monitorowanie serwerów.Obecnie posiadam 4… AI i uczenie maszynowe, Kryptowaluty i blockchain ∙ 8 godzin 13 minut temu ∙ 3 oferty |
Opracowanie konsultanta AI dla strony internetowej do weryfikacji wiz pracowniczych (WordPress)Opracowanie AI-konsultanta dla strony internetowej do sprawdzania wiz pracowniczych (WordPress) O projekcie Tworzona jest anglojęzyczna strona internetowa do wstępnej weryfikacji możliwości uzyskania wizy pracowniczej do Izraela. Potrzebny jest AI-konsultant w formacie czatu… AI i uczenie maszynowe, Tworzenie chatbota ∙ 15 godzin 34 minuty temu ∙ 30 ofert |
II agenci i aplikacje
2213 PLN
Szukam osoby, która już pracuje z agentami AI, które stworzyła, która wie, jak zapewnić bezpieczeństwo, uruchomić serwer, stworzyć aplikacje AI - osoby, która już ma praktyczne doświadczenie z AI na "TY". Po co szukam? Żeby mnie nauczyła, jak to robić, bo chcę dodać agentów… AI i uczenie maszynowe, AI consult ∙ 1 dzień 22 godziny temu ∙ 17 ofert |
Generator stron internetowych (AI)potrzebna strona do generowania stron nawet najprostsza - przygotowano 20 szablonów i już dobiera najbardziej potrzebny generowanie stron odbywa się na podstawie jednego promptu (opis firmy) interesuje proste rozwiązanie i płatność nie za wszystkie pieniądze świata AI i uczenie maszynowe ∙ 5 dni 7 godzin temu ∙ 32 oferty |
Tekst na mowę prompt chatgptnależy przez https://developers.openai.com/api/reference/resources/audio/subresources/speech/methods/create ustawić takie parametry głosu, aby był on podobny do tego, który przekażę w wiadomości prywatnej tylko jeśli już był taki doświadczenie oto takie parametry tuningu są… AI voice, AI i uczenie maszynowe ∙ 5 dni 14 godzin temu ∙ 11 ofert |