Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
O projekcie
Projekt ma na celu stworzenie systemu komputerowego widzenia do automatycznej identyfikacji pojazdów poprzez odczytywanie ich tablic rejestracyjnych. System działa w dwóch etapach: najpierw znajduje numer na obrazie, a następnie rozpoznaje tekst na nim.
Wytrenuj model na niestandardowym zbiorze danych, osiągając wysoką dokładność lokalizacji numeru.
Zintegrowałem bibliotekę PaddleOCR do wyodrębniania tekstu z przyciętych (cropped) obrazów numerów.
Zrealizowałem skrypt w Pythonie z użyciem OpenCV do wizualizacji wyników (ramki ograniczające + tekst) oraz filtrowania prognoz według progu pewności (confidence threshold).

Pipeline inferencji:
1. Obraz jest podawany na wejście modelu.
2. Otrzymane współrzędne (xyxy) są używane do wycięcia obszaru numeru (ROI crop).
3. Wycięty fragment jest przekazywany do PaddleOCR w celu rozpoznania tekstu.
4. Wynik jest filtrowany według progu pewności (conf_thresh=0.5).

Wizualizacja:
Za pomocą OpenCV na oryginalny obraz nakładane są ramki oraz rozpoznany tekst, wynik jest zapisywany lokalnie.

Stos technologiczny
• Język: Python
• Frameworki ML/DL: PyTorch, PaddlePaddle
• Biblioteki CV: Ultralytics (YOLO), PaddleOCR, OpenCV

#machinelearning #computervision #ML #AI
Szczegóły pracy
Dodana 29 listopada 2025
96 wyświetleń
Freelancer
Illia Yermachenkov
Ukraina Krzywego Rogu
Brak opinii

Gotowy do podjęcia pracy Gotowy do podjęcia pracy
W serwisie 1 rok