Система распознавания номерных знаков (ALPR)
О проекте
Проект направлен на создание системы компьютерного зрения для автоматической идентификации транспортных средств путем считывания их номерных знаков. Система работает в два этапа: сначала находит номер на изображении, а затем распознает текст на нем.
Натренировал модель на кастомном датасете, достигнув высокой точности обнаружения локализации номера.
Интегрировал библиотеку PaddleOCR для извлечения текста из вырезанных (cropped) изображений номеров.
Реализовал скрипт на Python с использованием OpenCV для визуализации результатов (bounding boxes + текст) и фильтрации предсказаний по порогу уверенности (confidence threshold).
Пайплайн инференса:
1. Изображение подается на вход модели.
2. Полученные координаты (xyxy) используются для вырезания области номера (ROI crop).
3. Вырезанный фрагмент передается в PaddleOCR для распознавания текста.
4. Результат фильтруется по порогу уверенности (conf_thresh=0.5).
Визуализация:
С помощью OpenCV на оригинальное изображение наносятся рамки и распознанный текст, результат сохраняется локально.
Технический стек
• Язык: Python
• ML/DL Frameworks: PyTorch, PaddlePaddle
• CV Libraries: Ultralytics (YOLO), PaddleOCR, OpenCV
#машинноеобучение #компьютерноезрение #ML #AI
Проект направлен на создание системы компьютерного зрения для автоматической идентификации транспортных средств путем считывания их номерных знаков. Система работает в два этапа: сначала находит номер на изображении, а затем распознает текст на нем.
Натренировал модель на кастомном датасете, достигнув высокой точности обнаружения локализации номера.
Интегрировал библиотеку PaddleOCR для извлечения текста из вырезанных (cropped) изображений номеров.
Реализовал скрипт на Python с использованием OpenCV для визуализации результатов (bounding boxes + текст) и фильтрации предсказаний по порогу уверенности (confidence threshold).
Пайплайн инференса:
1. Изображение подается на вход модели.
2. Полученные координаты (xyxy) используются для вырезания области номера (ROI crop).
3. Вырезанный фрагмент передается в PaddleOCR для распознавания текста.
4. Результат фильтруется по порогу уверенности (conf_thresh=0.5).
Визуализация:
С помощью OpenCV на оригинальное изображение наносятся рамки и распознанный текст, результат сохраняется локально.
Технический стек
• Язык: Python
• ML/DL Frameworks: PyTorch, PaddlePaddle
• CV Libraries: Ultralytics (YOLO), PaddleOCR, OpenCV
#машинноеобучение #компьютерноезрение #ML #AI