Hybrid Movie Search System
Розробив гібридну мультимодальну систему пошуку фільмів, яка знаходить фільми за допомогою зображень (скріншотів, кадрів), текстових описів або комбінованих запитів. Створив великомасштабний пайплайн з розширеною очисткою та дедуплікацією даних, в результаті чого було отримано близько 8000 високоякісних фільмів з 1 мільйона та отрымав понад 40 000 векторних ембендінгів. Використовував CLIP для об'єднання зображень і тексту та FAISS для швидкого пошуку за схожістю. Підтримує пошук тільки за зображеннями, тільки за текстом і зважений пошук за зображеннями + текстом з високою точністю.
#machinelearining #searchengine #computervision #python
#machinelearining #searchengine #computervision #python