Гибридная система поиска фильмов
Разработал гибридную мультимодальную систему поиска фильмов, которая находит фильмы с помощью изображений (скриншотов, кадров), текстовых описаний или комбинированных запросов. Создал крупномасштабный пайплайн с расширенной очисткой и дедупликацией данных, в результате чего было получено около 8000 высококачественных фильмов из 1 миллиона и получил более 40 000 векторных эмбеддингов. Использовал CLIP для объединения изображений и текста и FAISS для быстрого поиска по схожести. Поддерживает поиск только по изображениям, только по тексту и взвешенный поиск по изображениям + тексту с высокой точностью.
#машинноеобучение #поисковаясистема #компьютерное_зрение #питон
#машинноеобучение #поисковаясистема #компьютерное_зрение #питон