Hybrydowy system wyszukiwania filmów
Opracowałem hybrydowy multimodalny system wyszukiwania filmów, który znajduje filmy za pomocą obrazów (zrzutów ekranu, kadrów), opisów tekstowych lub kombinowanych zapytań. Stworzyłem wielkoskalowy pipeline z rozszerzoną oczyszczaniem i deduplikacją danych, w wyniku czego uzyskano około 8000 wysokiej jakości filmów z 1 miliona i otrzymałem ponad 40 000 wektorowych embeddingów. Użyłem CLIP do łączenia obrazów i tekstu oraz FAISS do szybkiego wyszukiwania według podobieństwa. Wspiera wyszukiwanie tylko za pomocą obrazów, tylko za pomocą tekstu oraz ważone wyszukiwanie za pomocą obrazów + tekstu z wysoką dokładnością.
#uczenie maszynowe #silnikwyszukiwania #wizjatekstowa #python
#uczenie maszynowe #silnikwyszukiwania #wizjatekstowa #python