Rozwój systemu Highload z fine tuning modeli LLM
Opracowanie systemu o wysokim obciążeniu (Highload) z fine tuningiem modeli LLM dla internetowej usługi multimodalnego wyszukiwania produktów na podstawie zdjęć i zapytań tekstowych, jednocześnie zintegrowanej z komunikatorami przez osobistego agenta-asystenta.
-
45 dni28 596 PLN45 dni28 596 PLN
Patrzcie, jest tu niuans - to nie jest zadanie dotyczące prostego chatbota, lecz produktowy system wyszukiwania, gdzie cena błędu w architekturze jest wysoka =/
Co do terminów, zakładałbym pierwszy bezpieczny etap na 45 dni i 7600 USD - projektowanie, sprawdzenie multimodalnego wyszukiwania na waszych produktach, prototyp agenta w komunikatorach, schemat danych, kolejka przetwarzania zdjęć, metryki jakości wyszukiwania i plan dalszego uczenia modelu. Pełny rozwój już zależy od obciążenia i katalogu, najprawdopodobniej to osobny budżet od 20000 USD.
Wizja realizacji jest taka -
> normalizujemy katalog, atrybuty, zdjęcia i opisy produktów
> budujemy multimodalne wyszukiwanie - wektorowy indeks, ranking, filtry, sprawdzenie trafności
> robimy agenta w komunikatorach, który precyzuje zapytanie, pokazuje opcje i przekazuje zdarzenie do panelu administracyjnego
> osobno liczymy jakość wyszukiwania i dane do dalszego uczenia, w przeciwnym razie model będzie ładnie odpowiadał, ale sprzedawał słabiej
…
Od was na starcie potrzebne są katalog produktów, przykłady zdjęć, opis docelowych komunikatorów i przynajmniej szacunkowa ocena szczytowych obciążeń. Generalnie dobrze jest nie zaczynać od dużej budowy, a od weryfikowanego etapu - najpierw udowodnić jakość wyszukiwania na rzeczywistych produktach.
Uściślę 2 rzeczy -
> jaki jest zakres katalogu - produktów, zdjęć, języków, aktualizacji dziennie
> czy dalsze uczenie LLM jest rzeczywiście konieczne, czy można zacząć od multimodalnych embeddingów, rankingu i RAG, a fine tuning zostawić na później po zgromadzeniu przykładów do nauki
Z bliskiego doświadczenia -
> https://business.ingello.com/vorfahr - usługa AI, praca ze zdjęciami, generowaniem treści i logiką produktową
> https://business.ingello.com/fractal - architektura agentowa i automatyzacja złożonych procesów roboczych
> https://business.ingello.com/prime-eva - dane produktowe, produkcja, integracje i księgowość
Strona główna zespołu dla FLH -
> https://systems-fl.ingello.com
-
1 dzień94 PLN
16221 36 0 1 dzień94 PLNHi Nick,
This is squarely my area: AI search, vision, and agent assistants in messengers. One honest reframe up front, since it changes the budget.
"Multimodal photo + text search" usually doesn't need LLM fine-tuning. The search core is image+text embeddings (CLIP-style) indexed in a vector DB (pgvector or
Qdrant) with hybrid filtering and a reranking pass. That gets strong relevance on your catalog without the cost and fragility of training. Real fine-tuning only
earns its keep if we measure generic embeddings underperforming on your specific products, and then it's targeted, not the whole core.
The LLM's actual job is the agent layer in the messenger: clarify the query, call the search tool, present product cards. That's function-calling/RAG, not the
… retrieval engine.
How I'd build it:
- Ingest catalog (photos, text, attributes), embed, index in a vector DB
- Hybrid search (vector + attribute filters) with a reranker
- Agent in Telegram/WhatsApp via Bot API: photo or text in, ranked cards out
- Event-driven queue for photo processing and traffic spikes, so nothing drops under load
To de-risk it, I'd start with a short paid discovery + a prototype on a slice of your real catalog, measured with recall@k, before committing to the high-load build.
That proves quality on your data first.
Relevant work: I built a dashboard over a private GPU inference platform (FastAPI, vector memory, live model state), shipped production LLM features and vision-API
search, and event-driven messenger bots. Examples in private. 36 projects on Freelancehunt, all 100%, 10/10.
Three questions to scope it: catalog size, target load (requests/min), and which messenger first? And is there an existing catalog API?
-
1 dzień621 PLN
893 1 0 1 dzień621 PLNDzień dobry, Nick.
Krótko:
Twój serwis otrzyma multimodalne wyszukiwanie, zdolne jednocześnie przetwarzać zapytania zdjęciowe i tekstowe za pośrednictwem osobistego agenta w Telegramie lub WhatsApp. Rdzeń wyszukiwania oparty na fine-tuned LLM oraz modelach wizji zapewni wysoką dokładność wyników. Wyszukiwanie tekstowe wzmocnimy wektorowym indeksem pgvector, aby natychmiast znajdować podobne produkty nawet przy niepełnym opisie. System będzie działał na Kubernetes z automatycznym skalowaniem, więc szczytowe obciążenia nie wpłyną na szybkość. Integracja przez komunikatory pozwoli użytkownikom wysyłać zdjęcia i tekst na czacie, a asystent zwróci zestaw produktów z twojego katalogu. Fine-tuning na twoich danych gwarantuje dokładność, niedoścignioną dla ogólnych modeli.
Szczegóły:
Multimodalne wyszukiwanie wymaga głębokiego fine-tuningu LLM pod twój katalog, w przeciwnym razie trafność pozostanie na poziomie modeli ogólnych. Rdzeń wyszukiwania połączy model bazowy z dalszym uczeniem na twoich danych oraz wektorowy indeks pgvector do wyszukiwania semantycznego. Komponent wizji wyodrębni cechy ze zdjęć, a tekst doprecyzuje kontekst — oba strumienie połączą się w jedyny ranked-wynik. Architektura na Kubernetes z niezależnym skalowaniem węzłów (wizja, tekst, ranking) zapewni stabilną latencję. Architektura oparta na zdarzeniach z kolejkami wiadomości ochroni przed utratą zapytań podczas szczytów ruchu, a użytkownik otrzyma karty produktów z bezpośrednimi linkami.
…
Następnym krokiem dokładność wyszukiwania można zwiększyć dzięki hybrydowemu podejściu RAG z fine-tuningiem. To pozwoli agentowi natychmiast aktualizować wiedzę o stanach magazynowych i cenach bez ponownego uczenia modelu, co jest krytyczne dla dynamicznego katalogu e-commerce.
Jeszcze później konwersja wzrośnie dzięki modułowi analitycznemu, który będzie śledził najpopularniejsze wizualne zapytania. Otrzymasz jasne zrozumienie tego, czego dokładnie szukają użytkownicy, aby zoptymalizować zakupy i marketing.
Jestem gotów omówić szczegóły katalogu, wolumeny zapytań i wybór modelu bazowego do fine-tuningu.
-
45 dni4891 PLN
1510 10 0 45 dni4891 PLNMamy doświadczenie w budowaniu architektur Highload i dalszym szkoleniu LLM do zadań multimodalnych. Realizujemy system za pomocą mikroserwisów w Pythonie z wykorzystaniem baz danych wektorowych do szybkiego wyszukiwania oraz integracją API komunikatorów do pracy agenta. Zapewnimy skalowalność i dokładność przetwarzania zapytań dotyczących zdjęć i tekstu. Jesteśmy gotowi do rozpoczęcia projektowania architektury.
-
35 dni94 064 PLN
196 35 dni94 064 PLNmamy już praktycznie gotowe podobne rozwiązanie dla wyszukiwania AI i asystenta w komunikatorach, które można szybko dostosować i uruchomić pod wasz katalog ))
W przypadku zadania zakładałbym pierwszy etap roboczy od 250000 UAH i około 35 dni roboczych na prototyp z wyszukiwaniem po zdjęciach i tekstach, rankingiem, agentem i podstawową integracją w komunikatory.
Zobaczcie, tu jest niuans - dla wersji przemysłowej najważniejsze jest wcześniejsze sprawdzenie !!obciążenia, jakości wyszukiwania i struktury katalogu!!, w przeciwnym razie fine tuning może stać się drogą zabawką bez zauważalnych korzyści.
W realizacji poszedłbym przez warstwę danych, wyszukiwanie wektorowe i tekstowe, oddzielną warstwę rankingu, scenariusze agenta, logowanie zapytań i metryki jakości wyników po stronie serwisu.
Od was potrzebne są: eksport katalogu, zdjęcia, opisy, zasady wydawania, lista komunikatorów i dostęp do testowego API.
Uściślę dwa punkty - jaki jest rozmiar katalogu i jakie jest docelowe obciążenie w zapytaniach na minutę?
Jakie komunikatory są potrzebne w pierwszym uruchomieniu i czy istnieje już API katalogu?
Z podobnych rozwiązań dotyczących AI i agentów - https://business.ingello.com/vorfahr i https://business.ingello.com/fractal
Jako bliski przykład dotyczący e-commerce i logiki katalogowej - https://business.ingello.com/prime-eva
… Więcej o nas dla giełdy - https://systems-fl.ingello.com
Jesteśmy w kontakcie, możemy omówić szczegóły w ramach projektu =)
-
Zadaj swoje pytanie zleceniodawcy