Budżet: 4000 UAH Termin: 1 dzień
zamawiający wszystko zrobił, ale nie działa mały szczegół)) to tylko komentarz, proszę nie rozważajcie mnie do tego projektu
Zadanie: wdrożenie usługi LLM, która zna całą dokumentację firmy i odpowiada na pytania menedżerów działu sprzedaży.
Co jest teraz: klient samodzielnie stworzył prototyp (oddzielny projekt z załadowanymi informacjami o firmie, umieszczony na serwerze), ale informacje z bazy nie są przekazywane do modelu — prawdopodobnie problem z API. Kod i dostęp udostępnimy. Pierwszy krok — audyt: naprawić istniejące lub uzasadnione zbudować od nowa.
Wymagana funkcjonalność:
W odpowiedzi proszę podać: przykłady podobnych projektów RAG, stack, czas, koszt pracy oraz orientacyjną miesięczną koszt posiadania (tokeny + hosting).
Budżet: 4000 UAH Termin: 1 dzień
zamawiający wszystko zrobił, ale nie działa mały szczegół)) to tylko komentarz, proszę nie rozważajcie mnie do tego projektu
Budżet: 27000 UAH Termin: 3 dni
Wartość pierwszego etapu - 32000 UAH, czas - 3 dni robocze. To audyt istniejącego prototypu z weryfikacją API, przekazywaniem kontekstu do modelu, indeksowaniem dokumentów, bazą wektorową, autoryzacją i bieżącym kodem. 4000 UAH, według odczuć, nie pokrywa nawet normalnego audytu technicznego takiego zadania, nie mówiąc już o pełnej usłudze =/
Po audycie damy jedną z dwóch tras - naprawić istniejące lub przebudować od zera. Jeśli przebudować, roboczy minimalny RAG-asystent z dostępem do sieci, autoryzacją, historią zapytań, aktualizacją bazy bez programisty, HTTPS i gotowością do przyszłego podłączenia analitycznego magazynu oceniłbym osobno, orientacyjnie 15-30 dni roboczych i od 180000 UAH.
Stos - Python lub Node.js dla serwera, PostgreSQL plus pgvector lub Qdrant dla wyszukiwania wektorowego, OpenAI lub Claude przez API, osobny przetwornik dokumentów, interfejs webowy dla menedżerów, autoryzacja ról, dziennik zapytań. Aby odpowiedzi na podstawie dokumentów były użyteczne, trzeba dodać odniesienie do źródła lub przynajmniej nazwę znalezionego dokumentu, w przeciwnym razie menedżerowie nie będą mogli normalnie kontrolować jakości.
Orientacyjne koszty - hosting i baza 20-80 USD miesięcznie, tokeny 20-150 USD miesięcznie na początku. Dokładniej obliczymy po liczbie menedżerów, średniej długości dokumentów i liczbie zapytań dziennie. Model nie ma wymyślać faktów, dlatego robimy odpowiedź tylko z RAG i scenariusz, gdy danych w bazie nie ma.
Dwa pytania
> Ile mniej więcej dokumentów lub stron znajduje się w bazie wiedzy, i w jakich formatach są obecnie zgromadzone - PDF, Word, Google Docs, arkusze, strona?
> W obecnym prototypie już istnieje baza wektorowa, czy dokumenty są tylko załadowane na serwer bez normalnego wyszukiwania treści?
Podobne przypadki Ingello
> https://business.ingello.com/vorfahr - AI-automatyzacja z zastosowaną logiką biznesową, blisko do wewnętrznego asystenta dla zespołu sprzedaży.
> https://business.ingello.com/fractal - architektura agentowa i systemowa, przydatna do zadań, gdzie czat ma być częścią zarządzanego procesu.
> https://business.ingello.com/forma-crm - logika korporacyjna, role, procesy, kontrola jakości pracy zespołu.
Strona Freelancehunt Ingello - https://systems-fl.ingello.com/ua
!!Optymalny pierwszy krok - audyt, a nie obietnica całego produktu w budżecie 4000 UAH.!! Lepiej najpierw znaleźć, gdzie następuje zerwanie przekazywania wiedzy do modelu, a potem decydować, czy leczyć istniejące, czy zbierać od nowa.
Budżet: 4000 UAH Termin: 7 dni
Cześć, pracowałem nad asystentem AI dla firmy prawniczej — system RAG oparty na 200+ dokumentach, wektorowa baza Pinecone, API Claude, ~$45/miesiąc na tokeny przy 1000 zapytaniach.
W odniesieniu do twojego projektu — czy możesz sprecyzować, jaka obecnie wektorowa baza jest używana w prototypie i w jaki sposób dokumenty są przekazywane do modelu? To pomoże szybko znaleźć problem z API podczas audytu.
Proponuję się skontaktować, chętnie doradzę ci bezpłatnie z technicznej strony i wspólnie opracujemy plan rozwoju + opowiem o moim zespole!
Budżet: 4500 UAH Termin: 1 dzień
Witam!
Jestem Full-Stack Software Engineerem z ponad 7-letnim doświadczeniem w tworzeniu stron internetowych, rozwiązań SaaS, złożonych platform internetowych oraz MVP dla startupów - od pomysłu i architektury po produkcję i wsparcie.
Pracuję nie tylko jako programista, ale także z naciskiem na logikę biznesową, skalowalność i długoterminowe wsparcie rozwiązań. W portfolio znajdują się przykłady zrealizowanych projektów o różnym stopniu skomplikowania.
Stos technologiczny:
PHP (Laravel, Symfony, Yii2),
Frontend: JavaScript (Vue.js, React.js), HTML5, CSS3,
Bazy danych: MySQL, PostgreSQL.
Jeśli chodzi o terminy i koszty - na tym etapie trudno je poprawnie ocenić bez sprecyzowania wymagań. Aby sformułować uzasadnioną wycenę, zazwyczaj trzeba zrozumieć:
- cele projektu;
- kluczową funkcjonalność;
- oczekiwane obciążenie i integracje;
- priorytety (szybkie uruchomienie vs skalowanie).
Proponuję zacząć od krótkiego sprecyzowania wymagań lub rozmowy telefonicznej / korespondencji - po tym mogę przedstawić realistyczną ocenę co do terminów, budżetu i opcji realizacji.
Będę zadowolony, mogąc omówić szczegóły.
Budżet: 27000 UAH Termin: 14 dni
Mogę zająć się tym projektem szybkiego audytu obecnego prototypu, naprawić istniejącą integrację, jeśli będzie to uzasadnione, lub szybko przebudować usługę od podstaw, jeśli będzie to bardziej niezawodne i szybsze. Na wyjściu otrzymacie asystenta RAG, który odpowiada wyłącznie na podstawie dokumentów firmy, nie wymyśla faktów, ma interfejs webowy z autoryzacją dla menedżerów, historię zapytań i wygodne aktualizowanie bazy wiedzy bez programisty.
Proponowany stos: OpenAI lub Claude API, Python/FastAPI, PostgreSQL + pgvector lub Qdrant, React/Next.js dla interfejsu, pipeline ładowania i indeksowania dokumentów, wdrożenie na waszym serwerze lub w chmurze z HTTPS. Architektura może być od razu zaprojektowana tak, aby w przyszłości podłączyć asystenta do analitycznego magazynu danych.
Mam doświadczenie w podobnych rozwiązaniach RAG: wewnętrzne bazy wiedzy, wyszukiwanie w dokumentacji, asystenci FAQ, systemy dla zespołów sprzedaży/wsparcia z odpowiedziami na podstawie źródeł.
Budżet: 4000 UAH Termin: 3 dni
Dzień dobry!
Dopracowuję projekt https://salesslon.com - tam używane jest RAG do analizy rozmów menedżerów z klientami. Model nic nie wymyśla, działa wyłącznie z tekstami rozmów.
Zobaczę, co jest nie tak z waszym projektem, dlaczego nie działa. Jeśli nie ma krytycznych problemów - poprawię błąd. Jeśli wszystko jest źle - powiem, jak bym to zrobił.
Koszt RAG jest bardzo niski, zależy od objętości danych, są nawet darmowe modele.
Budżet: 4000 UAH Termin: 5 dni
Dzień dobry!
Pracowałem nad podobnymi rozwiązaniami AI, gdzie głównym zadaniem było stworzenie jednolitego systemu wiedzy oraz automatyzacja pracy z danymi. Z opisu widzę, że macie już prototyp, ale prawdopodobnie problem leży w integracji RAG-pipeline z LLM lub przekazywaniu kontekstu przez API. Zacząłbym od audytu technicznego, aby określić, czy bardziej opłaca się poprawić obecną architekturę, czy szybciej i pewniej ją przebudować.
W swoich projektach budowałem asystentów AI, automatyzowałem przetwarzanie danych przez Make.com, integrowałem CRM, usługi AI oraz API w jednolite procesy biznesowe, a także tworzyłem konsultantów AI do kwalifikacji leadów i spersonalizowanych odpowiedzi.
Orientacyjne terminy:
• audyt i przywrócenie obecnego rozwiązania — 2–4 dni;
• jeśli potrzebna jest pełna przebudowa — 7–10 dni roboczych.
Koszt:
• audyt — od 300 USD;
• pełna realizacja — 1,200–1,800 USD (w zależności od obecnego stanu kodu i wymagań).
Miesięczny koszt:
• hosting VPS — około 15–40 USD;
• tokeny OpenAI/Claude — orientacyjnie 20–150+ USD w zależności od liczby menedżerów i zapytań.
Proszę, dajcie znać, jaki model jest obecnie używany (OpenAI czy Claude) i jaką bazę wektorową już podłączaliście? To pomoże szybko ocenić, czy wystarczy poprawić istniejące rozwiązanie, czy warto od razu zaproponować bardziej niezawodną architekturę.
Budżet: 15000 UAH Termin: 7 dni
Obecnie najważniejsze jest znalezienie przyczyny, dlaczego prototyp nie przesyła danych z bazy wiedzy do LLM. Jeśli problem dotyczy tylko API lub RAG-pipeline'u — można to naprawić bez pełnej przebudowy. Jeśli jednak architektura została źle zbudowana, logiczniej będzie ją od razu przebudować, aby w przyszłości nie występowały problemy ze skalowaniem.
Co należy zrobić:
• przeprowadzić audyt obecnego projektu i sprawdzić integrację API;
• skonfigurować RAG, aby model odpowiadał tylko na podstawie dokumentacji;
• wdrożyć ładowanie i aktualizację bazy wiedzy bez udziału dewelopera;
• dodać interfejs webowy z autoryzacją i historią zapytań;
• przygotować system do dalszego podłączenia innych źródeł danych.
Warto również od razu zdecydować, jaki model używać (OpenAI czy Claude), ponieważ od tego zależeć będą jakość odpowiedzi i miesięczne wydatki na tokeny.
Jeśli udostępnicie dostęp do obecnego projektu, można szybko zrozumieć, czy wystarczy poprawić istniejące rozwiązanie, czy korzystniej będzie zbudować nową architekturę.
Budżet: 4000 UAH Termin: 3 dni
RAG-asystent dla sprzedaży EN: audyt twojego prototypu → naprawa pobierania lub przebudowa (Python/FastAPI, pgvector, Claude/GPT). Web + autoryzacja, przesyłanie bez programisty, historia zapytań, tryb „wstawiłem pytanie klienta — otrzymałem odpowiedź”. ~3–5 tygodni, ~90–150 godz.; hosting+API ~$80–350/mies. Wyślij kod — zrobię audyt w ciągu 1–3 dni.
Budżet: 8000 UAH Termin: 5 dni
Dzień dobry.
Na początku przeprowadzę audyt waszego prototypu. Zwykle problem tkwi w tym, że tekst z bazy nie dociera do sieci neuronowej z powodu błędu w ustawieniach połączenia (API). Jeśli nie ma sensu ratować starego kodu, nie będę pisał interfejsu webowego, autoryzacji i historii czatów od zera. Opracowanie takiego projektu od podstaw kosztuje znacznie więcej niż wskazane 4000 hrywien.
Proponuję roboczą alternatywę pod wasze zapytanie. Rozwinę na waszym serwerze gotową platformę do pracy z modelami językowymi (na przykład Dify). Od razu otrzymacie gotowy czat internetowy z logowaniem za pomocą haseł dla działu sprzedaży. Sieć neuronowa (podłączymy OpenAI API) będzie ściśle ograniczona: będzie szukać odpowiedzi tylko w waszych załadowanych tekstach i uczciwie odpowiadać "nie wiem", jeśli informacji brakuje. Będziecie sami aktualizować bazę wiedzy przez prosty panel zarządzania, przeciągając tam nowe pliki PDF lub dokumenty bez udziału programisty. Tam również będzie dostępna cała historia dialogów do kontroli jakości. Co do miesięcznych wydatków: około 15 dolarów za serwer i około 10-20 dolarów za tokeny.
Gdzie obecnie fizycznie znajdują się wasze regulaminy i opisy usług (po prostu pliki na komputerze, Google Drive czy baza w Notion), abym mógł zrozumieć format ich wstępnego załadunku?
Budżet: 4000 UAH Termin: 5 dni
Dzień dobry! Mamy doświadczenie w wdrażaniu systemów RAG opartych na LLM. Realizujemy to poprzez bazy danych wektorowych oraz integrację z twoją dokumentacją, aby zapewnić dokładne odpowiedzi dla menedżerów. Optymalizujemy obecny prototyp dla stabilnej pracy w produkcji.
Budżet: 4000 UAH Termin: 1 dzień
Dzień dobry! 🧡
Jestem gotowy do pracy, chętnie pomogę w minimalnych terminach 😉
Mam doświadczenie w podobnych projektach. 🌼 (Są opinie na ten temat oraz prace w portfolio)
Zrobię to w najlepszej formie, zaczynam teraz! 🚀🛸✈️
Koniecznie piszcie, omówimy. Odpowiadam natychmiast!
Budżet: 4000 UAH Termin: 1 dzień
Cześć!
Najprawdopodobniejsza przyczyna, dla której dokumenty nie docierają do modelu: retrieval znajduje fragmenty, ale nie są one podstawiane w kontekście przed wywołaniem API — lub embeddings po prostu nie są aktualizowane po załadowaniu nowych dokumentów. Audyt kodu i dostępów pokaże dokładne miejsce przerwy w ciągu pół dnia-dnia.
Etap 1 — Audyt. Sprawdzę wywołania API, indeksowanie, bazę wektorową, budowę promptu. Na podstawie wyników — jasny wniosek: naprawić istniejące czy przebudować od zera, z uzasadnieniem i oszacowaniem kosztów/czasu.
Etap 2 — Realizacja na podstawie wyników audytu. Stos: FastAPI, PostgreSQL + pgvector (lub Qdrant), Claude API, interfejs webowy z autoryzacją, historia zapytań, aktualizacja bazy bez dewelopera.
Mam doświadczenie z FastAPI i pracą z zewnętrznymi API (w tym budowa bota Telegram z monitorowaniem kilku marketplace'ów przez API w czasie rzeczywistym — podobna logika z przetwarzaniem i wydawaniem danych).
Uściślenie: na czym napisany jest obecny prototyp (LangChain/LlamaIndex czy własne rozwiązanie) i jaka baza wektorowa jest już podłączona?
Skontaktuj się!
Budżet: 11111 UAH Termin: 1 dzień
Cześć! Mam już ponad 3 lata doświadczenia w tworzeniu usług AI/Full-stack. Posiadam gotowy, przetestowany szablon RAG, który w 90% spełnia Twoje wymagania.
Mój stos technologiczny: FastAPI, LangGraph (agenci i historia), Qdrant (wyszukiwanie wektorowe z MMR), Flashrank (przeranking przeciwko halucynacjom), Redis i Docker.
Plan realizacji:
Audyt (1 dzień): Sprawdzę Twój prototyp. Jeśli problem dotyczy tylko API — naprawię go. Jeśli kod jest surowy — uzasadnię wdrożenie mojego gotowego backendu, co zaoszczędzi czas.
RAG i Kontrola (3–4 dni): Ustawię ścisłe systemowe prompty (strict QA) — model będzie odpowiadał ściśle według dokumentów. Zintegruję Claude 3.5 Sonnet lub GPT-4o mini.
Interfejs i Panel administracyjny (3 dni): Stworzę czysty interfejs webowy z autoryzacją, sekcją do przesyłania/usuwania plików przez menedżerów (bez udziału dewelopera) oraz logowaniem historii czatów. Architektura będzie początkowo gotowa do podłączenia analitycznej bazy danych.
Terminy i koszt:
Czas: 5–7 dni (prawdopodobnie szybciej, ale biorę z zapasem).
Koszt pracy: 400–7000 USD.
Orientacyjne koszty miesięczne: Hosting (VPS) — 20–30 USD; Tokeny (dla zespołu sprzedaży) — 15–40 USD w zależności od obciążenia.
Chętnie pokażę demo podobnego systemu, napisz — omówimy!
Budżet: 3800 UAH Termin: 5 dni
Cześć! Jestem gotowy, aby rozpocząć audyt techniczny istniejącego prototypu - sprawdzę API, przekazywanie kontekstu dokumentów do modelu, indeksowanie oraz powód, dla którego baza nie jest ładowana. Stos: Python, PostgreSQL + pgvector (lub Qdrant) do wyszukiwania wektorowego, pipeline RAG z OpenAI/Claude API, interfejs webowy z autoryzacją dla menedżerów, aktualizacja bazy bez programisty poprzez przesyłanie plików. Odpowiedzi - ściśle na podstawie załadowanych dokumentów, z uczciwym fallbackiem, jeśli informacji brakuje. Po audycie dam jasną odpowiedź - naprawić istniejące czy przebudować od zera.
Budżet: 27000 UAH Termin: 7 dni
Witam. Mam doświadczenie w opracowywaniu automatyzacji AI. Jestem gotowy do współpracy.
Budżet: 5000 UAH Termin: 5 dni
Cześć! To dokładnie to zadanie, które wykonuję — integracja RAG, gdzie gotowy prototyp trzeba „połączyć” z bazą wiedzy.
Niedawno oddałem panel FastAPI do zarządzania kontami z zadaniami w tle i statusem w czasie rzeczywistym (7500 UAH) — podobna architektura: serwis, który przetwarza dane i odpowiada na zapytania.
W twoim przypadku standardowy stos: ładowanie dokumentów → chunkowanie → embeddings → wektorowa baza danych (Qdrant/Chroma/pgvector) → retrieval-chain. Jeśli prototyp jest już gotowy, integracja bazy wiedzy zajmie 3–7 dni w zależności od formatu dokumentów i architektury prototypu.
Budżet 4000 UAH wydaje się skromny — jeśli objętość jest mała, to w porządku; jeśli nie — warto to omówić. W jakim formacie przechowywana jest dokumentacja (PDF, Word, Google Docs)? Jaki stos ma prototyp?
Budżet: 4000 UAH Termin: 1 dzień
Dzień dobry, Jurij!
Jestem gotów zająć się Państwa projektem. Jestem certyfikowanym deweloperem Anthropic — Claude Certified Architect (Foundations), specjalizuję się w architekturze produkcyjnej z Claude API, MCP i RAG-pipeline'ami. Weryfikacja certyfikatu: https://www.credly.com/badges/3df97b6b-e468-42b9-9bd6-c1f78aa309fc
Podobny przypadek. Niedawno zrealizowałem podobny projekt - wewnętrzny knowledge graph oparty na Neo4j + Claude, dzięki MCP asystent odpowiada na zapytania pracowników ściśle według dokumentacji korporacyjnej, z odniesieniami do źródła i bez „wymyślonych” faktów. To prawie jeden do jednego Państwa zadanie, tylko dodatkowo wykorzystałem graf wiedzy do dokładniejszego wyszukiwania po powiązaniach między regulacjami.
Dwa pytania, aby dokładniej oszacować:
Ile mniej więcej dokumentów/stron znajduje się w bazie i w jakich formatach (PDF, Word, Google Docs, arkusze)?
Czy w obecnym prototypie już istnieje baza wektorowa, czy dokumenty są po prostu załadowane na serwer bez wyszukiwania po treści?
Jestem gotów zacząć od audytu od razu po otrzymaniu kodu i dostępów.
Budżet: 5000 UAH Termin: 10 dni
Witam, mogę to zrealizować. Budowałem systemy RAG na bazie n8n. Google Drive
Można wszystko oprócz samego LLM wdrożyć u was na serwerze. To będzie self-host n8n + supabase, jako wektorowe magazynowanie.
Cena będzie tylko za tokeny, a to wszystko zależy od liczby zapytań, dokładności odpowiedzi oraz liczby dokumentów w systemie RAG. Ile będzie dokumentów? Przez jaki interfejs chcecie się komunikować z systemem? I czy jest administrator systemu, który może wdrożyć n8n i supabase?
Budżet: 4000 UAH Termin: 1 dzień
Dzień dobry, Yurii.
Najprawdopodobniejsza przyczyna: model otrzymuje zapytanie, ale nie znaleziono fragmentów dokumentów jako kontekstu — retrieval nie jest połączony z wywołaniem API.
Audyt wykryje miejsce przerwy i określi — naprawić czy przebudować.
Twój RAG-pipeline — pgvector i bge-m3 do wyszukiwania semantycznego.
LLM: Claude Sonnet lub GPT-4o-mini z obliczeniem tokenów pod Twoje objętości.
Model będzie odpowiadał ściśle na podstawie kontekstu, bez wymyślania.
Interfejs webowy z autoryzacją, historią zapytań i aktualizacją bazy plikami bez programisty.
Architektura — z rozszerzeniem na analityczne magazynowanie.
Podobny projekt: RAG na Go + pgvector + OpenRouter.
Stos: Go, pgvector, bge-m3, Claude/OpenAI API, Docker, HTTPS.
Miesięczny koszt posiadania przygotuję po omówieniu objętości.
Możliwe opcje:
- Przywrócenie i uruchomienie
8000–12000 UAH
Przywrócenie funkcjonalności prototypu i podstawowy dostęp do bazy wiedzy.
- Działający RAG-pipeline bez „halucynacji” modelu
- Podstawowy interfejs webowy do uzyskiwania odpowiedzi
- Podłączenie API wybranej LLM (OpenAI/Claude)
- Instrukcja ręcznego aktualizowania bazy danych
- Pełna funkcjonalność
15000–25000 UAH
Pełnoprawny korporacyjny asystent z autonomicznym zarządzaniem wiedzą (Zalecane).
- Interfejs ładowania dokumentów bez udziału programisty
- System autoryzacji dla menedżerów działu sprzedaży
- Historia zapytań do monitorowania jakości odpowiedzi
- Optymalizowana architektura do przyszłego podłączenia do analitycznego magazynu
- Pełne obliczenie kosztów tokenów i hostingu
- Rozszerzone rozwiązanie
30000–45000 UAH
Rozszerzone narzędzie AI z zwiększoną dokładnością i wsparciem dla złożonych scenariuszy.
- Ulepszona obróbka dokumentów (OCR dla skanów, złożone tabele)
- Rozszerzona funkcjonalność generowania odpowiedzi dla różnych kanałów komunikacji
- Priorytetowe wsparcie i optymalizacja kosztów tokenów przez miesiąc
- Integracja z chmurą do automatycznej synchronizacji plików
- Pełny pakiet dokumentacji technicznej z architektury systemu
Budżet: 27000 UAH Termin: 21 dni
Dzień dobry, bez problemu zrealizuję taki AI-asystent pod klucz - mam ponad 5-letnie doświadczenie w rozwoju i ponad 2-letnie w projektach LLM/RAG.
Stos: Python + FastAPI, LangChain lub LlamaIndex dla RAG-pipeline, baza wektorowa (Qdrant lub pgvector), OpenAI lub Claude przez API. Interfejs webowy z autoryzacją - React lub Next.js. Wszystko wdrażane na waszym serwerze przez Docker.
Pierwszy krok - audyt istniejącego prototypu: szybko zrozumiem, gdzie jest problem z przesyłaniem danych do modelu, i albo naprawimy istniejące, albo uzasadnione przemyślimy od nowa - co będzie bardziej efektywne. Architektura od razu zostanie zaprojektowana z myślą o przyszłym podłączeniu do analitycznego magazynu.
Orientacyjny miesięczny koszt posiadania: tokeny OpenAI GPT-4o - od 30-80 USD/miesiąc w zależności od intensywności, hosting - od 10-20 USD/miesiąc. Jeśli chodzi o koszt pracy - budżet 4000 UAH nie pokryje takiego zakresu, rzeczywisty koszt od 30 000 UAH w zależności od ostatecznego zakresu. Jestem gotów omówić szczegóły w prywatnych wiadomościach. Proszę o kontakt!
Budżet: 4000 UAH Termin: 7 dni
Dzień dobry! Robiłem właśnie takie RAG-asystenty — interfejs webowy z autoryzacją, baza dokumentów firmy i odpowiedzi ściśle z źródeł. Wasz objaw „informacja z bazy nie dociera do modelu” prawie zawsze oznacza, że dokumenty nie zostały zaindeksowane w bazie wektorowej lub znalezione fragmenty nie są podstawiane w prompt przed zapytaniem — rzadko sama API. Przejrzę kod i dostęp, za pół dnia powiem dokładną diagnozę i co będzie korzystniejsze: naprawić czy złożyć na nowo. Na czym zrobiono prototyp — LangChain/LlamaIndex czy własne rozwiązanie, i jakie jest repozytorium pod embeddingi?
Budżet: 4000 UAH Termin: 1 dzień
Witaj!
Jeśli robić wyłącznie na podstawie wbudowanej bazy wiedzy, to LLM potrzebne jest tylko do generowania odpowiedzi i rozumienia pytania, a cała wektoryzacja (RAG) może być wykonywana przez lokalny model.
Robiłem takiego wewnętrznego asystenta menedżera dla DDTuning. Napisz, pokażę jak działa.
Jeśli chodzi o sprawdzenie, dlaczego teraz nie działa, to możemy to przejrzeć.
Budżet: 7000 UAH Termin: 7 dni
Budowałem podobne systemy RAG: FastAPI, baza wektorowa (Qdrant / pgvector), embeddings przez Claude lub OpenAI, interfejs webowy z autoryzacją. Pierwszy krok — audyt prototypu: znajdę, gdzie przerywa się pipeline między bazą a modelem, zdecydujemy, co będzie szybsze — naprawić czy zbudować na nowo.
Stos: FastAPI, pgvector/Qdrant, API Claude (polecam — dokładniejsze w trudnych zapytaniach, przejrzysta taryfikacja tokenów), prosty interfejs webowy, Docker, HTTPS. Aktualizacja bazy — przesyłanie plików bez programisty. Architektura od razu z myślą o przyszłym magazynie analitycznym.
Około 35 godzin pracy. Gotowy do rozpoczęcia po uzyskaniu dostępu.
Napisz — omówimy szczegóły i zaczynamy.
Budżet: 4000 UAH Termin: 5 dni
Witam!
Mam doświadczenie w rozwijaniu usług opartych na LLM i architekturze RAG. Proponuję zacząć od audytu obecnego rozwiązania: sprawdzić integrację z API, pipeline indeksowania i wyszukiwania, po czym albo przywrócić funkcjonalność, albo uzasadnione zaproponować przebudowę.
Do realizacji proponuję stos: Python (FastAPI), OpenAI lub Claude API, PostgreSQL + pgvector (lub Qdrant), nowoczesny interfejs webowy z autoryzacją i możliwością samodzielnego aktualizowania bazy wiedzy.
Orientacyjny czas pierwszego etapu (audyt + uruchomienie wersji roboczej) - 5–10 dni. Dokładny koszt będę mógł podać po zapoznaniu się z obecnym kodem i architekturą. Pomogę również ocenić miesięczne wydatki na API i hosting w zależności od objętości dokumentów i liczby zapytań.
Budżet: 4000 UAH Termin: 2 dni
Witam. Przyjrzałem się waszemu projektowi — klasyczny RAG dla wewnętrznej bazy wiedzy. Na początku przeprowadzę audyt istniejącego prototypu: najczęściej problem polega na tym, że embeddings nie są aktualizowane po załadowaniu dokumentów lub źle skonfigurowany jest łańcuch retrieval. Jeśli kod jest aktywny — naprawię, jeśli są tam głębsze problemy architektoniczne — przebuduję na LangChain + ChromaDB/Qdrant, interfejs na Streamlit lub FastAPI + prosty front. Co do LLM: Claude Haiku — optymalne pod względem ceny/jakości dla takiego przypadku, orientacyjnie $15-30/miesiąc na dział sprzedaży. Miesięczny koszt posiadania (tokeny + hosting) — w granicach $30-50 w zależności od intensywności. Robiłem podobne rozwiązania dla wewnętrznej dokumentacji. Jestem gotów zacząć od audytu, pełny cykl — do 2 tygodni.