Zlecenia dla freelancerów

Zlecenia dla freelancerów

Asystent AI (baza wiedzy firmy)

AI i uczenie maszynowe, Bazy danych i SQL — podano nieprawidłowe kategorie?

339 PLN

Zlecenie jest tłumaczone automatycznie. Zaloguj się lub zarejestruj się, żeby zobaczyć oryginał

Zadanie: wdrożenie usługi LLM, która zna całą dokumentację firmy i odpowiada na pytania menedżerów działu sprzedaży.

Co jest teraz: klient samodzielnie stworzył prototyp (oddzielny projekt z załadowanymi informacjami o firmie, umieszczony na serwerze), ale informacje z bazy nie są przekazywane do modelu — prawdopodobnie problem z API. Kod i dostęp udostępnimy. Pierwszy krok — audyt: naprawić istniejące lub uzasadnione zbudować od nowa.

Wymagana funkcjonalność:

Załadowanie całej dokumentacji firmy: opis każdej usługi, regulaminy, FAQ, cenniki (wszystkie materiały udostępnimy).
Odpowiedzi ściśle na podstawie załadowanych dokumentów (RAG). Model nie wymyśla faktów; jeśli odpowiedzi w bazie nie ma — uczciwie o tym informuje.
Dostęp dla menedżerów poprzez link (interfejs webowy), z autoryzacją.
Scenariusze: menedżer zadaje dowolne pytanie dotyczące pracy firmy; wstawia pytanie klienta „jak jest” i otrzymuje gotową odpowiedź do wysłania; znajduje potrzebny regulamin/raport na żądanie.
Aktualizacja bazy wiedzy bez programisty (ładowanie plików przez interfejs lub podłączony folder).
Język angielski.
Historia zapytania do kontroli jakości.
Oczekiwania techniczne: LLM przez API (Claude/OpenAI — proszę zaproponować z wyliczeniem kosztów tokenów), pipeline RAG (baza wektorowa, embeddings), hosting na naszym serwerze lub w chmurze, HTTPS. Architektura ma pozwalać w przyszłości na podłączenie asystenta do analitycznego magazynu danych (równoległy projekt).
W odpowiedzi proszę podać: przykłady podobnych projektów RAG, stack, czas, koszt pracy oraz orientacyjną miesięczną koszt posiadania (tokeny + hosting).

Oferty 58 Odrzucone 4

Vladyslav Dykyi

0 0

Zlecenia -
Ocena -
Ranking 401

Budżet: 4000 UAH Termin: 4 dni

Cześć!

Mogę szybko przeprowadzić audyt twojego prototypu i znaleźć, dlaczego kontekst nie trafia do modelu. Mam doświadczenie komercyjne w pracy z Pythonem, modelami AI, REST API, Linuxem oraz integracją rozwiązań LLM. W swojej pracy zajmowałem się integracją modeli ONNX, pipeline'ami AI, STT, TTS oraz optymalizacją modeli dla rzeczywistych produktów.

Zacząłbym od audytu: sprawdziłbym przekazywanie kontekstu, wywołania API, indeksowanie dokumentów, embeddings i retrieval. Jeśli problem można naprawić — zrobię to. Jeśli obecna architektura jest nieopłacalna do utrzymania, zaproponuję nową z szczegółowym wyjaśnieniem.

Do realizacji użyłbym Pythona, FastAPI, OpenAI lub Claude API, pgvector lub Qdrant, Dockera oraz interfejsu webowego z autoryzacją. Architektura może być od razu przygotowana do dalszej skalowalności.

Jestem gotów rozpocząć od razu po uzyskaniu dostępu.

Dziękuję!

Kyryll Monastыrnыi

2 0

Zlecenia -
Ocena -
Ranking 702

Budżet: 8000 UAH Termin: 5 dni

Dzień dobry.

Na początku przeprowadzę audyt waszego prototypu. Zwykle problem tkwi w tym, że tekst z bazy nie dociera do sieci neuronowej z powodu błędu w ustawieniach połączenia (API). Jeśli nie ma sensu ratować starego kodu, nie będę pisał interfejsu webowego, autoryzacji i historii czatów od zera. Opracowanie takiego projektu od podstaw kosztuje znacznie więcej niż wskazane 4000 hrywien.

Proponuję roboczą alternatywę pod wasze zapytanie. Rozwinę na waszym serwerze gotową platformę do pracy z modelami językowymi (na przykład Dify). Od razu otrzymacie gotowy czat internetowy z logowaniem za pomocą haseł dla działu sprzedaży. Sieć neuronowa (podłączymy OpenAI API) będzie ściśle ograniczona: będzie szukać odpowiedzi tylko w waszych załadowanych tekstach i uczciwie odpowiadać "nie wiem", jeśli informacji brakuje. Będziecie sami aktualizować bazę wiedzy przez prosty panel zarządzania, przeciągając tam nowe pliki PDF lub dokumenty bez udziału programisty. Tam również będzie dostępna cała historia dialogów do kontroli jakości. Co do miesięcznych wydatków: około 15 dolarów za serwer i około 10-20 dolarów za tokeny.

Gdzie obecnie fizycznie znajdują się wasze regulaminy i opisy usług (po prostu pliki na komputerze, Google Drive czy baza w Notion), abym mógł zrozumieć format ich wstępnego załadunku?

Andrey K.

1 292 1

Budżet: 27000 UAH Termin: 7 dni

Witam. Mam doświadczenie w opracowywaniu automatyzacji AI. Jestem gotowy do współpracy.

Bohdan Melnyk

6 0

Budżet: 4000 UAH Termin: 7 dni

Dzień dobry! Robiłem właśnie takie RAG-asystenty — interfejs webowy z autoryzacją, baza dokumentów firmy i odpowiedzi ściśle z źródeł. Wasz objaw „informacja z bazy nie dociera do modelu” prawie zawsze oznacza, że dokumenty nie zostały zaindeksowane w bazie wektorowej lub znalezione fragmenty nie są podstawiane w prompt przed zapytaniem — rzadko sama API. Przejrzę kod i dostęp, za pół dnia powiem dokładną diagnozę i co będzie korzystniejsze: naprawić czy złożyć na nowo. Na czym zrobiono prototyp — LangChain/LlamaIndex czy własne rozwiązanie, i jakie jest repozytorium pod embeddingi?

Oleg Grigoryev

32 0

Budżet: 27000 UAH Termin: 3 dni

Wartość pierwszego etapu - 32000 UAH, czas - 3 dni robocze. To audyt istniejącego prototypu z weryfikacją API, przekazywaniem kontekstu do modelu, indeksowaniem dokumentów, bazą wektorową, autoryzacją i bieżącym kodem. 4000 UAH, według odczuć, nie pokrywa nawet normalnego audytu technicznego takiego zadania, nie mówiąc już o pełnej usłudze =/

Po audycie damy jedną z dwóch tras - naprawić istniejące lub przebudować od zera. Jeśli przebudować, roboczy minimalny RAG-asystent z dostępem do sieci, autoryzacją, historią zapytań, aktualizacją bazy bez programisty, HTTPS i gotowością do przyszłego podłączenia analitycznego magazynu oceniłbym osobno, orientacyjnie 15-30 dni roboczych i od 180000 UAH.

Stos - Python lub Node.js dla serwera, PostgreSQL plus pgvector lub Qdrant dla wyszukiwania wektorowego, OpenAI lub Claude przez API, osobny przetwornik dokumentów, interfejs webowy dla menedżerów, autoryzacja ról, dziennik zapytań. Aby odpowiedzi na podstawie dokumentów były użyteczne, trzeba dodać odniesienie do źródła lub przynajmniej nazwę znalezionego dokumentu, w przeciwnym razie menedżerowie nie będą mogli normalnie kontrolować jakości.

Orientacyjne koszty - hosting i baza 20-80 USD miesięcznie, tokeny 20-150 USD miesięcznie na początku. Dokładniej obliczymy po liczbie menedżerów, średniej długości dokumentów i liczbie zapytań dziennie. Model nie ma wymyślać faktów, dlatego robimy odpowiedź tylko z RAG i scenariusz, gdy danych w bazie nie ma.

Dwa pytania
> Ile mniej więcej dokumentów lub stron znajduje się w bazie wiedzy, i w jakich formatach są obecnie zgromadzone - PDF, Word, Google Docs, arkusze, strona?
> W obecnym prototypie już istnieje baza wektorowa, czy dokumenty są tylko załadowane na serwer bez normalnego wyszukiwania treści?

Podobne przypadki Ingello
> https://business.ingello.com/vorfahr - AI-automatyzacja z zastosowaną logiką biznesową, blisko do wewnętrznego asystenta dla zespołu sprzedaży.
> https://business.ingello.com/fractal - architektura agentowa i systemowa, przydatna do zadań, gdzie czat ma być częścią zarządzanego procesu.
> https://business.ingello.com/forma-crm - logika korporacyjna, role, procesy, kontrola jakości pracy zespołu.

Strona Freelancehunt Ingello - https://systems-fl.ingello.com/ua

!!Optymalny pierwszy krok - audyt, a nie obietnica całego produktu w budżecie 4000 UAH.!! Lepiej najpierw znaleźć, gdzie następuje zerwanie przekazywania wiedzy do modelu, a potem decydować, czy leczyć istniejące, czy zbierać od nowa.

Podobny projekt: Рефаткоринг приложения

Maksym O.

5 0

Budżet: 4000 UAH Termin: 7 dni

Cześć, pracowałem nad asystentem AI dla firmy prawniczej — system RAG oparty na 200+ dokumentach, wektorowa baza Pinecone, API Claude, ~$45/miesiąc na tokeny przy 1000 zapytaniach.

W odniesieniu do twojego projektu — czy możesz sprecyzować, jaka obecnie wektorowa baza jest używana w prototypie i w jaki sposób dokumenty są przekazywane do modelu? To pomoże szybko znaleźć problem z API podczas audytu.

Proponuję się skontaktować, chętnie doradzę ci bezpłatnie z technicznej strony i wspólnie opracujemy plan rozwoju + opowiem o moim zespole!

Andrey Krasik

19 1

Budżet: 4000 UAH Termin: 2 dni

Witam. Przyjrzałem się waszemu projektowi — klasyczny RAG dla wewnętrznej bazy wiedzy. Na początku przeprowadzę audyt istniejącego prototypu: najczęściej problem polega na tym, że embeddings nie są aktualizowane po załadowaniu dokumentów lub źle skonfigurowany jest łańcuch retrieval. Jeśli kod jest aktywny — naprawię, jeśli są tam głębsze problemy architektoniczne — przebuduję na LangChain + ChromaDB/Qdrant, interfejs na Streamlit lub FastAPI + prosty front. Co do LLM: Claude Haiku — optymalne pod względem ceny/jakości dla takiego przypadku, orientacyjnie $15-30/miesiąc na dział sprzedaży. Miesięczny koszt posiadania (tokeny + hosting) — w granicach $30-50 w zależności od intensywności. Robiłem podobne rozwiązania dla wewnętrznej dokumentacji. Jestem gotów zacząć od audytu, pełny cykl — do 2 tygodni.

Artur Boiko

5 0

Budżet: 4000 UAH Termin: 2 dni

Cześć! Rzeczywiście, pierwszym krokiem jest audyt, a nie ślepa przeróbka. Twój prototyp najprawdopodobniej nie przekazuje znalezionych fragmentów dokumentów do samego zapytania do modelu: dane są załadowane, a retrieval albo nie jest podłączony do wywołania LLM, albo zwraca pusto, dlatego model odpowiada na podstawie ogólnej wiedzy zamiast twojej bazy. Przejrzę kod i dostęp i powiem szczerze, czy naprawić szybciej, czy przebudować rdzeń. Często zbudowanie czystego RAG-pipeline jest tańsze niż naprawianie cudzych.

Kluczowe w rezultacie, aby bot odpowiadał ściśle na podstawie twoich dokumentów i uczciwie mówił „nie ma tego w bazie”, gdy nie ma odpowiedzi, a nie wymyślał. Na tym właśnie grounding kładę nacisk.

Stos: baza wektorowa (pgvector lub Chroma) + embeddings, LLM przez API, interfejs webowy z autoryzacją przez link, ładowanie plików przez interfejs do aktualizacji bazy bez dewelopera, historia zapytań. Co do modelu: dla dokumentów anglojęzycznych i dokładności polecałbym Claude, z opcją pomijania prostych zapytań na tańszy model dla oszczędności tokenów. Architektura od razu będzie modułowa, aby później podłączyć analityczne repozytorium, jak planujesz.

Jestem gotów bezpłatnie rozebrać w prywatnych, dlaczego twój prototyp nie ciągnie danych do modelu. Będę zadowolony ze współpracy.

Vitalii Karasov

1 0

Zlecenia -
Ocena -
Ranking 501

Budżet: 6000 UAH Termin: 5 dni

RAG ze ścisłym groundingiem - moja specjalizacja: odpowiedź tylko z dokumentów, w przypadku braku w bazie uczciwie informuje, źródła są śledzone.

Pierwszy krok - audyt twojego prototypu (sądząc po opisie - przerwanie w przekazywaniu kontekstu do modelu). Następnie: pgvector + embeddings, interfejs webowy z autoryzacją, ładowanie/aktualizacja plików bez dewelopera, historia zapytań. Zapewniam kompatybilność z twoim magazynem analitycznym.

Pod twój budżet - wersja podstawowa 6 000 UAH, 5 dni: audyt + działający RAG na twojej dokumentacji, dostęp webowy z autoryzacją.
Pełna - 12 000 UAH, 8 dni: + ładowanie plików przez interfejs bez dewelopera, historia zapytań, gotowość do podłączenia do magazynu analitycznego.

Utrzymanie: hosting ~$10/miesiąc + tokeny ~$15–30/miesiąc.
Portfolio: w profilu i na karasov.co

Lilia N.

1 0

Zlecenia -
Ocena -
Ranking 583

Budżet: 4000 UAH Termin: 1 dzień

Witam, mam odpowiednie doświadczenie w rozwoju
Proszę pisać na prywatne, omówimy szczegóły
Będę zadowolona, że mogę pomóc!

Danilo Hablak

17 3

Budżet: 5000 UAH Termin: 5 dni

Dzień dobry, jestem bardzo zainteresowany pracą z Państwem. Proponuję wysoką jakość wykonania powierzonych zadań oraz szybkość działania. Porozmawiajmy o szczegółach na czacie prywatnym i rozpocznijmy współpracę.

Valentin Haritonov

32 0

Budżet: 26990 UAH Termin: 29 dni

Dzień dobry!
Nazywam się Walentyn i reprezentuję Arctic Web Agency. Jesteśmy zespołem, który specjalizuje się w tworzeniu nowoczesnych i efektywnych rozwiązań dla biznesu. W wiadomościach prywatnych mogę przesłać przykłady naszych podobnych prac. Jesteśmy gotowi zająć się Twoim projektem!

Z poważaniem
Zespół Arctic Web
Freelancehunt

Roman D.

0 0

Zlecenia -
Ocena -
Ranking 405

Budżet: 4000 UAH Termin: 5 dni

Cześć! Dokładnie zapoznałem się z Twoim TZ. Rozwój i rozwiązywanie problemów z systemami RAG (Retrieval-Augmented Generation) to moja główna specjalizacja. Problem Twojego prototypu („informacja nie jest przekazywana do modelu”) najprawdopodobniej tkwi w niewłaściwym formułowaniu payloadu dla API lub w tym, że wyszukiwanie wektorowe zwraca puste kawałki (fragmenty tekstu) z powodu błędów w algorytmie dzielenia dokumentów.

Mój plan pracy (Audyt i Przebudowa):

Audyt: Wejdę na serwer, sprawdzę logikę embeddingów i zapytań. Jeśli architektura będzie beznadziejna — argumentacyjnie przebuduję pipeline na nowoczesnych frameworkach (LangChain lub LlamaIndex).

Surowy RAG bez halucynacji: Ustawię systemowy prompt (temperature = 0) oraz logikę fallback: jeśli w wektorowej bazie nie ma odpowiedniego kawałka, model sztywno odpowie: "Nie mam tych informacji w dostarczonych dokumentach", zamiast wymyślać fakty.

Interfejs i Panel administracyjny: Aby zmieścić się w budżecie i szybko wydać, uruchomię interfejs webowy oparty na Streamlit. Będzie tam okno czatu dla menedżerów (z podstawową autoryzacją hasłem), historia zapytań oraz osobna zakładka dla admina, gdzie można po prostu przeciągnąć nowe pliki PDF/Docx do automatycznego aktualizowania bazy.

Skalowalność (pod DWH): Architektura będzie budowana modułowo (podejście Agentic). W przyszłości będziemy mogli dodać nowe "narzędzie" (Tool) do asystenta, aby mógł oprócz bazy wektorowej wykonywać zapytania SQL do Twojego magazynu analitycznego.

Proponowany stack: Python, LangChain/LlamaIndex, ChromaDB/Qdrant (baza wektorowa), Streamlit (UI), FastAPI (jeśli potrzebne będzie gołe API).

Główne ryzyko projektu: Tabele z wycenami. Standardowe parsery często "łamią" strukturę tabel podczas dzielenia na teksty (chunking), przez co model myli ceny. Użyję specjalistycznych parserów (na przykład Unstructured), które zachowują powiązania w tabelach.

Dmytro Zavadskyi

4 0

Budżet: 4000 UAH Termin: 3 dni

Witam.

Na pierwszym etapie mogę zająć się audytem i doprowadzeniem prototypu do stanu roboczego, jeśli problem rzeczywiście leży w przekazywaniu kontekstu z bazy wiedzy do zapytania LLM.

W moim własnym systemie do pracy z dokumentami już zastosowałem podobny schemat: dokumenty przechodzą przez ekstrakcję tekstu, normalizację, podział na fragmenty, przechowywanie wiedzy oddzielnie od surowych plików, wyszukiwanie odpowiednich części i formowanie odpowiedzi z odniesieniem do źródła. Osobno mam prototyp FastAPI RAG dla treści AI: ingestion, chunking, retrieval with citations, struktura route/service/repository i przetestowana logika core.

W przypadku twojego prototypu najpierw sprawdzę:
- czy tworzone są embeddings po załadowaniu dokumentów
- czy jest normalny chunking i metadane dotyczące źródeł
- czy wyszukiwanie wektorowe zwraca odpowiednie fragmenty
- czy te fragmenty rzeczywiście trafiają do prompt/context przed wywołaniem Claude/OpenAI
- czy przechowywana jest historia zapytań i błędy pipeline'u

Stos dla stabilnej wersji: Python/FastAPI, PostgreSQL + pgvector lub Qdrant, OpenAI/Claude API, Docker, HTTPS, prosty interfejs webowy z autoryzacją, dziennik zapytań i odpowiedzi z odniesieniem do źródła.

Orientacyjny koszt utrzymania na start:
- VPS/hosting: około 10–30 USD/miesiąc
- tokeny: około 10–70 USD/miesiąc dla małego zespołu sprzedażowego, dokładniej obliczę po liczbie dokumentów, menedżerów i zapytaniach na dzień

Moja stawka to 4000 UAH / 3 dni — za pierwszy etap: audyt, lokalizacja problemu i, jeśli architektura na to pozwala, uruchomienie roboczego prototypu. Jeśli po audycie będzie sensowniejsze zbudowanie systemu od nowa, podam osobną wycenę na pełne MVP.

Szczegóły możemy omówić w wiadomościach prywatnych.

Maksym Holod

0 0

Zlecenia -
Ocena -
Ranking 141

Budżet: 4000 UAH Termin: 3 dni

Witaj! Systemy RAG (LLM ściśle oparte na dokumentach, bez wymyślania) — to moja specjalizacja.

Zaczniemy od audytu, jak proponujesz. Objaw „dane z bazy nie docierają do modelu” — to prawie zawsze jeden z typowych błędów RAG: embeddings nie są wciągane do promptu, pusta wydajność w wyszukiwaniu wektorowym, niewłaściwe dzielenie dokumentów na fragmenty, lub kontekst nie jest przekazywany w wywołaniu API. W ciągu 1–2 dni znajdę przyczynę i dam uzasadnioną rekomendację: naprawić istniejące czy przebudować (z uzasadnieniem).

Dalej — działający system:
• Ładowanie całej dokumentacji przez interfejs (aktualizacja bazy bez dewelopera)
• Ścisły RAG: odpowiedź tylko z dokumentów, „nie ma w bazie — mówi szczerze”
• Dostęp przez link z autoryzacją
• Scenariusze: pytanie o firmę / wstawione pytanie klienta → gotowa odpowiedź / wyszukiwanie regulaminu
• Historia zapytań dla kontroli jakości
• Architektura pod przyszłe podłączenie do magazynu analitycznego

Stos: Python (FastAPI), Claude/OpenAI API, pipeline RAG z bazą danych wektorowych (pgvector) + embeddings, PostgreSQL, web-UI, HTTPS, hosting na twoim serwerze lub w chmurze.

Co do LLM: do QA w dokumentach polecam oszczędne modele (Claude Haiku / GPT-4o-mini) — jakość do tego zadania jest doskonała, a tokeny są wielokrotnie tańsze.

Przykłady rozwiązań RAG i na żywo demo pokażę w prywatnej rozmowie. Pytanie: jaki przybliżony zakres dokumentacji (stron/pliki) i ilu menedżerów będzie korzystać?
https://horizonbyte-hub.vercel.app/uk

Serhii Valko

31 0

Budżet: 4000 UAH Termin: 10 dni

Trzeba naprawić (lub zreorganizować) asystenta RAG, który dokładnie odpowiada na pytania menedżerów tylko na podstawie dokumentów firmy.

Pierwszy krok — audyt istniejącego kodu: sprawdzam, gdzie przerywa się łańcuch między bazą wektorową a wywołaniem LLM (najczęściej to albo źle sformułowany kontekst w promptcie, albo embeddings nie są indeksowane). Jeśli prototyp jest naprawdę zepsuty głębiej — przebudowuję na LangChain + pgvector lub Chroma, embeddings przez OpenAI text-embedding-3-small, LLM przez GPT-4o-mini (tańszy niż Claude Sonnet przy tym samym poziomie dla scenariuszy FAQ). Interfejs webowy na FastAPI + minimalny React: autoryzacja przez token, przesyłanie plików przez UI, logowanie zapytań w PostgreSQL. Architektura od razu z abstrakcją pod przyszłe podłączenie analitycznego magazynu.

Orientacyjny miesięczny koszt: hosting ~300-500 UAH, tokeny przy 50 zapytaniach/dzień ~200-400 UAH.

Jaka jest teraz baza wektorowa w prototypie i na czym napisany jest backend, żebym mógł ocenić zakres audytu przed rozpoczęciem?

Dmytro Staroselskyi

0 0

Zlecenia -
Ocena -
Ranking 226

Budżet: 4000 UAH Termin: 7 dni

Naprawię twój prototyp: najpierw audyt kodu, w ciągu dnia podam dokładną diagnozę i wnioski, co będzie korzystniejsze, naprawa czy przebudowa od zera. Jeden szczegół w twoim TZ, który łatwo przeoczyć: masz wymaganie dotyczące języka angielskiego, a gdy menedżer wstawia pytania klienta tak, jak są, a dokumenty są napisane w innym języku, zwykłe embeddings nie trafiają w wyszukiwanie. Dlatego zakładam wielojęzyczne embeddings i testuję wyszukiwanie w obu językach jeszcze przed oddaniem. Odpowiedzi będą ściśle na podstawie znalezionych fragmentów z nazwą dokumentu źródłowego, a jeśli odpowiedzi w bazie nie ma, asystent od razu o tym powie. Takie podejście można sprawdzić już teraz: znajdź w telegramie bota auth_ai_radar_bot, to mój RAG z hybrydowym wyszukiwaniem, odpowiada tylko na podstawie załadowanych dokumentów i uczciwie odmawia, gdy danych nie ma. Stos: Python + FastAPI, PostgreSQL z pgvector lub Qdrant, Claude API (policzę też opcję na OpenAI), interfejs webowy z autoryzacją, historia zapytań, aktualizacja bazy plikami przez interfejs. Orientacyjne miesięczne koszty dla działu sprzedaży: 10-30 dolarów na tokeny plus 10-20 dolarów na hosting, dokładniej policzę pod twój wolumen dokumentów. Szczegóły omówimy na czacie.

Maksim Sheptookha

0 0

Zlecenia -
Ocena -
Ranking 427

Budżet: 24000 UAH Termin: 7 dni

Witaj! Opis zadania został bardzo starannie przygotowany. Problem z tym, że "informacja nie jest przekazywana do modelu", najprawdopodobniej tkwi w logice pipeline'u RAG: niepoprawne dzielenie dokumentów (chunking), zaniżony próg podobieństwa kosinusowego w wyszukiwaniu wektorowym lub awaria na etapie zbierania finalnego kontekstu dla promptu.

Specjalizuję się w tworzeniu niezawodnych aplikacji webowych oraz integracji API i proponuję zrealizować Twój serwis RAG jako stabilny monolit na frameworku Laravel 11-13. To pozwoli uniknąć rozbudowy infrastruktury (żadnych skomplikowanych powiązań zewnętrznych skryptów Python) i trzymać cały projekt w jednym czystym kodzie.

Stos technologiczny i architektura:
- Backend i pipeline AI: PHP 8.3-8.4 / Laravel 11-13. Pełna logika chunkingu, przygotowania kontekstu i pracy z API (OpenAI / Anthropic).
- Magazyn wektorowy: PostgreSQL + rozszerzenie pgvector. Wektory (embeddings) będą przechowywane bezpośrednio w Twojej bazie danych, co gwarantuje maksymalną szybkość pobierania bez zewnętrznych usług.
- Interfejs i panel administracyjny: Filament PHP. Spełnia wszystkie Twoje wymagania pod klucz: gotowe formularze autoryzacji menedżerów, czysty interfejs czatu, historia zapytań do kontroli jakości oraz wygodny panel do przesyłania nowych dokumentów PDF/Docx bez angażowania programisty.

Ekonomia posiadania (dla działu z 10 menedżerami):
1. Hosting: Zwykły VPS (np. Hetzner, 4 GB RAM) - ~$10-$15/mies.
2. Tokeny: Użycie gpt-4o-mini lub Claude 3.5 Haiku będzie kosztować ~$10-$20 miesięcznie przy aktywnej pracy, ponieważ podstawowe modele teraz kosztują grosze.

Warunki komercyjne:
Podany w zamówieniu budżet (4 000 UAH) może pokryć jedynie wstępną audyt Twojego aktualnego prototypu oraz konsultację techniczną. Pełna budowa stabilnego systemu RAG, konfiguracja wyszukiwania wektorowego, inżynieria promptów przeciwko halucynacjom oraz wdrożenie kosztują więcej.

- Rzeczywisty koszt realizacji pod klucz: 18 000 - 24 000 UAH (w zależności od objętości kodu legacy).
- Termin: 5-7 dni roboczych.

Zaprojektuj architekturę tak, aby w przyszłości łatwo można było podłączyć system do Twojego magazynu analitycznego (BI) przez usługi Laravel. Jestem gotów przyjrzeć się Twoim dostępom i aktualnemu kodowi w prywatnych wiadomościach.

Pavlo B.

8 1

Zlecenia 8
Ocena -
Ranking 1 046

Budżet: 27000 UAH Termin: 20 dni

Witaj, Jurij

Możemy stworzyć system RAG dla Twojego biznesu. Proszę podać liczbę dokumentów oraz ich format, które obecnie posiadasz.

Vladislav Grisyuk

8 0

Budżet: 4000 UAH Termin: 3 dni

Dzień dobry, mam duże doświadczenie w tworzeniu agentów oraz pracy z dokumentami i indeksowaniem RAG. W profilu są dwa zamknięte przypadki. Możemy omówić to dokładniej, zrobię to w ciągu kilku dni.

Serhii Makhov

0 0

Zlecenia -
Ocena -
Ranking 445

Budżet: 4000 UAH Termin: 5 dni

Dzień dobry! Zrozumiałem zadanie: asystent ma odpowiadać ściśle według waszej dokumentacji (RAG) i nie wymyślać, a teraz prototyp nie przesyła danych z bazy do modelu — najprawdopodobniej problem leży na styku „baza → LLM” (kontekst nie dociera w API-zapytaniu lub baza wektorowa jest pusta/niezbudowana).

Pierwszy krok — audyt: podłączę się do prototypu i serwera, zobaczę, jak zorganizowany jest pipeline (skąd i dokąd idą dane, czym są tworzone embeddings, jak formułowane jest zapytanie do modelu) i powiem szczerze — naprawiać istniejące czy taniej przebudować.

Jeśli budowa od zera: RAG na Claude/OpenAI — baza wektorowa (embeddings według waszej dokumentacji) + serwis odpowiedzi ściśle według znalezionych fragmentów z uczciwym „nie wiem”, gdy odpowiedzi w bazie nie ma; dostęp do sieci za linkiem z autoryzacją; historia zapytań; aktualizacja bazy przez interfejs.

Dajcie dostęp do istniejącego prototypu i serwera — w pół dnia zlokalizuję, gdzie dokładnie przerywa przesył do modelu.

Co do ceny: 4000 UAH realistycznie pokrywa audyt + doprowadzenie prototypu do stanu roboczego. Pełny kontur (web-UI z autoryzacją, historia zapytań, samodzielna aktualizacja bazy) — większy zakres, więc ostateczną wartość podam po audycie, gdy będzie widać stan kodu. Obliczenie tokenów pod wasz zakres dokumentacji podam osobno.

Volodymyr S.

9 1

Budżet: 4000 UAH Termin: 5 dni

Witam! Zapoznałem się z projektem i jestem gotów przystąpić do pracy. Jestem pewien, że będą Państwo zadowoleni z rezultatu.

Pavlo M.

3 0

Zlecenia -
Ocena -
Ranking 570

Budżet: 4000 UAH Termin: 5 dni

Zalecany stos technologiczny:
OpenAI lub Claude przez API, RAG (embeddings + baza wektorowa), FastAPI, PostgreSQL + pgvector lub Qdrant.
lub Ollama i 100% lokalny model, wśród których jest duży wybór, w zależności od infrastruktury i zadań.
Architekturę od razu zaprojektuję z uwzględnieniem przyszłego podłączenia do waszego magazynu danych.

Oleksii Buglak

9 0

Budżet: 4000 UAH Termin: 1 dzień

Dzień dobry!

Zacznę od audytu waszego kodu. W pierwszy dzień możemy omówić, czy naprawiamy istniejące, czy przebudowujemy. Może problem leży w algorytmie wyszukiwania informacji.
Jako alternatywa - mój serwis momicro.com. To zaspokoi wasze potrzeby. ABSOLUTNIE WSZYSTKO można dostosować, skonfigurować, podłączyć specjalnie dla was. Wszystkie te integracje — bezpłatnie! Dostosuję pod wasz proces sprzedaży w ciągu dnia.

GitHub: https://github.com/axbuglak

Z poważaniem,
Bułhak Ołeksij

Ihor Symchuk

11 0

Budżet: 4000 UAH Termin: 5 dni

Dzień dobry! Mamy doświadczenie w wdrażaniu systemów RAG opartych na LLM. Realizujemy to poprzez wektorową bazę danych i integrację z Twoją dokumentacją dla dokładnych odpowiedzi. Skonfigurujemy pipeline przetwarzania danych, aby menedżerowie otrzymywali istotne informacje w czasie rzeczywistym. Jesteśmy gotowi przystąpić do dopracowania Twojego prototypu i doprowadzić go do stabilnego stanu roboczego.

Dmytro Ivchenko

4 0

Budżet: 10000 UAH Termin: 3 dni

Cześć!
Mamy doświadczenie w opracowywaniu asystentów AI i systemów RAG opartych na OpenAI i Claude. Jesteśmy gotowi najpierw przeprowadzić audyt obecnego rozwiązania, znaleźć przyczynę nieprawidłowego działania API i przywrócić funkcjonalność lub, jeśli to będzie bardziej uzasadnione, zbudować system od podstaw.
Realizujemy pełnoprawną bazę wiedzy z RAG, interfejs webowy z autoryzacją, historię zapytań, proste aktualizacje dokumentów bez programisty, a także przygotujemy architekturę do dalszej integracji z danymi analitycznymi. Pomożemy dobrać optymalny LLM z uwzględnieniem jakości odpowiedzi i kosztów użytkowania.
Po zapoznaniu się z obecnym projektem przygotujemy szczegółową ocenę terminów, budżetu oraz orientacyjnych miesięcznych wydatków na tokeny i hosting. Będziemy zadowoleni z możliwości omówienia szczegółów współpracy.

Vyacheslav Yudin

7 1

Zlecenia 6
Ocena -
Ranking 410

Budżet: 4500 UAH Termin: 1 dzień

Witam!

Jestem Full-Stack Software Engineerem z ponad 7-letnim doświadczeniem w tworzeniu stron internetowych, rozwiązań SaaS, złożonych platform internetowych oraz MVP dla startupów - od pomysłu i architektury po produkcję i wsparcie.

Pracuję nie tylko jako programista, ale także z naciskiem na logikę biznesową, skalowalność i długoterminowe wsparcie rozwiązań. W portfolio znajdują się przykłady zrealizowanych projektów o różnym stopniu skomplikowania.

Stos technologiczny:
PHP (Laravel, Symfony, Yii2),
Frontend: JavaScript (Vue.js, React.js), HTML5, CSS3,
Bazy danych: MySQL, PostgreSQL.

Jeśli chodzi o terminy i koszty - na tym etapie trudno je poprawnie ocenić bez sprecyzowania wymagań. Aby sformułować uzasadnioną wycenę, zazwyczaj trzeba zrozumieć:
- cele projektu;
- kluczową funkcjonalność;
- oczekiwane obciążenie i integracje;
- priorytety (szybkie uruchomienie vs skalowanie).

Proponuję zacząć od krótkiego sprecyzowania wymagań lub rozmowy telefonicznej / korespondencji - po tym mogę przedstawić realistyczną ocenę co do terminów, budżetu i opcji realizacji.

Będę zadowolony, mogąc omówić szczegóły.

Kyryl Shcherbyna

24 0

Budżet: 27000 UAH Termin: 14 dni

Mogę zająć się tym projektem szybkiego audytu obecnego prototypu, naprawić istniejącą integrację, jeśli będzie to uzasadnione, lub szybko przebudować usługę od podstaw, jeśli będzie to bardziej niezawodne i szybsze. Na wyjściu otrzymacie asystenta RAG, który odpowiada wyłącznie na podstawie dokumentów firmy, nie wymyśla faktów, ma interfejs webowy z autoryzacją dla menedżerów, historię zapytań i wygodne aktualizowanie bazy wiedzy bez programisty.

Proponowany stos: OpenAI lub Claude API, Python/FastAPI, PostgreSQL + pgvector lub Qdrant, React/Next.js dla interfejsu, pipeline ładowania i indeksowania dokumentów, wdrożenie na waszym serwerze lub w chmurze z HTTPS. Architektura może być od razu zaprojektowana tak, aby w przyszłości podłączyć asystenta do analitycznego magazynu danych.

Mam doświadczenie w podobnych rozwiązaniach RAG: wewnętrzne bazy wiedzy, wyszukiwanie w dokumentacji, asystenci FAQ, systemy dla zespołów sprzedaży/wsparcia z odpowiedziami na podstawie źródeł.

Ilya P.

42 0

Budżet: 4000 UAH Termin: 3 dni

Dzień dobry!
Dopracowuję projekt https://salesslon.com - tam używane jest RAG do analizy rozmów menedżerów z klientami. Model nic nie wymyśla, działa wyłącznie z tekstami rozmów.

Zobaczę, co jest nie tak z waszym projektem, dlaczego nie działa. Jeśli nie ma krytycznych problemów - poprawię błąd. Jeśli wszystko jest źle - powiem, jak bym to zrobił.

Koszt RAG jest bardzo niski, zależy od objętości danych, są nawet darmowe modele.

Valerii Holovatenko

0 0

Zlecenia -
Ocena -
Ranking 457

Budżet: 4000 UAH Termin: 5 dni

Dzień dobry!

Pracowałem nad podobnymi rozwiązaniami AI, gdzie głównym zadaniem było stworzenie jednolitego systemu wiedzy oraz automatyzacja pracy z danymi. Z opisu widzę, że macie już prototyp, ale prawdopodobnie problem leży w integracji RAG-pipeline z LLM lub przekazywaniu kontekstu przez API. Zacząłbym od audytu technicznego, aby określić, czy bardziej opłaca się poprawić obecną architekturę, czy szybciej i pewniej ją przebudować.

W swoich projektach budowałem asystentów AI, automatyzowałem przetwarzanie danych przez Make.com, integrowałem CRM, usługi AI oraz API w jednolite procesy biznesowe, a także tworzyłem konsultantów AI do kwalifikacji leadów i spersonalizowanych odpowiedzi.

Orientacyjne terminy:
• audyt i przywrócenie obecnego rozwiązania — 2–4 dni;
• jeśli potrzebna jest pełna przebudowa — 7–10 dni roboczych.

Koszt:
• audyt — od 300 USD;
• pełna realizacja — 1,200–1,800 USD (w zależności od obecnego stanu kodu i wymagań).

Miesięczny koszt:
• hosting VPS — około 15–40 USD;
• tokeny OpenAI/Claude — orientacyjnie 20–150+ USD w zależności od liczby menedżerów i zapytań.

Proszę, dajcie znać, jaki model jest obecnie używany (OpenAI czy Claude) i jaką bazę wektorową już podłączaliście? To pomoże szybko ocenić, czy wystarczy poprawić istniejące rozwiązanie, czy warto od razu zaproponować bardziej niezawodną architekturę.

Andriy Koval

0 0

Zlecenia -
Ocena -
Ranking 282

Budżet: 15000 UAH Termin: 7 dni

Obecnie najważniejsze jest znalezienie przyczyny, dlaczego prototyp nie przesyła danych z bazy wiedzy do LLM. Jeśli problem dotyczy tylko API lub RAG-pipeline'u — można to naprawić bez pełnej przebudowy. Jeśli jednak architektura została źle zbudowana, logiczniej będzie ją od razu przebudować, aby w przyszłości nie występowały problemy ze skalowaniem.

Co należy zrobić:
• przeprowadzić audyt obecnego projektu i sprawdzić integrację API;
• skonfigurować RAG, aby model odpowiadał tylko na podstawie dokumentacji;
• wdrożyć ładowanie i aktualizację bazy wiedzy bez udziału dewelopera;
• dodać interfejs webowy z autoryzacją i historią zapytań;
• przygotować system do dalszego podłączenia innych źródeł danych.

Warto również od razu zdecydować, jaki model używać (OpenAI czy Claude), ponieważ od tego zależeć będą jakość odpowiedzi i miesięczne wydatki na tokeny.

Jeśli udostępnicie dostęp do obecnego projektu, można szybko zrozumieć, czy wystarczy poprawić istniejące rozwiązanie, czy korzystniej będzie zbudować nową architekturę.

Sergey Petrenko

2 0

Zlecenia -
Ocena -
Ranking 352

Budżet: 4000 UAH Termin: 3 dni

RAG-asystent dla sprzedaży EN: audyt twojego prototypu → naprawa pobierania lub przebudowa (Python/FastAPI, pgvector, Claude/GPT). Web + autoryzacja, przesyłanie bez programisty, historia zapytań, tryb „wstawiłem pytanie klienta — otrzymałem odpowiedź”. ~3–5 tygodni, ~90–150 godz.; hosting+API ~$80–350/mies. Wyślij kod — zrobię audyt w ciągu 1–3 dni.

Volodymyr N.

156 1

Budżet: 4000 UAH Termin: 1 dzień

Dzień dobry! 🧡
Jestem gotowy do pracy, chętnie pomogę w minimalnych terminach 😉
Mam doświadczenie w podobnych projektach. 🌼 (Są opinie na ten temat oraz prace w portfolio)
Zrobię to w najlepszej formie, zaczynam teraz! 🚀🛸✈️

Koniecznie piszcie, omówimy. Odpowiadam natychmiast!

Vadym Shrub

7 0

Budżet: 4000 UAH Termin: 1 dzień

Cześć!

Najprawdopodobniejsza przyczyna, dla której dokumenty nie docierają do modelu: retrieval znajduje fragmenty, ale nie są one podstawiane w kontekście przed wywołaniem API — lub embeddings po prostu nie są aktualizowane po załadowaniu nowych dokumentów. Audyt kodu i dostępów pokaże dokładne miejsce przerwy w ciągu pół dnia-dnia.

Etap 1 — Audyt. Sprawdzę wywołania API, indeksowanie, bazę wektorową, budowę promptu. Na podstawie wyników — jasny wniosek: naprawić istniejące czy przebudować od zera, z uzasadnieniem i oszacowaniem kosztów/czasu.
Etap 2 — Realizacja na podstawie wyników audytu. Stos: FastAPI, PostgreSQL + pgvector (lub Qdrant), Claude API, interfejs webowy z autoryzacją, historia zapytań, aktualizacja bazy bez dewelopera.
Mam doświadczenie z FastAPI i pracą z zewnętrznymi API (w tym budowa bota Telegram z monitorowaniem kilku marketplace'ów przez API w czasie rzeczywistym — podobna logika z przetwarzaniem i wydawaniem danych).

Uściślenie: na czym napisany jest obecny prototyp (LangChain/LlamaIndex czy własne rozwiązanie) i jaka baza wektorowa jest już podłączona?

Skontaktuj się!

Oleksandr Zabolotnii

2 0

Zlecenia -
Ocena -
Ranking 651

Budżet: 11111 UAH Termin: 1 dzień

Cześć! Mam już ponad 3 lata doświadczenia w tworzeniu usług AI/Full-stack. Posiadam gotowy, przetestowany szablon RAG, który w 90% spełnia Twoje wymagania.

Mój stos technologiczny: FastAPI, LangGraph (agenci i historia), Qdrant (wyszukiwanie wektorowe z MMR), Flashrank (przeranking przeciwko halucynacjom), Redis i Docker.

Plan realizacji:

Audyt (1 dzień): Sprawdzę Twój prototyp. Jeśli problem dotyczy tylko API — naprawię go. Jeśli kod jest surowy — uzasadnię wdrożenie mojego gotowego backendu, co zaoszczędzi czas.

RAG i Kontrola (3–4 dni): Ustawię ścisłe systemowe prompty (strict QA) — model będzie odpowiadał ściśle według dokumentów. Zintegruję Claude 3.5 Sonnet lub GPT-4o mini.

Interfejs i Panel administracyjny (3 dni): Stworzę czysty interfejs webowy z autoryzacją, sekcją do przesyłania/usuwania plików przez menedżerów (bez udziału dewelopera) oraz logowaniem historii czatów. Architektura będzie początkowo gotowa do podłączenia analitycznej bazy danych.

Terminy i koszt:

Czas: 5–7 dni (prawdopodobnie szybciej, ale biorę z zapasem).

Koszt pracy: 400–7000 USD.

Orientacyjne koszty miesięczne: Hosting (VPS) — 20–30 USD; Tokeny (dla zespołu sprzedaży) — 15–40 USD w zależności od obciążenia.

Chętnie pokażę demo podobnego systemu, napisz — omówimy!

Samir Shahub

2 0

Zlecenia -
Ocena -
Ranking 584

Budżet: 3800 UAH Termin: 5 dni

Cześć! Jestem gotowy, aby rozpocząć audyt techniczny istniejącego prototypu - sprawdzę API, przekazywanie kontekstu dokumentów do modelu, indeksowanie oraz powód, dla którego baza nie jest ładowana. Stos: Python, PostgreSQL + pgvector (lub Qdrant) do wyszukiwania wektorowego, pipeline RAG z OpenAI/Claude API, interfejs webowy z autoryzacją dla menedżerów, aktualizacja bazy bez programisty poprzez przesyłanie plików. Odpowiedzi - ściśle na podstawie załadowanych dokumentów, z uczciwym fallbackiem, jeśli informacji brakuje. Po audycie dam jasną odpowiedź - naprawić istniejące czy przebudować od zera.

Kostya Romanchuk

0 0

Zlecenia -
Ocena -
Ranking 327

Budżet: 5000 UAH Termin: 5 dni

Cześć! To dokładnie to zadanie, które wykonuję — integracja RAG, gdzie gotowy prototyp trzeba „połączyć” z bazą wiedzy.

Niedawno oddałem panel FastAPI do zarządzania kontami z zadaniami w tle i statusem w czasie rzeczywistym (7500 UAH) — podobna architektura: serwis, który przetwarza dane i odpowiada na zapytania.

W twoim przypadku standardowy stos: ładowanie dokumentów → chunkowanie → embeddings → wektorowa baza danych (Qdrant/Chroma/pgvector) → retrieval-chain. Jeśli prototyp jest już gotowy, integracja bazy wiedzy zajmie 3–7 dni w zależności od formatu dokumentów i architektury prototypu.

Budżet 4000 UAH wydaje się skromny — jeśli objętość jest mała, to w porządku; jeśli nie — warto to omówić. W jakim formacie przechowywana jest dokumentacja (PDF, Word, Google Docs)? Jaki stos ma prototyp?

Ihor S.

2 0

Zlecenia -
Ocena -
Ranking 567

Budżet: 4000 UAH Termin: 1 dzień

Dzień dobry, Jurij!
Jestem gotów zająć się Państwa projektem. Jestem certyfikowanym deweloperem Anthropic — Claude Certified Architect (Foundations), specjalizuję się w architekturze produkcyjnej z Claude API, MCP i RAG-pipeline'ami. Weryfikacja certyfikatu: https://www.credly.com/badges/3df97b6b-e468-42b9-9bd6-c1f78aa309fc
Podobny przypadek. Niedawno zrealizowałem podobny projekt - wewnętrzny knowledge graph oparty na Neo4j + Claude, dzięki MCP asystent odpowiada na zapytania pracowników ściśle według dokumentacji korporacyjnej, z odniesieniami do źródła i bez „wymyślonych” faktów. To prawie jeden do jednego Państwa zadanie, tylko dodatkowo wykorzystałem graf wiedzy do dokładniejszego wyszukiwania po powiązaniach między regulacjami.

Dwa pytania, aby dokładniej oszacować:

Ile mniej więcej dokumentów/stron znajduje się w bazie i w jakich formatach (PDF, Word, Google Docs, arkusze)?
Czy w obecnym prototypie już istnieje baza wektorowa, czy dokumenty są po prostu załadowane na serwer bez wyszukiwania po treści?

Jestem gotów zacząć od audytu od razu po otrzymaniu kodu i dostępów.

Ivan Filatov

0 0

Zlecenia -
Ocena -
Ranking 476

Budżet: 5000 UAH Termin: 10 dni

Witam, mogę to zrealizować. Budowałem systemy RAG na bazie n8n.

Google Drive

Można wszystko oprócz samego LLM wdrożyć u was na serwerze. To będzie self-host n8n + supabase, jako wektorowe magazynowanie.

Cena będzie tylko za tokeny, a to wszystko zależy od liczby zapytań, dokładności odpowiedzi oraz liczby dokumentów w systemie RAG. Ile będzie dokumentów? Przez jaki interfejs chcecie się komunikować z systemem? I czy jest administrator systemu, który może wdrożyć n8n i supabase?

Valentin Solomko

1 0

Zlecenia -
Ocena -
Ranking 898

Budżet: 4000 UAH Termin: 1 dzień

Dzień dobry, Yurii.

Najprawdopodobniejsza przyczyna: model otrzymuje zapytanie, ale nie znaleziono fragmentów dokumentów jako kontekstu — retrieval nie jest połączony z wywołaniem API.
Audyt wykryje miejsce przerwy i określi — naprawić czy przebudować.

Twój RAG-pipeline — pgvector i bge-m3 do wyszukiwania semantycznego.
LLM: Claude Sonnet lub GPT-4o-mini z obliczeniem tokenów pod Twoje objętości.
Model będzie odpowiadał ściśle na podstawie kontekstu, bez wymyślania.
Interfejs webowy z autoryzacją, historią zapytań i aktualizacją bazy plikami bez programisty.
Architektura — z rozszerzeniem na analityczne magazynowanie.

Podobny projekt: RAG na Go + pgvector + OpenRouter.
Stos: Go, pgvector, bge-m3, Claude/OpenAI API, Docker, HTTPS.
Miesięczny koszt posiadania przygotuję po omówieniu objętości.

Możliwe opcje:
- Przywrócenie i uruchomienie
8000–12000 UAH
Przywrócenie funkcjonalności prototypu i podstawowy dostęp do bazy wiedzy.
- Działający RAG-pipeline bez „halucynacji” modelu
- Podstawowy interfejs webowy do uzyskiwania odpowiedzi
- Podłączenie API wybranej LLM (OpenAI/Claude)
- Instrukcja ręcznego aktualizowania bazy danych

- Pełna funkcjonalność
15000–25000 UAH
Pełnoprawny korporacyjny asystent z autonomicznym zarządzaniem wiedzą (Zalecane).
- Interfejs ładowania dokumentów bez udziału programisty
- System autoryzacji dla menedżerów działu sprzedaży
- Historia zapytań do monitorowania jakości odpowiedzi
- Optymalizowana architektura do przyszłego podłączenia do analitycznego magazynu
- Pełne obliczenie kosztów tokenów i hostingu

- Rozszerzone rozwiązanie
30000–45000 UAH
Rozszerzone narzędzie AI z zwiększoną dokładnością i wsparciem dla złożonych scenariuszy.
- Ulepszona obróbka dokumentów (OCR dla skanów, złożone tabele)
- Rozszerzona funkcjonalność generowania odpowiedzi dla różnych kanałów komunikacji
- Priorytetowe wsparcie i optymalizacja kosztów tokenów przez miesiąc
- Integracja z chmurą do automatycznej synchronizacji plików
- Pełny pakiet dokumentacji technicznej z architektury systemu

Andrii Prokopiev

18 0

Budżet: 4000 UAH Termin: 1 dzień

Witaj!

Jeśli robić wyłącznie na podstawie wbudowanej bazy wiedzy, to LLM potrzebne jest tylko do generowania odpowiedzi i rozumienia pytania, a cała wektoryzacja (RAG) może być wykonywana przez lokalny model.

Robiłem takiego wewnętrznego asystenta menedżera dla DDTuning. Napisz, pokażę jak działa.

Jeśli chodzi o sprawdzenie, dlaczego teraz nie działa, to możemy to przejrzeć.

Andrii Ivashchenko

0 0

Zlecenia -
Ocena -
Ranking 459

Budżet: 7000 UAH Termin: 7 dni

Budowałem podobne systemy RAG: FastAPI, baza wektorowa (Qdrant / pgvector), embeddings przez Claude lub OpenAI, interfejs webowy z autoryzacją. Pierwszy krok — audyt prototypu: znajdę, gdzie przerywa się pipeline między bazą a modelem, zdecydujemy, co będzie szybsze — naprawić czy zbudować na nowo.

Stos: FastAPI, pgvector/Qdrant, API Claude (polecam — dokładniejsze w trudnych zapytaniach, przejrzysta taryfikacja tokenów), prosty interfejs webowy, Docker, HTTPS. Aktualizacja bazy — przesyłanie plików bez programisty. Architektura od razu z myślą o przyszłym magazynie analitycznym.

Około 35 godzin pracy. Gotowy do rozpoczęcia po uzyskaniu dostępu.

Napisz — omówimy szczegóły i zaczynamy.

Artur Sefer

0 0

Zlecenia -
Ocena -
Ranking 272

Budżet: 4000 UAH Termin: 5 dni

Witam!

Mam doświadczenie w rozwijaniu usług opartych na LLM i architekturze RAG. Proponuję zacząć od audytu obecnego rozwiązania: sprawdzić integrację z API, pipeline indeksowania i wyszukiwania, po czym albo przywrócić funkcjonalność, albo uzasadnione zaproponować przebudowę.

Do realizacji proponuję stos: Python (FastAPI), OpenAI lub Claude API, PostgreSQL + pgvector (lub Qdrant), nowoczesny interfejs webowy z autoryzacją i możliwością samodzielnego aktualizowania bazy wiedzy.

Orientacyjny czas pierwszego etapu (audyt + uruchomienie wersji roboczej) - 5–10 dni. Dokładny koszt będę mógł podać po zapoznaniu się z obecnym kodem i architekturą. Pomogę również ocenić miesięczne wydatki na API i hosting w zależności od objętości dokumentów i liczby zapytań.

W liście nie są widoczne oferty ukryte przez zleceniodawcę lub freelancerów z profilem Plus, a także oferty, które naruszają regulamin

Dmytro Smal

5 0

Budżet: 4000 UAH Termin: 1 dzień

zamawiający wszystko zrobił, ale nie działa mały szczegół)) to tylko komentarz, proszę nie rozważajcie mnie do tego projektu

Yurii Asadchyi
Kijów, Ukraina
You Can Legal

Zleceń -
Ocena -
Ranking 65

Vladyslav Dykyi

Kyryll Monastыrnыi

Andrey K.

Bohdan Melnyk

Oleg Grigoryev

Maksym O.

Andrey Krasik

Artur Boiko

Vitalii Karasov

Lilia N.

Danilo Hablak

Valentin Haritonov

Roman D.

Dmytro Zavadskyi

Maksym Holod

Serhii Valko

Dmytro Staroselskyi

Maksim Sheptookha

Pavlo B.

Vladislav Grisyuk

Serhii Makhov

Volodymyr S.

Pavlo M.

Oleksii Buglak

Ihor Symchuk

Dmytro Ivchenko

Vyacheslav Yudin

Kyryl Shcherbyna

Ilya P.

Valerii Holovatenko

Andriy Koval

Sergey Petrenko

Volodymyr N.

Vadym Shrub

Oleksandr Zabolotnii

Samir Shahub

Kostya Romanchuk

Ihor S.

Ivan Filatov

Valentin Solomko

Andrii Prokopiev

Andrii Ivashchenko

Artur Sefer

Aktualnie brak ofert

Dmytro Smal

Oferty ukryte

Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe