Szukam doświadczonego inżyniera AI/Linux do stworzenia self-hosted infrastruktury AI na moim serwerze.
Potrzebne:
- Zainstalować i skonfigurować Ubuntu Server lub Debian
- Ekosystem Docker
- Ollama + lokalne LLM
- Open WebUI
- Integracja z Telegramem
- Asystent AI
- Autonomiczne przepływy pracy
- System wieloagentowy
- Przyspieszenie GPU (NVIDIA)
- Trwała pamięć/baza danych
- Zdalny dostęp i monitoring
Główny cel:
Stworzyć asystenta AI, który będzie mógł:
- automatyzować zadania
- zarządzać przepływem pracy
- interagować przez Telegram/Web UI
- uruchamiać agentów AI
- skalować system
- tworzyć nowe przepływy pracy i agentów
- ulepszać architekturę automatyzacji
Interesuje mnie:
- stabilna i bezpieczna architektura
- możliwość dalszego skalowania
- modularny ekosystem AI
- infrastruktura self-hosted
Rozważam długoterminową współpracę.
Proszę o napisanie:
- doświadczenie
- podobne projekty
- zalecany stos technologiczny
- koszt
- terminy
-
Na podstawie doświadczenia - zbudowaliśmy infrastrukturę AI hostowaną na własnych serwerach, procesy robocze oparte na agentach, automatyzację korporacyjną oraz systemy z integracjami. Z technologii wybrałbym Ubuntu Server lub Debian, Docker Compose, Ollama, Open WebUI, Telegram Bot API, Postgres, Qdrant lub Chroma, Nginx, Tailscale lub WireGuard, NVIDIA Container Toolkit, Prometheus i Grafana.
Co do kosztów - 45000 UAH za etap startowy na 10-14 dni. W to wchodzi podstawowa architektura, instalacja, przyspieszenie GPU, dostęp, monitorowanie, pamięć, Telegram i Web UI, podstawa dla agentów oraz dokumentacja do dalszego rozwoju. Budżet 1000 UAH tutaj prawdopodobnie nie pokryje nawet normalnej diagnostyki serwera =/
Zobaczcie, jest tu niuans - taki system lepiej budować nie jako zestaw skryptów, ale jako modułową platformę. Najpierw uruchamiamy stabilne jądro, potem dodajemy nowe procesy robocze, agentów i integracje bez przerabiania całej architektury.
Uściślę 2 kwestie
> Jaka karta graficzna, ile VRAM, RAM i dysk na serwerze
> Czy potrzebne są zewnętrzne dostępy dla użytkowników, czy tylko zamknięty dostęp dla was
…
Podobne przypadki
> https://business.ingello.com/vorfahr - AI i automatyzacja procesów biznesowych
> https://business.ingello.com/fractal - podejście oparte na agentach i modułowa logika automatyzacji
> https://business.ingello.com/forma-bpm - procesy robocze, role i zarządzana automatyzacja
Główny landing Ingello dla FLH - https://systems-fl.ingello.com
!! Ważne !! nie zaczynałbym od chaotycznej instalacji wszystkiego naraz. Siedem razy zmierz - raz przetnij. Najpierw krótkie projektowanie, potem instalacja i sprawdzenie bezpieczeństwa, w przeciwnym razie system szybko stanie się drogą zabawką, a nie narzędziem roboczym.
-
Rozwinę stabilny i odporny na awarie samodzielnie hostowany ekosystem AI oparty na Ubuntu Server z akceleracją GPU, izolowanymi kontenerami Docker i zabezpieczonym zdalnym dostępem przez Telegram.
Jaką dokładnie platformę orkiestracji planujecie użyć jako rdzeń do zarządzania scenariuszami wieloagentowymi — wizualne n8n, CrewAI czy niestandardowy kod w Pythonie?
Budżet, dokładne terminy i stos technologiczny do długoterminowej współpracy chętnie omówię z Wami w prywatnej korespondencji.
Podobne wykonane zlecenie: В модулі OpenCart виправити 5 проблем повязаних з Facebook API
-
Cześć, pracowałem nad infrastrukturą AI do automatyzacji procesów biznesowych w firmie z ponad 50 pracownikami - skonfigurowałem Ollama z lokalnymi LLM, stworzyłem system multi-agentowy z integracją Telegram, osiągnąłem 40% redukcję pracy ręcznej.
Ciekawe, czy planujecie zintegrować system z istniejącymi aplikacjami korporacyjnymi, czy to będzie samodzielne rozwiązanie dla procesów wewnętrznych?
Proponuję się skontaktować, chętnie doradzę Państwu bezpłatnie z technicznej strony i opracujemy plan rozwoju + opowiem o moim zespole! ✨
-
196 Mamy już praktycznie gotową bazę pod taką infrastrukturę AI, którą można szybko dostosować do waszego serwera i uruchomić pierwszy działający wariant ))
Co do kosztów, proponowałbym budżet od 45 000 UAH za pierwszy etap na 10-14 dni.
W to wchodzi serwer Linux, ekosystem Docker, Ollama, Open WebUI, integracja z Telegramem, podstawowa pamięć, zdalny dostęp, monitoring, uruchamianie lokalnych modeli i podstawa dla agentów.
1000 UAH wydaje się odpowiednie tylko na krótką diagnostykę serwera lub konsultację, a nie na budowę stabilnego systemu.
Co do stosu, polecałbym Ubuntu Server, Docker Compose, Ollama, Open WebUI, PostgreSQL lub SQLite na początek, n8n lub własną warstwę procesów roboczych, Telegram bot API, Prometheus lub Netdata do monitoringu, sterowniki NVIDIA i CUDA przy dostępnej odpowiedniej karcie graficznej.
…
Robiliśmy podobne rozwiązania dotyczące agentów AI i automatyzacji.
https://business.ingello.com/fractal - bliskie pod względem logiki procesów wieloagentowych i rozwoju architektury.
https://business.ingello.com/vorfahr - przykład automatyzacji z AI i systemowym podejściem do produktu.
https://business.ingello.com/tts - przykład integracji AI i pracy z aplikacjami.
Strona główna naszych projektów systemowych dla Freelancehunt - https://systems-fl.ingello.com
Od was potrzebne są parametry serwera, dostępność lub model GPU NVIDIA, pożądany sposób zdalnego dostępu oraz lista pierwszych 3-5 zadań, które asystent ma zautomatyzować.
Wyjaśnię dwa punkty.
Serwer został już zakupiony i ma fizyczny dostęp lub IPMI.
Asystent ma tylko pomagać przez Telegram/Web UI lub samodzielnie uruchamiać polecenia, tworzyć pliki i zmieniać procesy robocze na serwerze.
Ogólnie rzecz biorąc, można iść etapami - najpierw stabilne jądro, potem agenci, pamięć i nowe scenariusze robocze.
Nie będziemy budować wieży do nieba, ale fundament lepiej położyć prawidłowo =/--
-
448 3 0 Dzień dobry! Mam bogate doświadczenie w wdrażaniu takiej infrastruktury w Kubernetes. Architektonicznie bardziej poprawne byłoby użycie vLLM. Mogę przystąpić do pracy w najbliższym czasie z wstępnym spotkaniem w celu uzgodnienia szczegółów. Czekam na wiadomość.
-
472 1 0 Dzień dobry!
Tydzień temu zająłem 3. miejsce solo na AI Agent Olympics Hackathon (Milan AI Week 2026, największe wydarzenie AI w Europie) spośród 731 zespołu - zbudowałem system multi-agentowy w ciągu 7 dni. Ponad rok doświadczenia jako inżynier automatyzacji AI na pełen etat, wcześniej 4 lata jako PM w USA/EU/Azji, MSc w Strategicznym Zarządzaniu Projektami, PRINCE2, Python/Docker codziennie.
Stos technologiczny na maj 2026: Ubuntu 26.04 LTS, Docker, Ollama v0.6.2 (Llama 4 Scout / DeepSeek V4 / Qwen 3.6 na twoim sprzęcie), Open WebUI v0.8.0 (z poprawką CVE-2026-0765), n8n self-hosted jako orkiestrator, Supabase pgvector dla pamięci, bot Telegram z human-in-the-loop, CUDA 13.2.1, Tailscale + Prometheus/Grafana.
MVP (instalacja + 2-3 agenci + Telegram + monitoring): 35 000 UAH, 10-14 dni. Pełny modułowy ekosystem z autogeneracją agentów: 70 000 UAH, 3-4 tygodnie. Napisz, na jaki sprzęt rozkładamy - w ciągu doby zwrócę dokładny kosztorys i roadmap.
Przykłady w profilu
-
1824 81 0 Dzień dobry!
Mam doświadczenie w budowaniu self-hosted infrastruktury AI na Linuxie z Dockerem, GPU, integracją z Telegramem i systemami automatyzacji.
Dla waszego projektu zalecałbym użycie vLLM zamiast Ollama jako bardziej wydajnego i skalowalnego rozwiązania dla lokalnych LLM, a także Open WebUI, PostgreSQL/Redis i systemu agenta na LangGraph lub CrewAI.
Wstępny czas realizacji podstawowej platformy wynosi 2 tygodnie, koszt zależy od liczby agentów, scenariuszy automatyzacji i wymagań dotyczących autonomii. Jestem gotów omówić szczegóły i zaproponować optymalną architekturę pod dalsze skalowanie.
-
1973 17 0 1 Witam. Zadanie jest jasne: potrzebujesz nie tylko "zainstalowanego Ollama", ale pełnoprawnego Self-hosted Autonomous AI Ecosystem z logiką agenta, pamięcią i możliwością skalowania. Mam ponad 8-letnie doświadczenie w rozwijaniu złożonych systemów oraz głęboką ekspertyzę w infrastrukturze AI (lokalne LLM, RAG, systemy wieloagentowe).
Mój zalecany stos technologiczny:
Infrastruktura: Ubuntu Server + Docker Compose + Portainer (zarządzanie) + NVIDIA Container Toolkit.
LLM Core: Ollama (szybki start) lub vLLM (wysoka wydajność) + Open WebUI z obsługą Multi-user/RAG.
Workflow & Agenci: n8n (self-hosted) — idealny "klej" do automatyzacji + LangGraph lub CrewAI dla złożonej logiki wieloagentowej.
Pamięć/RAG: PostgreSQL z rozszerzeniem pgvector lub Qdrant dla długoterminowej pamięci agentów.
Dostęp & Bezpieczeństwo: Tailscale/Netbird (bezpieczny zdalny dostęp bez otwierania portów) + Uptime Kuma (monitoring).
…
Etapy realizacji:
Podstawowa konfiguracja (3–5 dni): OS, sterowniki GPU, Docker, Ollama, Open WebUI. Konfiguracja bezpiecznego dostępu.
Logika agenta (5–10 dni): Wdrożenie n8n, stworzenie bota Telegram, konfiguracja pierwszych autonomicznych workflow (np.: zbieranie danych -> analiza AI -> raport w TG).
Zaawansowana architektura (7–10 dni): Integracja frameworka Multi-agent (CrewAI/LangGraph) do realizacji złożonych zadań międzyfunkcjonalnych oraz budowa systemu RAG (pamięć).
Koszt: Wdrożenie ekosystemu — 1 000 USD. Dalsze tworzenie złożonych agentów i workflow — do uzgodnienia (na godzinę lub za projekt). Czas realizacji: 2–4 tygodnie do pełnego uruchomienia autonomicznego systemu.
Ustalenia:
Jakie dokładnie GPU są zainstalowane na serwerze (VRAM jest krytyczna dla wyboru modeli)?
Jakie są priorytetowe 2–3 zadania, które asystent ma zautomatyzować od razu po uruchomieniu?
-
764 5 1 Dzień dobry!
Mam doświadczenie z Ubuntu Server + Docker Compose, Ollama + Open WebUI, workflow n8n, PostgreSQL pgvector, botem Telegram (aiogram), Tailscale. Konfigurowałem NVIDIA Container Toolkit do przyspieszenia GPU.
Proszę o wyjaśnienie: jaka GPU i ile VRAM? n8n czy LangGraph do workflow? To wpłynie na terminy.
Orientacyjny koszt pełnej konfiguracji: 15 000–20 000 UAH, 10–14 dni.
-
172 1 1 Dzień dobry. Jestem gotów zrealizować ten projekt, mam duże doświadczenie w tworzeniu różnych aplikacji.
-
1036 4 0 Cześć, Vebster, dość dziwnie jest teraz realizować taką system od zera, biorąc pod uwagę ogromną ilość gotowych rozwiązań opensource. Proponuję przejść przez następujące:
1. Klasyka, od której wszystko się zaczęło: OpenClaw
2. Bardziej inteligentny i adaptacyjny: Hermes Agent
3. Ostatnie, najnowsze i najbardziej niezawodne rozwiązanie: OpenHuman
W nim zrealizowane jest praktycznie wszystko, co potrzebujesz, i wiele innych rzeczy.
Jeśli jesteś przeciwny takim autonomicznym agentom, można zbudować od zera:
1. Lepiej nie ollama, a llama cpp - szybsze i efektywniejsze (w benchmarkach do 30% przyspieszenia generacji tokenów)
2. Dla agentów dobrze nadaje się pydanticAI lub LlamaIndex
… 3. Dla pamięci wiele podejść, dobrze teraz pokazują się połączenia RAG + obsidianb graph
Już wielokrotnie robiłem podobne systemy. Budowałem multiagentów do programowania i oceny projektów. Mój ostatni projekt również nawiązuje do wykorzystania agentów. Tak więc, mam doświadczenie.
Jeśli użyjemy gotowego agenta, to cena i terminy będą niższe, w stawce będę wskazywał za drugi wariant.
Będę się cieszył, mogąc z Tobą pracować!
-
726 9 1 Cześć! Twój projekt wygląda bardzo obiecująco. Jestem gotów zacząć pracę i wykonać go na najwyższym poziomie.
-
9340 20 0 1 Witam. Mam doświadczenie z Pythonem, Dockerem, FastAPI, botami Telegram, samodzielnie hostowaną infrastrukturą AI, RAG/pamięcią, lokalnymi LLM przez Ollama oraz budowaniem automatycznych przepływów pracy.
Widziałbym stos technologiczny tak: Ubuntu Server, Docker Compose, Ollama + Open WebUI, Qdrant/PostgreSQL dla pamięci, bot Telegram jako interfejs, n8n lub własna warstwa przepływu pracy, monitoring, backup i bezpieczny zdalny dostęp.
Działałbym etapami: najpierw stabilne jądro na serwerze, potem Telegram/Web UI, pamięć, agenci, automatyzacja przepływu pracy i przyspieszenie GPU. W ten sposób system nie zamieni się w "architektoniczną papkę" i będzie można go skalować.
Jestem gotów omówić zadania i zaproponować realistyczną architekturę dla waszego serwera.
-
2110 3 0 Cześć!
Profil technologiczny — uruchamiam Ollama + Open WebUI na swoim stanowisku roboczym (GTX 1660 SUPER, CUDA 13.1), zbudowałam agenta AI Twin z mostem Telegram i pamięcią persistent (Postgres + pgvector). Multi-agent przez LangGraph — jest działający PoC.
Zalecam: Ubuntu 24.04 LTS + Docker Compose, Ollama + Open WebUI, n8n lub LangGraph do workflow, Postgres + pgvector do pamięci, Tailscale do zdalnego dostępu, Uptime Kuma + Loki/Grafana do monitorowania, bot Telegram na aiogram.
Pytania do rozpoczęcia:
— Serwer z GPU już stoi, czy trzeba dobierać sprzęt? Jaki model GPU i ile VRAM?
— Jakie modele planuje się uruchomić (Llama 3.1 8B/70B, Qwen, Mistral 7B)?
… — Workflow na no-code (n8n/Flowise), czy niestandardowy orchestrator Python (LangGraph/CrewAI)?
Terminy: podstawowa konfiguracja (Docker + Ollama + WebUI + Telegram + 1 agent + podstawowe monitorowanie) — 7-10 dni w niepełnym wymiarze godzin. Multi-agent z przekazywaniem, wywoływaniem narzędzi i pełnym monitorowaniem — dodatkowe 1,5-2 tygodnie.
Budżet 1000 UAH — prawdopodobnie placeholder, realistyczna stała cena za pełną konfigurację z dokumentacją i przekazaniem od 15 000 UAH, lub godzinowo 600 UAH/godz.
Długoterminowo ok, pracuję w niepełnym wymiarze godzin stabilnie. Jestem gotowa przygotować szczegółowy kosztorys po odpowiedziach na powyższe pytania.
-
Привет.
По задаче: это не "запуск Ollama за вечер". Local AI к маю 2026 реально подросла (Gemma 4 26B/32B, Qwen 3 семейство справляются с большинством задач уже вполне сносно), но узкое место всё равно не модели, а железо и параллельная работа агентов.
Для агентной системы с Telegram + Web UI + параллельными процессами reasoning ключевой ресурс это VRAM. Под ваши цели (multi-agent, масштабирование, многозадачность) реально нужно:
- 24GB (RTX 4090 / 5090 32GB): Gemma 4 26-32B Q4 с умеренным контекстом, ОК для одного агента. Для нескольких параллельных уже впритык.
- 48GB (RTX PRO 5000 WS): комфортно для 32B класса с большим контекстом и параллельной работой, или 70B модели в Q4.
- 96GB (RTX PRO 6000 WS): топ для multi-agent сценария без вытеснения контекстов.
- Альтернатива: 2x RTX 4090 (24GB) или модифицированные 4090 48GB. Ollama умеет шардировать слои между GPU, но pipeline-параллелизм добавляет задержку. Tensor parallelism через vLLM работает лучше, но требует фиксированной модели и больше настройки.
- Если в планах RTX 4070/4080 (12-16GB), реально получится только 7-13B модели. Для агентов с reasoning этого мало.
Еще практический gotcha: у Ollama нет блочного KV cache (vLLM PagedAttention это умеет, но требует фиксированной модели и больше настройки). Когда несколько агентов конкурируют за память одной модели, контекст одного вытесняется, и при возврате prefill пересчитывается с нуля. На 8k+ токенов это легко минута на первый токен. Учитывая что у вас в целях "багатоагентна система", это закладываем в архитектуру сразу: выбор runtime, sizing моделей под параллельные сессии, или роутинг через одну "горячую" модель с очередью.
Ваши векторы понял: self-hosted инфраструктура, Telegram + Web UI, модульная экосистема с возможностью добавления новых агентов. Адекватное направление, вопрос в реализации.
Уточнения для реального плана:
Какой GPU фактически есть или планируется купить? Если железо еще не куплено, какой бюджет на него закладываете? От этого зависит какие модели реалистичны и нужен ли вообще гибрид с cloud.
2-3 КОНКРЕТНЫХ примера задач, не категории, а реальные use cases. Например: "хочу чтобы бот читал почту и делал утренний digest", "автогенерация постов для IG по моему style guide", "мониторинг конкурентов с alerts при изменениях". По таким примерам видно хватит ли 32B локально, или нужен гибрид с cloud reasoning для сложных шагов.
"Самостоятельно размещённая инфраструктура" это принципиально 100% local даже если означает худший reasoning? Или допустим гибрид с privacy-proxy для тяжелых задач (cloud API через ваш сервер, данные не хранятся провайдером)?
Это для вас лично или для команды (multi-user)? Влияет на auth и архитектуру.
По мне: много работы с self-hosted LLM stack (Ollama, vLLM), fine-tune и quantization под продакшен деплой. После ваших ответов дам реалистичный план и тайминг.
-
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
Twórca Wideo AI i Artysta 3D dla Innowacyjnego Projektu AI-EdTech (Radaastrea): Szukamy artysty 3D / twórcy wideo AI do innowacyjnego projektu AI-EdTech (Radaastria)Opis: Tworzymy rozbudowaną franczyzę medialną i koncepcję empatycznego robota AI nowej generacji dla nastolatków — RADAASTRIA. Obraz — mądra i jasna 7-letnia dziewczynka, łącząca w sobie boską… AI i uczenie maszynowe, Tworzenie gier ∙ 5 godzin 27 minut temu ∙ 1 oferta |
Przegląd architektury i wdrożenia N8nJęzyk Nasza ekipa techniczna mówi po angielsku, rosyjsku i niemiecku. Możesz wybrać dowolny z tych języków dla swojego tekstu i rozmowy przeglądowej. CelObsługujemy gotowe do produkcji AI i przepływy dokumentów w n8n Cloud, które integrują Salesforce z LLM i usługami… AI i uczenie maszynowe, AI consult ∙ 8 godzin 47 minut temu ∙ 10 ofert |
AI agent do zbierania i strukturyzacji informacji
337 PLN
Potrzebny specjalista, który ma doświadczenie w tworzeniu zautomatyzowanych systemów monitorowania stron internetowych, wiadomości, stron konkurencji oraz źródeł branżowych. Trzeba zebrać prosty scenariusz MVP, który będzie: regularnie sprawdzać określoną listę stron; znajdować… AI i uczenie maszynowe ∙ 9 godzin 8 minut temu ∙ 26 ofert |
Zrobić wideo-rolik AI
168 PLN
Wygenerować wideo z renderu budynku z wykorzystaniem zdjęcia obiektu zgodnie z referencją oraz z uwzględnieniem scenariusza. Jest opracowany testowy prompt, który należy dopracować. Prawdopodobne sieci neuronowe do generacji: King AI, Runway, Luma, Google AI Pro, Google AI… AI i uczenie maszynowe ∙ 1 dzień 21 godzin temu ∙ 21 ofert |
Poszukuję inżyniera automatyzacji AI
84 PLN
Potrzebny inżynier automatyzacji AI, specjalista do stworzenia systemu aktywnego poszukiwania klientów i inteligentnego outreachu (nie zwykły chatbot-automatyczna odpowiedź) w projekcie B2B Zbieranie danych: automatyczne parsowanie kontaktów z "ślepych" baz po nazwach.… AI i uczenie maszynowe, Systemy wbudowane i mikrokontrolery ∙ 2 dni temu ∙ 14 ofert |