KasAgent — десктопний AI‑агент з розумним диспетчером моделей
KasAgent я створив як особистий “оператор нейромереж” під Windows: не просто чат, а агент, який може читати проект, планувати кроки та виконувати їх через інструменти операційної системи.
Для роботи з LLM я інтегрував KasAgent з існуючим OmniRoute-проксі та MCP-сервером (це окремий open-source/зовнішній компонент, не моя розробка). Агент використовує цей шар, щоб динамічно звертатися до різних моделей і провайдерів, але логіка вибору моделей та оркестрації завдань реалізована вже на моїй стороні — в Intelligent Model Dispatcher.
Агент працює в кількох режимах: Assistant (тільки для читання, без права запису), Executor (повний доступ в рамках дозволів) та підрежим Planning UI, який показує користувачу план кроків перед виконанням. В окремому режимі Fast можна швидко прогнати ідею або перевірку без важкого планування, коли не потрібна складна оркестрація.
Для роботи з проектами є multi-project workspace: агент знає кореневу директорію PROJECTSDIR, бачить кілька репозиторіїв, може робити listdir, шукати файли, читати вихідні дані та зберігати артефакти своєї роботи в ~/.kasagent/artifacts (текст, HTML, JSON тощо). Усі операції через файлові інструменти проходять валідацію шляхів і обмежені робочою директорією, щоб агент не міг “вийти гуляти” по всій системі.
Окремо реалізована система артефактів: агент може зберігати проміжні звіти, стиснуті резюме, фрагменти коду та візуальні результати у вигляді файлів, щоб до них повертатися пізніше. Для складних завдань є підтримка компресії контексту та “thought signature” — окремої короткої зведення думок моделі, яку можна підмішувати в наступні запити замість повного логу.
Через браузерну частину (Chromium в Electron) KasAgent вміє оркеструвати перевірки інтерфейсу: робити скріншоти, проганяти їх через vision-моделі, підтверджувати текст з екрану та на основі цього формувати звіт про результат тесту — саме цей сценарій зараз показаний на скріншоті.
5–7 пунктів “що вміє KasAgent”
Двохфазна архітектура: написаний мною Intelligent Model Dispatcher планує завдання, валідує моделі та передає виконання в KasAgent Executor.
Інтеграція з зовнішнім OmniRoute-проксі та MCP-сервером: KasAgent сам вирішує, які моделі запитувати через цей шар, але не є автором OmniRoute.
Multi-project workspace: агент бачить кілька проектів, читає файли, шукає по коду та зберігає артефакти роботи в ~/.kasagent/artifacts.
Жорстка система прав: окремі режими для читання та для запису, валідація шляхів та обмеження всіх операцій робочою директорією.
Vision-інструменти: describe_image, читання тексту зі скріншотів та формування зрозумілих звітів про результати тестів інтерфейсу.
UI на Electron + React з окремим Planning UI-вікном, де агент спочатку показує план дій і тільки потім запускає виконання.
Підтримка швидкої перевірки гіпотез через Fast-режим без важкого планування, коли важливий час відгуку.
#electronjs #Node.js #javascript #React #desktop-додатків #Linux\Windows #ai-integration
Для роботи з LLM я інтегрував KasAgent з існуючим OmniRoute-проксі та MCP-сервером (це окремий open-source/зовнішній компонент, не моя розробка). Агент використовує цей шар, щоб динамічно звертатися до різних моделей і провайдерів, але логіка вибору моделей та оркестрації завдань реалізована вже на моїй стороні — в Intelligent Model Dispatcher.
Агент працює в кількох режимах: Assistant (тільки для читання, без права запису), Executor (повний доступ в рамках дозволів) та підрежим Planning UI, який показує користувачу план кроків перед виконанням. В окремому режимі Fast можна швидко прогнати ідею або перевірку без важкого планування, коли не потрібна складна оркестрація.
Для роботи з проектами є multi-project workspace: агент знає кореневу директорію PROJECTSDIR, бачить кілька репозиторіїв, може робити listdir, шукати файли, читати вихідні дані та зберігати артефакти своєї роботи в ~/.kasagent/artifacts (текст, HTML, JSON тощо). Усі операції через файлові інструменти проходять валідацію шляхів і обмежені робочою директорією, щоб агент не міг “вийти гуляти” по всій системі.
Окремо реалізована система артефактів: агент може зберігати проміжні звіти, стиснуті резюме, фрагменти коду та візуальні результати у вигляді файлів, щоб до них повертатися пізніше. Для складних завдань є підтримка компресії контексту та “thought signature” — окремої короткої зведення думок моделі, яку можна підмішувати в наступні запити замість повного логу.
Через браузерну частину (Chromium в Electron) KasAgent вміє оркеструвати перевірки інтерфейсу: робити скріншоти, проганяти їх через vision-моделі, підтверджувати текст з екрану та на основі цього формувати звіт про результат тесту — саме цей сценарій зараз показаний на скріншоті.
5–7 пунктів “що вміє KasAgent”
Двохфазна архітектура: написаний мною Intelligent Model Dispatcher планує завдання, валідує моделі та передає виконання в KasAgent Executor.
Інтеграція з зовнішнім OmniRoute-проксі та MCP-сервером: KasAgent сам вирішує, які моделі запитувати через цей шар, але не є автором OmniRoute.
Multi-project workspace: агент бачить кілька проектів, читає файли, шукає по коду та зберігає артефакти роботи в ~/.kasagent/artifacts.
Жорстка система прав: окремі режими для читання та для запису, валідація шляхів та обмеження всіх операцій робочою директорією.
Vision-інструменти: describe_image, читання тексту зі скріншотів та формування зрозумілих звітів про результати тестів інтерфейсу.
UI на Electron + React з окремим Planning UI-вікном, де агент спочатку показує план дій і тільки потім запускає виконання.
Підтримка швидкої перевірки гіпотез через Fast-режим без важкого планування, коли важливий час відгуку.
#electronjs #Node.js #javascript #React #desktop-додатків #Linux\Windows #ai-integration