KasAgent — десктопный AI‑агент с умным диспетчером моделей
KasAgent я делал как личный “оператор нейросетей” под Windows: не просто чат, а агент, который может читать проект, планировать шаги и выполнять их через инструменты операционной системы.
Для работы с LLM я интегрировал KasAgent с существующим OmniRoute‑прокси и MCP‑сервером (это отдельный open‑source/внешний компонент, не моя разработка). Агент использует этот слой, чтобы динамически обращаться к разным моделям и провайдерам, но логика выбора моделей и оркестрации задач реализована уже на моей стороне — в Intelligent Model Dispatcher.
Агент работает в нескольких режимах: Assistant (read‑only, без права записи), Executor (полный доступ в рамках разрешений) и подрежим Planning UI, который показывает пользователю план шагов перед выполнением. В отдельном режиме Fast можно быстро прогнать идею или проверку без тяжёлого планирования, когда не нужна сложная оркестрация.
Для работы с проектами есть multi‑project workspace: агент знает корневую директорию PROJECTSDIR, видит несколько репозиториев, может делать listdir, искать файлы, читать исходники и сохранять артефакты своей работы в ~/.kasagent/artifacts (текст, HTML, JSON и т.п.). Все операции через файловые инструменты проходят валидацию путей и ограничены рабочей директорией, чтобы агент не мог “выйти гулять” по всей системе.
Отдельно реализована система артефактов: агент может сохранять промежуточные отчёты, сжатые резюме, фрагменты кода и визуальные результаты в виде файлов, чтобы к ним возвращаться позже. Для сложных задач есть поддержка компрессии контекста и “thought signature” — отдельной краткой сводки мыслей модели, которую можно подмешивать в следующие запросы вместо полного лога.
Через браузерную часть (Chromium в Electron) KasAgent умеет оркестрировать проверки интерфейса: делать скриншоты, прогонять их через vision‑модели, подтверждать текст с экрана и на основе этого формировать отчёт о результате теста — именно этот сценарий сейчас показан на скриншоте.
5–7 bullets “что умеет KasAgent”
Двухфазная архитектура: написанный мной Intelligent Model Dispatcher планирует задачу, валидирует модели и передаёт выполнение в KasAgent Executor.
Интеграция с внешним OmniRoute‑прокси и MCP‑сервером: KasAgent сам решает, какие модели запрашивать через этот слой, но не является автором OmniRoute.
Multi‑project workspace: агент видит несколько проектов, читает файлы, ищет по коду и сохраняет артефакты работы в ~/.kasagent/artifacts.
Жёсткая система прав: отдельные режимы для чтения и для записи, валидация путей и ограничение всех операций рабочей директорией.
Vision‑инструменты: describe_image, чтение текста со скриншотов и формирование человекочитаемых отчётов о результате тестов интерфейса.
UI на Electron + React с отдельным Planning UI‑окном, где агент сначала показывает план действий и только потом запускает выполнение.
Поддержка быстрой проверки гипотез через Fast‑режим без тяжёлого планирования, когда важно время отклика.
#electronjs #Node.js #javascript #React #desktop-приложений #Linux\Windows #ai-integration
Для работы с LLM я интегрировал KasAgent с существующим OmniRoute‑прокси и MCP‑сервером (это отдельный open‑source/внешний компонент, не моя разработка). Агент использует этот слой, чтобы динамически обращаться к разным моделям и провайдерам, но логика выбора моделей и оркестрации задач реализована уже на моей стороне — в Intelligent Model Dispatcher.
Агент работает в нескольких режимах: Assistant (read‑only, без права записи), Executor (полный доступ в рамках разрешений) и подрежим Planning UI, который показывает пользователю план шагов перед выполнением. В отдельном режиме Fast можно быстро прогнать идею или проверку без тяжёлого планирования, когда не нужна сложная оркестрация.
Для работы с проектами есть multi‑project workspace: агент знает корневую директорию PROJECTSDIR, видит несколько репозиториев, может делать listdir, искать файлы, читать исходники и сохранять артефакты своей работы в ~/.kasagent/artifacts (текст, HTML, JSON и т.п.). Все операции через файловые инструменты проходят валидацию путей и ограничены рабочей директорией, чтобы агент не мог “выйти гулять” по всей системе.
Отдельно реализована система артефактов: агент может сохранять промежуточные отчёты, сжатые резюме, фрагменты кода и визуальные результаты в виде файлов, чтобы к ним возвращаться позже. Для сложных задач есть поддержка компрессии контекста и “thought signature” — отдельной краткой сводки мыслей модели, которую можно подмешивать в следующие запросы вместо полного лога.
Через браузерную часть (Chromium в Electron) KasAgent умеет оркестрировать проверки интерфейса: делать скриншоты, прогонять их через vision‑модели, подтверждать текст с экрана и на основе этого формировать отчёт о результате теста — именно этот сценарий сейчас показан на скриншоте.
5–7 bullets “что умеет KasAgent”
Двухфазная архитектура: написанный мной Intelligent Model Dispatcher планирует задачу, валидирует модели и передаёт выполнение в KasAgent Executor.
Интеграция с внешним OmniRoute‑прокси и MCP‑сервером: KasAgent сам решает, какие модели запрашивать через этот слой, но не является автором OmniRoute.
Multi‑project workspace: агент видит несколько проектов, читает файлы, ищет по коду и сохраняет артефакты работы в ~/.kasagent/artifacts.
Жёсткая система прав: отдельные режимы для чтения и для записи, валидация путей и ограничение всех операций рабочей директорией.
Vision‑инструменты: describe_image, чтение текста со скриншотов и формирование человекочитаемых отчётов о результате тестов интерфейса.
UI на Electron + React с отдельным Planning UI‑окном, где агент сначала показывает план действий и только потом запускает выполнение.
Поддержка быстрой проверки гипотез через Fast‑режим без тяжёлого планирования, когда важно время отклика.
#electronjs #Node.js #javascript #React #desktop-приложений #Linux\Windows #ai-integration