N8N Workflows Parser с семантическим поиском
Парсер открытых бесплатных шаблонов n8n с генерацией vector embeddings для семантического поиска. Система извлекает названия, описания, теги, авторов workflow и генерирует 384-мерные векторы через sentence-transformers. Поиск работает по семантике, не по keyword matching — находит релевантные результаты даже при разной формулировке запроса.
Desktop GUI на PyQt: настройки парсера (pages count, rate limiting, user-agent), генерация embeddings, таблица результатов с relevance score sorting. Error handling для network timeouts и CloudFlare challenges. Экспорт в JSON/CSV для database import.
Raw данные в downloads/, processed results в results/, embeddings в binary формате для быстрой загрузки. Custom similarity search на cosine distance с threshold 0.7.
Как результат - семантический поиск по базе n8n workflow вместо manual browsing + возможность использовать, копировать, работать с этими n8n шаблонами.
В перспективе обучить ИИ читать и изучать нужные шаблоны для автоматизации автоматизации))
Desktop GUI на PyQt: настройки парсера (pages count, rate limiting, user-agent), генерация embeddings, таблица результатов с relevance score sorting. Error handling для network timeouts и CloudFlare challenges. Экспорт в JSON/CSV для database import.
Raw данные в downloads/, processed results в results/, embeddings в binary формате для быстрой загрузки. Custom similarity search на cosine distance с threshold 0.7.
Как результат - семантический поиск по базе n8n workflow вместо manual browsing + возможность использовать, копировать, работать с этими n8n шаблонами.
В перспективе обучить ИИ читать и изучать нужные шаблоны для автоматизации автоматизации))