Langchain+TypeScript+Openai
5000 UAHТехнічне завдання
1. Введення:
Проект полягає у створенні нового коду на основі існуючого коду на TypeScript (scripts/ingest-web.ts) на базі langchain. Новий код повинен бути здатний створювати базу embeddings за розділами тексту, а також забезпечувати актуальність цієї бази при повторному запуску.
2. Огляд вимог:
Програмне забезпечення має мати наступні функції та можливості:
- Циклічний прохід по всіх розділах тексту, доступних за посиланням https://www.uscis.gov/policy-manual/table-of-contents.
- створення embeddings з тексту кожного розділу і запис їх у векторну базу даних.
- Перевірка кількості токенів у тексті. Якщо кількість токенів перевищує 15 000, то embeddings повинні бути розділені на частини, кожна з яких міститиме не більше 15 000 токенів.
- Створення хешу з тексту або використання іншого відповідного методу порівняння тексту при повторному запуску. Якщо текст змінився, підписи повинні бути перегенеровані.
3. Архітектура та компоненти:
Програмне забезпечення повинно мати таку структуру та основні компоненти:
- Основний компонент: файл ingest-web.ts, модифікований для реалізації нових вимог.
- Компонент бази даних: Векторна база даних, в яку будуть записуватися embeddings.
4. Інтерфейси:
Програмне забезпечення має взаємодіяти із зовнішніми системами та сторонніми програмами наступним чином:
- Взаємодія з веб-сторінкою на https://www.uscis.gov/policy-manual/table-of-contents для отримання тексту розділів.
- Інтеграція з базою даних для запису embeddings.
5. Безпека:
Програмне забезпечення має відповідати наступним вимогам безпеки та механізмам захисту даних:
- Захист даних, що зберігаються у векторній базі даних від несанкціонованого доступу.
- Захист від можливих уразливостей та атак, таких як ін'єкції або переповнення буфера.
6. Тестування:
Програмне забезпечення має бути протестоване з використанням наступного плану тестування:
- Автоматизоване тестування для перевірки створення embeddings та їх запису до бази даних.
- Тестування продуктивності для оцінки часу, необхідного для створення embeddings та запису їх у базу даних.
7. Ризики та управління проектом:
Виявлено такі можливі ризики та способи їх управління:
- Ризик: Зміна структури веб-сторінки за посиланням https://www.uscis.gov/policy-manual/table-of-contents.
Управління: Регулярне моніторинг змін структури сторінки та оновлення коду за потреби.
- Ризик: Порушення безпеки даних векторної бази даних.
Керування: Застосування механізмів захисту даних, таких як шифрування та авторизація доступу.
8. Ресурси та графік:
Для реалізації проекту знадобляться такі ресурси:
- Команда розробників, що включає програмістів, тестувальників
Будь ласка, уточніть, якщо у вас є питання або потрібна додаткова інформація.
-
Арсен Гуцал SOFTSKY
Яка саме база даних повинна використовуватись?
Команда програмістів і тестувальників за 5000 грн. Ви це серйозно?
-
Актуальні фриланс-проєкти в категорії Javascript та Typescript
Розробка повного стеку — Панель управління Amazon PPC (Етап 1)Потрібен full-stack розробник з досвідом роботи з Amazon API для реалізації Stage 1 внутрішнього PPC-дашборда. Проект реальний, дані живі, все готово до старту. Прототип фронтенда (5 сторінок, React + TypeScript): ЩО ВЖЕ ГОТОВО — Фронтенд-прототип на React 18 + TypeScript +… Javascript та Typescript, Веб-програмування ∙ 2 дні 3 години тому ∙ 28 ставок |
Розробка сайту-конструктора фотокниг і фоторамокМета проекту Необхідно розробити сучасний веб-сайт для замовлення фотокниг, фоторамок та іншої персоналізованої фотопродукції. Головне завдання проекту — надати клієнту можливість самостійно створити готовий макет виробу без участі дизайнера безпосередньо на сайті.Основний… Javascript та Typescript, Веб-програмування ∙ 3 дні 19 годин тому ∙ 96 ставок |
Команда для самописного маркетплейса ритуальних послуг.Шукаємо команду для запуску та розвитку самописного національного маркетплейсу ритуальних послуг. Одразу: не шукаємо одиночок, джунів і “збирачів сайтів”. Потрібна сильна продуктова команда рівня middle+/senior з реальними кейсами маркетплейсів/складних SaaS. Прошу не… Javascript та Typescript, Веб-програмування ∙ 4 дні 14 годин тому ∙ 27 ставок |
Доопрацювання існуючого проекту Next.js/Supabase: оффери, CRM, аналітика, AI-чатЄ діючий проект WatchGenius — платформа аналітики люксових годинників з каталогом моделей, ціновою аналітикою, зовнішніми офферами, формами заявок та AI-чатом. Проект вже частково розроблений. Потрібен не сайт з нуля, а досвідчений full-stack розробник, який зможе розібратися в… Javascript та Typescript, Веб-програмування ∙ 6 днів 15 годин тому ∙ 55 ставок |
Шукаю Senior Full-Stack розробника (Payload CMS) — міграція 2 сайтів готельної мережіМережа курортних готелів переходить з Webflow на власний headless-стек. Два корпоративні сайти (~140 сторінок разом), multi-tenant архітектура — один код обслуговує кілька готелів на різних доменах. Проєкт уже стартував: інфраструктура розгорнута, tenants налаштовані, базові… CMS, Javascript та Typescript ∙ 10 днів 13 годин тому ∙ 19 ставок |