Langchain + TypeScript + Otwarte
1 .Wprowadzenie :
Projekt polega na tworzeniu nowego kodu na bazie istniejącego kodu na TypeScript (scripts/ingest-web.ts) na bazie langchain.Nowy kod powinien być w stanie utworzyć bazę embeddings za sekcjami tekstu, a także zapewnić aktualność tej bazy podczas ponownego uruchomienia.2 .Przegląd wymaga:
Oprogramowanie musi posiadać następujące funkcje i możliwości:
- Przejście cykliczne we wszystkich sekcjach tekstu dostępne pod adresem https://www.uscis.gov/policy-manual/table-of-contents.
- utworzenie embeddings z tekstu każdego rozdziału i zapis ich w wektorowej bazie danych.Sprawdź liczbę tokenów w tekście.Jeśli liczba tokenów przekracza 15 000, wstawy powinny być podzielone na części, z których każda będzie zawierać nie więcej niż 15 000 tokenów.Tworzenie hashów z tekstu lub używanie innej odpowiedniej metody porównania tekstu podczas ponownego uruchomienia.Jeśli tekst się zmieni, podpisy muszą być odtworzone.3 .Architektura i komponenty:
Oprogramowanie musi mieć taką strukturę i podstawowe składniki:
- Podstawowy składnik: plik ingest-web.ts, zmodyfikowany do realizacji nowych wymagań.- Komponent bazy danych: wektorowa baza danych, w której zostaną zapisane embeddings.CzteryInterfejsów :
Oprogramowanie musi współpracować z systemami zewnętrznymi i programami zewnętrznymi w następujący sposób:
- Interakcja z stroną internetową na https://www.uscis.gov/policy-manual/table-of-contents w celu uzyskania tekstu sekcji.- Integracja z bazą danych do nagrywania embeddings.PięćBezpieczeństwo :
Oprogramowanie musi spełniać następujące wymagania bezpieczeństwa i mechanizmy ochrony danych:
- Ochrona danych przechowywanych w wektorowej bazie danych przed nieautoryzowanym dostępem.- Ochrona przed możliwymi uszkodzeniami i atakami, takimi jak zastrzyki lub nadmierne wypełnienie buforu.6.Testowanie :
Oprogramowanie musi być testowane przy użyciu następującego planu testowania:
- Automatyczne testowanie, aby sprawdzić utworzenie embeddings i ich zapis do bazy danych.- Testowanie wydajności w celu oceny czasu potrzebnego do tworzenia embeddings i zapisania ich w bazie danych.7 .Ryzyko i zarządzanie projektem:
Istnieją następujące możliwe ryzyko i sposoby ich zarządzania:
- Ryzyko: Zmiana struktury strony internetowej pod adresem https://www.uscis.gov/policy-manual/table-of-contents.
Zarządzanie: Regularne monitorowanie zmian w strukturze strony i aktualizacja kodu w razie potrzeby.- Ryzyko: naruszenie bezpieczeństwa danych wektorowej bazy danych.Zarządzanie: Używanie mechanizmów ochrony danych, takich jak szyfrowanie i autoryzacja dostępu.8 i 8.Zasoby i harmonogramy:
Do realizacji projektu wykorzystywane są następujące zasoby:
- Zespół deweloperów, w tym programistów, testujących
Prosimy o wyjaśnienie, jeśli masz jakieś pytania lub potrzebujesz dodatkowych informacji.
-
Arsen Gutsal SOFTSKY
Яка саме база даних повинна використовуватись?
Команда програмістів і тестувальників за 5000 грн. Ви це серйозно?
-
Aktualne zlecenia dla freelancerów w kategorii Javascript & Typescript
Full-stack rozwój — Amazon PPC Dashboard (Etap 1)Potrzebny programista full-stack z doświadczeniem w pracy z Amazon API do realizacji Etapu 1 wewnętrznego dashboardu PPC. Projekt realny, dane żywe, wszystko gotowe do startu. Prototyp frontendu (5 stron, React + TypeScript): CO JUŻ GOTOWE — Prototyp frontendu na React 18 +… Javascript & Typescript, Programowanie stron internetowych ∙ 1 dzień 3 godziny temu ∙ 25 ofert |
Opracowanie strony internetowej do tworzenia fotoksiążek i ram fotowychCel projektuNależy opracować nowoczesną stronę internetową do zamawiania fotoksiążek, ram fotowych i innych spersonalizowanych produktów fotograficznych.Głównym celem projektu jest umożliwienie klientowi samodzielnego stworzenia gotowego projektu produktu bez udziału projektanta… Javascript & Typescript, Programowanie stron internetowych ∙ 2 dni 19 godzin temu ∙ 94 oferty |
Zespół do samodzielnie stworzonej platformy rynkowej usług pogrzebowych.Poszukujemy zespołu do uruchomienia i rozwoju autorskiej krajowej platformy rynkowej usług pogrzebowych. Od razu: nie szukamy pojedynczych osób, juniorów ani "zbieraczy stron". Potrzebny jest silny zespół produktowy na poziomie middle+/senior z rzeczywistymi przypadkami… Javascript & Typescript, Programowanie stron internetowych ∙ 3 dni 14 godzin temu ∙ 26 ofert |
Dopracowanie istniejącego projektu Next.js/Supabase: oferty, CRM, analityka, czat AIIstnieje działający projekt WatchGenius — platforma analityczna luksusowych zegarków z katalogiem modeli, analizą cen, zewnętrznymi ofertami, formularzami zgłoszeniowymi i czatem AI. Projekt został już częściowo opracowany. Potrzebny jest doświadczony programista full-stack,… Javascript & Typescript, Programowanie stron internetowych ∙ 5 dni 15 godzin temu ∙ 55 ofert |
Szukam Senior Full-Stack dewelopera (Payload CMS) — migracja 2 stron internetowych sieci hoteliSieć kurortowych hoteli przechodzi z Webflow na własny headless-stack. Dwie strony korporacyjne (~140 stron razem), architektura multi-tenant — jeden kod obsługuje kilka hoteli na różnych domenach. Projekt już wystartował: infrastruktura jest wdrożona, najemcy są… Content Management Systems, Javascript & Typescript ∙ 9 dni 13 godzin temu ∙ 19 ofert |