Eval-Lab — Regresja promptów i modeli – praca z portfolio freelancera Dmytro | przykład z kategorii AI i uczenie maszynowe (№2051218)

Switch to English version?

Yes

Переключитись на українську версію?

Так

Переключиться на русскую версию?

Да

Przełączyć się na polską wersję?

Tak

Zaloguj się
Rejestracja
- Witamy na Freelancehunt
  
  Pracuj bez ryzyka, oszczędzaj czas i pieniądze
  
  Zaloguj się Rejestracja

Dashboard internetowy do regresyjnego testowania promptów i modeli. Uruchomienie zestawu testowego przez dwa modele/prompt — porównanie według 4 pod-ocen.

Co ciekawego technicznie:
— LLM-as-judge przez 5 dostawców (OpenRouter, Anthropic przez tool-use, Gemini, Groq, mock)
— 4 pod-oceny każdego przypadku: poprawność, trafność, kompletność, jakość promptu
— Ograniczenie końcowego wyniku przy złym promcie — nie pozwala silnemu modelowi zamaskować złego promptu
— Ograniczenie i ponowne próby na poziomie dostawcy z backoff + Retry-After
— Tryb mock do uruchamiania bez kluczy API (przyjazny CI, $0)
— Edycja sekretów w logach

Stos: FastAPI, async SQLAlchemy, Alembic, httpx, Pydantic, vanilla JS, Docker.

←
Praca 1 z 3
→

huggingface.co

Dodana 15 czerwca

5 wyświetleń

Opublikuj analogiczne zlecenie

Dmytro Staroselskyi

Lwów
Brak opinii

Gotowy do podjęcia pracy

W serwisie 6 lat

←
Praca 1 z 3
→