Specjalista ds. optymalizacji GPU
Zadanie:
Opracowywanie i wdrażanie metod przyspieszania obliczeń.
Konfigurowanie kontenerów pod różne akceleratory (GPU, TPU itp.).
Tworzenie strategii równowagi wydajności i jakości.
Przygotowywanie specjalistycznych obrazów kontenerów pod konkretne architektury.
Projektowanie skalowalnych systemów dla różnych protokołów obliczeniowych.
Adaptowanie kodu pod nowe wersje frameworków.
Integracja specjalistycznego sprzętu.
Wymagania:
Doświadczenie w optymalizacji dużych modeli językowych.
Dogłębna znajomość transformatorów i mechanizmów uwagi.
Znajomość narzędzi dla akceleratorów i ich optymalizacji (CUDA, ROCm itp.).
Doświadczenie w pracy z frameworkami optymalizacji (TensorRT, OpenVINO, Triton).
Rozumienie konteneryzacji (Docker) i zarządzania obciążeniem (Kubernetes, Slurm).
Warto mieć:
Doświadczenie z rozproszonymi sieciami.
Udział w zawodach ML.
Znajomość architektur nowoczesnych akceleratorów.
Praca ze specjalistycznymi urządzeniami (FPGA, ASIC).
Warunki:
Możliwość przejścia na etat z udziałem w dochodach.
Premie związane z rzeczywistymi poprawami wydajności, które wprowadzisz.
Pełna zdalność, elastyczny grafik.
-
14 dni55 750 PLN
1213 8 0 14 dni55 750 PLNW SDEV mamy głębokie doświadczenie w optymalizacji obliczeń na GPU oraz w konfiguracji infrastruktury pod wysokowydajne zadania. Realizujemy to poprzez profilowanie rdzeni CUDA oraz drobne dostosowanie kontenerów Docker w celu efektywnego wykorzystania akceleratorów sprzętowych. Jesteśmy gotowi zapewnić równowagę między wydajnością a jakością dla Twoich modeli.
-
1 dzień186 PLN
1738 9 0 1 dzień186 PLNWitam. W realizacji projektu skoncentruję się na opracowywaniu niskopoziomowych optymalizacji oraz dostosowywaniu rozwiązań architektonicznych do różnych typów akceleratorów, takich jak GPU i TPU, wykorzystując CUDA/ROCm oraz frameworki typu TensorRT czy OpenVINO. Zostanie stworzona skalowalna infrastruktura kontenerowa oparta na Dockerze i Kubernetesie do efektywnego wdrażania i zarządzania obliczeniami, zapewniając optymalną równowagę między wydajnością a jakością dla dużych modeli językowych. Już wcześniej z powodzeniem realizowałem podobne projekty z optymalizacji transformatorów i mam gotowe skrypty oraz szablony do przyspieszenia konfiguracji i benchmarkingu. Wszystkie szczegóły realizacji, ostateczny budżet oraz terminy proponuję omówić w wiadomościach prywatnych.