Specjalista ds. optymalizacji GPU

AI i uczenie maszynowe, Python — podano nieprawidłowe kategorie?

Zlecenie jest tłumaczone automatycznie. Zaloguj się lub zarejestruj się, żeby zobaczyć oryginał

Zadanie:

Opracowywanie i wdrażanie metod przyspieszania obliczeń.
Konfigurowanie kontenerów pod różne akceleratory (GPU, TPU itp.).
Tworzenie strategii równowagi wydajności i jakości.
Przygotowywanie specjalistycznych obrazów kontenerów pod konkretne architektury.
Projektowanie skalowalnych systemów dla różnych protokołów obliczeniowych.
Adaptowanie kodu pod nowe wersje frameworków.
Integracja specjalistycznego sprzętu.

Wymagania:

Doświadczenie w optymalizacji dużych modeli językowych.
Dogłębna znajomość transformatorów i mechanizmów uwagi.
Znajomość narzędzi dla akceleratorów i ich optymalizacji (CUDA, ROCm itp.).
Doświadczenie w pracy z frameworkami optymalizacji (TensorRT, OpenVINO, Triton).
Rozumienie konteneryzacji (Docker) i zarządzania obciążeniem (Kubernetes, Slurm).

Warto mieć:

Doświadczenie z rozproszonymi sieciami.
Udział w zawodach ML.
Znajomość architektur nowoczesnych akceleratorów.
Praca ze specjalistycznymi urządzeniami (FPGA, ASIC).

Warunki:

Możliwość przejścia na etat z udziałem w dochodach.
Premie związane z rzeczywistymi poprawami wydajności, które wprowadzisz.
Pełna zdalność, elastyczny grafik.

Oferty 2

Ihor Symchuk

11 0

Budżet: 15000 USD Termin: 14 dni

W SDEV mamy głębokie doświadczenie w optymalizacji obliczeń na GPU oraz w konfiguracji infrastruktury pod wysokowydajne zadania. Realizujemy to poprzez profilowanie rdzeni CUDA oraz drobne dostosowanie kontenerów Docker w celu efektywnego wykorzystania akceleratorów sprzętowych. Jesteśmy gotowi zapewnić równowagę między wydajnością a jakością dla Twoich modeli.

Dmytro Romanchuk

10 0

Budżet: 50 USD Termin: 1 dzień

Witam. W realizacji projektu skoncentruję się na opracowywaniu niskopoziomowych optymalizacji oraz dostosowywaniu rozwiązań architektonicznych do różnych typów akceleratorów, takich jak GPU i TPU, wykorzystując CUDA/ROCm oraz frameworki typu TensorRT czy OpenVINO. Zostanie stworzona skalowalna infrastruktura kontenerowa oparta na Dockerze i Kubernetesie do efektywnego wdrażania i zarządzania obliczeniami, zapewniając optymalną równowagę między wydajnością a jakością dla dużych modeli językowych. Już wcześniej z powodzeniem realizowałem podobne projekty z optymalizacji transformatorów i mam gotowe skrypty oraz szablony do przyspieszenia konfiguracji i benchmarkingu. Wszystkie szczegóły realizacji, ostateczny budżet oraz terminy proponuję omówić w wiadomościach prywatnych.

Max K
Londyn, Wielka Brytania
FlashAid

Zleceń 15
Ocena -
Ranking 490