Спеціаліст з оптимізації GPU
Завдання:
Розробляти та впроваджувати методи прискорення обчислень.
Налаштовувати контейнери під різні прискорювачі (GPU, TPU тощо).
Створювати стратегії балансу продуктивності та якості.
Готувати спеціалізовані контейнерні образи під конкретні архітектури.
Проєктувати масштабовані системи для різних обчислювальних протоколів.
Адаптувати код під нові версії фреймворків.
Інтегрувати спеціалізоване обладнання.
Вимоги:
Досвід оптимізації великих мовних моделей.
Глибоке знання трансформерів і механізмів уваги.
Володіння інструментами для прискорювачів та їх оптимізації (CUDA, ROCm тощо).
Досвід роботи з фреймворками оптимізації (TensorRT, OpenVINO, Triton).
Розуміння контейнеризації (Docker) та управління навантаженнями (Kubernetes, Slurm).
Буде плюсом:
Досвід із розподіленими мережами.
Участь у ML-змаганнях.
Знання архітектур сучасних прискорювачів.
Робота зі спеціальними пристроями (FPGA, ASIC).
Умови:
Можливість переходу в штат із часткою в доходах.
Бонуси, прив’язані до реальних покращень продуктивності, які ви впровадите.
Повна віддаленість, гнучкий графік.
-
14 днів673 688 UAH
1213 8 0 14 днів673 688 UAHМи в SDEV маємо глибокий досвід в оптимізації обчислень на GPU та налаштуванні інфраструктури під високонавантажені задачі. Реалізуємо це через профілювання CUDA-ядер та тонку налаштування Docker-контейнерів для ефективного використання апаратних прискорювачів. Готові забезпечити баланс продуктивності та якості для Ваших моделей.
-
1 день2246 UAH
1738 9 0 1 день2246 UAHВітаю. Для реалізації проєкту я зосереджусь на розробці низькорівневих оптимізацій та адаптації архітектурних рішень під різні типи прискорювачів, таких як GPU та TPU, використовуючи CUDA/ROCm та фреймворки типу TensorRT чи OpenVINO. Буде створено масштабовану контейнерну інфраструктуру на базі Docker та Kubernetes для ефективного розгортання та управління обчисленнями, забезпечуючи оптимальний баланс продуктивності та якості для великих мовних моделей. Я вже успішно реалізовував подібні проєкти з оптимізації трансформерів і маю готові скрипти та шаблони для прискорення налаштування та бенчмаркінгу. Всі деталі реалізації, кінцевий бюджет та терміни пропоную обговорити в особистих повідомленнях.