Job VC

Machine Learning Engineer (Reinforcement Learning)

Miltech Company · djinni · $$$$ · Тільки офіс Україна (Київ)
Open original ↗
Ми — українська
MilTech-компанія
, що створює майбутнє оборонних технологій. Ми розробляємо та виробляємо безпілотні системи й технологічні рішення, що вже довели свою ефективність у реальних бойових умовах.
Наш відділ R&D об’єднує кращих інженерів, конструкторів, фахівців з RF і Hardware та багатьох інших. Завдяки власним виробничим потужностям ми забезпечуємо швидкий цикл впровадження інновацій — від ідеї до масового виробництва. Кожне оновлення продукту базується на прямому фідбеку від військових, що дозволяє нам створювати максимально актуальні рішення.

Твій виклик: Last Mile Targeting

Ми не граємо в симуляції заради статей на ArXiv. Твоє завдання — створити
«мізки» дрона
, здатні довести апарат до цілі в умовах повного РЕБ, шквального вітру та критичного браку обчислювальних ресурсів.

Це робота на межі можливостей: запуск RL-агентів на
Raspberry Pi
та подолання
Sim2Real gap
так, щоб модель не «втрачала» ціль через туман чи вібрації. Ми даємо тобі повний карт-бланш на архітектуру з нуля.

Що ти будеш робити:
End-to-End Pipeline:
Побудова архітектури навчання від симулятора до деплою на реальне залізо.
RL Control:
Розробка моделей керування (PPO, SAC, TD3), що приймають рішення на основі відеопотоку та сенсорів у real-time.
Sensor Fusion:
Реалізація стабільного керування (Kalman Filters або RL-native підходи) у зв'язці з Sensor Engineers.
Sim2Real & Domain Randomization:
Створення симуляційного середовища (
Isaac Gym / AirSim / Custom UE
) з глибокою рандомізацією для роботи в екстремальну погоду (сніг, дощ, низька видимість).
Optimization:
Квантування та прунінг моделей для досягнення стабільного FPS на обмежених ресурсах (
Raspberry Pi, NVIDIA Jetson
).

Наш ідеальний кандидат:
Має досвід з RL-алгоритмами та розуміє, як змусити їх працювати в реальних системах.
Знає, як наблизити фізику симулятора до реальності, щоб мінімізувати Gap при переносі на борт.
Розуміє обмеження компактних комп’ютерів і вміє боротися за кожну мілісекунду інференсу.
Готовий бути архітектором:
самостійно обирати стек, симулятор та підхід.

Розглядаємо також:
якщо ти маєш міцний бекграунд у CV/ML та досвід з дронами, але хочеш «увірватися» саме в Reinforcement Learning.

Буде плюсом:
Досвід з TensorRT, PyTorch Mobile, SNPE, AIMET, Tensorflow Lite, gamedev (UE) або безпосередньо з БПЛА різних типів.

Чому варто приєднатися:
Прямий вплив:
Твій код буде «в полі» вже за лічені тижні, безпосередньо впливаючи на хід подій.
Свобода та ресурси:
Ти сам обираєш інструменти. Ми оплачуємо участь у топових конференціях (
CVPR, NeurIPS, ICRA
) та профільне навчання.
R&D Полігон:
Можливість миттєво тестувати гіпотези на реальних апаратах у найскладніших погодних умовах.
Команда:
Працюй пліч-о-пліч з експертами з GNC, RF, Hardware та топовими C++ розробниками.
Стабільність:
Офіційне працевлаштування, «біла» зарплата та
бронювання
.
Турбота:
Медичне страхування, 24 дні відпустки + додатковий вихідний на день народження.
Self-care:
Повна оплата лікарняних та 3 дні self-care на рік без жодних довідок.
Розвиток:
Корпоративна бібліотека, курси англійської, навчання Hard & Soft skills.

Готовий навчити дрони перемагати? Чекаємо на твоє CV!