Job VC

Senior ML Engineer

АТ «Ощадбанк» · djinni · Senior · $$$$ · Тільки віддалено Україна

Description

МІЙ БАНК — МОЯ ОПОРА.
Опора мільйонів українців, хто відтепер каже
«МОЄ»
.
МОЇ ЛЮДИ. МОЯ СПРАВА. МОЯ СВОБОДА.

ОЩАДБАНК
запрошує до команди
Senior ML Engineer

Про роль

Шукаємо
Senior ML Engineer
у команду з 4 людей (Team Lead, Middle DS, Senior Data Engineer, Senior MLOps). Це
hands-on
IC роль: ви самостійно дизайните рішення, реалізуєте їх і захищаєте перед Team Lead та директором департаменту.
Команда випускає batch-прогнози для propensity-моделей (схильність клієнта до оформлення кредиту, картки, депозиту, преміум-картки тощо). Зараз — щомісячний цикл, ціль — перехід на щотижневий. У production працюють ансамблі з custom PyTorch моделей для табличних даних та tree-based моделей (XGBoost, LightGBM, Random Forest). Наступний етап — LLM-задачі: автоматизація credit memo та внутрішній QA-бот по документації.
Інфраструктура гібридна: дані готуються on-prem (Oracle DB → ClickHouse, feature store на Feast), обчислення — у хмарі. Оркестрація через Airflow, CI/CD — GitLab CI. Валідація моделей (model risk management) — окрема команда, але ви маєте готувати моделі та документацію до їх стандартів.

Ключові задачі:

Моделювання (≈50% часу)
Розробка та оптимізація propensity-моделей: архітектура PyTorch-моделей для табличних даних (embeddings, custom losses, ensembling strategies), тюнінг tree-based моделей, побудова та калібрування ансамблів
Гіперпараметричний пошук (Optuna), відтворювані експерименти (MLflow, DVC)
Підготовка моделей до LLM-задач: fine-tuning, RAG-пайплайни, prompt engineering для credit memo та internal QA
Feature engineering та дані (≈20% часу)
Проектування та оптимізація feature pipelines: Oracle DB → ClickHouse → Feast → модель
Робота з великими табличними датасетами: feature selection, temporal feature engineering, обробка категоріальних ознак високої кардинальності
Співпраця з Data Engineer над якістю та доступністю даних
Production readiness (≈20% часу)
Докеризація моделей, підготовка inference-пайплайнів для batch-прогнозів
Оптимізація throughput для переходу з місячного на тижневий цикл (profiling, оптимізація I/O, паралелізація)
Інтеграція з Airflow DAGs для scheduling тренувань та inference
Підготовка артефактів для model validation команди: метрики, backtesting, документація стабільності
Процеси та комунікація (≈10% часу)
Захист технічних рішень перед Team Lead та директором департаменту
Code review, технічна документація
Пояснення результатів моделей бізнес- та ризик-стейкхолдерам (feature importance, SHAP)

Обов’язкові навички:

ML / DL — практичний рівень
4+ роки досвіду в ML, з них 2+ роки з моделями в production
PyTorch: custom архітектури для табличних даних (embeddings для категоріальних фічей, numerical encodings, custom loss functions)
XGBoost / LightGBM / CatBoost: досвід тюнінгу та production-використання
Ensemble methods: stacking, blending, calibration стратегії
Feature engineering для high-dimensional табличних даних, робота з temporal features
Hyperparameter optimization (Optuna)
Explainability: SHAP, feature importance — для комунікації з бізнесом та model validation
LLM / NLP — базовий+ рівень
Практичний досвід з LLM: fine-tuning або RAG-пайплайни
Розуміння архітектур (Transformer, attention), prompt engineering
Досвід з фреймворками: LangChain / LlamaIndex / vLLM або аналоги
Дані та інфраструктура
SQL на рівні складних аналітичних запитів (Oracle, PostgreSQL або аналоги)
Досвід з колонковими СУБД (ClickHouse або аналоги)
Розуміння feature store концепції (Feast — плюс)
Docker: створення та оптимізація образів для ML-сервісів
Software Engineering
Python 3.10+ (strong): типізація, модульна архітектура, чистий код
Git, code review, тести (pytest)
Досвід роботи з Airflow або аналогічним оркестратором
Experiment tracking та model versioning (MLflow, DVC, W&B)

Буде плюсом:
Досвід у банківській сфері або фінансових сервісах (propensity, credit scoring, churn)
ONNX / TorchScript для оптимізації inference
Distributed training (PyTorch DDP)
Досвід з drift detection та automated retraining pipelines
Робота з PII: анонімізація, маскування даних

Ми гарантуємо:
умови для професійного та кар’єрного зростання кожного співробітника;
офіційне працевлаштування із дотриманням всіх соціальних гарантій згідно КЗпП (оплачувані лікарняні, відпустку від 29 календарних днів на рік);
безкоштовне медичне страхування для всіх працівників.
Надсилайте Ваше резюме —
станьте частиною команди ОЩАДУ!