Job VC
ML/AI Engineer
Technologies
Description
Національний банк України — сучасна незалежна державна інституція, покликана забезпечувати цінову та фінансову стабільність у державі та сприяти економічному зростанню України.
Ми інтегруємося до міжнародної спільноти центральних банків, створюємо для цього ефективну і стійку фінансову екосистему, сприяємо розвитку інноваційних фінансових технологій, підвищенню фінансової обізнаності та інклюзії громадян.
Ми — сучасний центральний банк, що має довіру суспільства, діє для добробуту громадян і держави.
Функціональні завдання:
Аналіз та вибір open-source
LLM-моделей
під specific use cases банку: document processing, Q&A, аналіз транзакцій;
Model optimization: quantization (GPTQ, AWQ, GGUF), pruning, distillation для зменшення розміру моделі та зростання швидкості на обмеженій GPU-інфраструктурі;
Fine-tuning моделей на власних даних банку: LoRA, QLoRA, PEFT з урахуванням data privacy та регуляторних обмежень;
Налаштування inference-серверів: vLLM, Triton Inference Server, llama.cpp — оптимізація throughput та latency;
Розробка та підтримка evaluation pipelines: метрики якості моделі (BLEU, ROUGE, custom business metrics);
Розробка промптів та RAG-архітектура (Retrieval-Augmented Generation) для інтеграції зі внутрішніми knowledge bases банку:
Документування моделей: model cards, performance benchmarks, versioning;
Координація з DevOps для забезпечення production-готовності моделей і інфраструктури.
Ми пропонуємо:
Можливість для професійного розвитку в стабільній та прозорій організації;
Можливість бути дотичним до розвитку країни;
Ринковий рівень оплати праці, премії на основі оцінювання результатів роботи (KPI);
Програми навчання;
Недержавне корпоративне пенсійне страхування;
Комфортні умови праці та гнучкий графік роботи;
Колектив однодумців.
Наші очікування від кандидата:
Вища освіта;
Досвід роботи від 4 років;
Рівень англійської мови не нижче А2;
3+ років досвіту в Machine Learning / Deep Learning з акцентом на NLP;
Глибокий досвід з Python, PyTorch або TensorFlow;
Знання
LLM-архітектур:
Transformer, attention mechanisms, tokenization;
Досвід з fine-tuning і адаптацією моделей: LoRA, QLoRA, PEFT;
Розуміння model quantization та optimization технік (GPTQ, AWQ, INT8);
Досвід з open-source моделями: Llama, Mistral, GPT-2/Neo або аналогічними;
Знання контейнеризації: Docker/Kubernetes;
Розуміння RAG-архітектури та vector databases (pgvector, Milvus, Qdrant).
Бажані навички:
Досвід з NVIDIA TensorRT та оптимізацією моделей під GPU;
Знання Hugging Face ecosystem (transformers, datasets, PEFT);
Досвід з MLOps: MLflow, Weights & Biases, або аналогічними;
Розуміння банківських процесів та регуляторних вимог до AI (EU AI Act, guideline НБУ);
Досвід з data pipelines та ETL для підготовки training data.
Ми інтегруємося до міжнародної спільноти центральних банків, створюємо для цього ефективну і стійку фінансову екосистему, сприяємо розвитку інноваційних фінансових технологій, підвищенню фінансової обізнаності та інклюзії громадян.
Ми — сучасний центральний банк, що має довіру суспільства, діє для добробуту громадян і держави.
Функціональні завдання:
Аналіз та вибір open-source
LLM-моделей
під specific use cases банку: document processing, Q&A, аналіз транзакцій;
Model optimization: quantization (GPTQ, AWQ, GGUF), pruning, distillation для зменшення розміру моделі та зростання швидкості на обмеженій GPU-інфраструктурі;
Fine-tuning моделей на власних даних банку: LoRA, QLoRA, PEFT з урахуванням data privacy та регуляторних обмежень;
Налаштування inference-серверів: vLLM, Triton Inference Server, llama.cpp — оптимізація throughput та latency;
Розробка та підтримка evaluation pipelines: метрики якості моделі (BLEU, ROUGE, custom business metrics);
Розробка промптів та RAG-архітектура (Retrieval-Augmented Generation) для інтеграції зі внутрішніми knowledge bases банку:
Документування моделей: model cards, performance benchmarks, versioning;
Координація з DevOps для забезпечення production-готовності моделей і інфраструктури.
Ми пропонуємо:
Можливість для професійного розвитку в стабільній та прозорій організації;
Можливість бути дотичним до розвитку країни;
Ринковий рівень оплати праці, премії на основі оцінювання результатів роботи (KPI);
Програми навчання;
Недержавне корпоративне пенсійне страхування;
Комфортні умови праці та гнучкий графік роботи;
Колектив однодумців.
Наші очікування від кандидата:
Вища освіта;
Досвід роботи від 4 років;
Рівень англійської мови не нижче А2;
3+ років досвіту в Machine Learning / Deep Learning з акцентом на NLP;
Глибокий досвід з Python, PyTorch або TensorFlow;
Знання
LLM-архітектур:
Transformer, attention mechanisms, tokenization;
Досвід з fine-tuning і адаптацією моделей: LoRA, QLoRA, PEFT;
Розуміння model quantization та optimization технік (GPTQ, AWQ, INT8);
Досвід з open-source моделями: Llama, Mistral, GPT-2/Neo або аналогічними;
Знання контейнеризації: Docker/Kubernetes;
Розуміння RAG-архітектури та vector databases (pgvector, Milvus, Qdrant).
Бажані навички:
Досвід з NVIDIA TensorRT та оптимізацією моделей під GPU;
Знання Hugging Face ecosystem (transformers, datasets, PEFT);
Досвід з MLOps: MLflow, Weights & Biases, або аналогічними;
Розуміння банківських процесів та регуляторних вимог до AI (EU AI Act, guideline НБУ);
Досвід з data pipelines та ETL для підготовки training data.