Job VC
ML Engineer / Data Scientist (Tabular ML, Prediction)
Technologies
Description
Шукаємо ML-спеціаліста для розробки предиктивних моделей на основі великих табличних датасетів. Задачі пов’язані з прогнозуванням користувацької поведінки та метрик на ранніх етапах життєвого циклу.
Вимоги:
3+ роки досвіду в ML / Data Science
Сильний досвід роботи з табличними даними (обов’язково)
Впевнений рівень SQL (бажано BigQuery) та досвід роботи з великими датасетами
Практичний досвід побудови моделей прогнозування (regression / prediction / ranking)
Досвід роботи з моделями: CatBoost, LightGBM, XGBoost
Сильні навички feature engineering (категоріальні, часові, поведінкові ознаки)
Розуміння часової природи даних (train/validation split, data drift)
Розуміння проблем data leakage та методів його уникнення
Досвід роботи з незбалансованими розподілами та складними таргетами (long-tail, zero-inflated)
Розуміння когортного аналізу та часових залежностей у даних
Досвід побудови reproducible ML pipeline (навчання, інференс, версіонування)
Відмінні комунікативні навички та ділове володіння англійською мовою
Буде плюсом:
Досвід роботи з Google Cloud (BigQuery, GCS тощо)
Досвід роботи з mobile або subscription продуктами
Досвід прогнозування користувацької поведінки, retention або revenue
Досвід роботи з маркетинговими або атрибуційними даними
Досвід розробки та деплою ML-моделей у production
Розуміння batch inference та підходів до масштабування моделей
Обов’язки:
Розробка та навчання ML-моделей на табличних даних (user-level та агреговані дані)
Побудова складного feature engineering
Робота з часовими даними (коректні split, врахування drift)
Контроль і запобігання data leakage
Робота зі складними таргетами та нерівномірними розподілами
Оцінка якості моделей на різних рівнях (окремі спостереження та агрегати)
Побудова та підтримка reproducible ML pipeline (навчання, інференс, версіонування)
Оптимізація моделей та підбір підходящих алгоритмів
Аналіз та структурування великих обсягів даних
Безперервне вдосконалення підходів до моделювання та роботи з даними
Ми пропонуємо:
ЗП $2500 - 4000;
Своєчасна заробітна плата;
Можливість кар'єрного росту;
Оплачувана відпустка;
Молодий дружній колектив;
Круті корпоративні заходи;
Затишний офіс;
Ігрова приставка та настільний теніс в офісі;
Стандартні плюшки — чай, кава, смаколики;
Зручний графік з 10:00 до 19:00.
Вимоги:
3+ роки досвіду в ML / Data Science
Сильний досвід роботи з табличними даними (обов’язково)
Впевнений рівень SQL (бажано BigQuery) та досвід роботи з великими датасетами
Практичний досвід побудови моделей прогнозування (regression / prediction / ranking)
Досвід роботи з моделями: CatBoost, LightGBM, XGBoost
Сильні навички feature engineering (категоріальні, часові, поведінкові ознаки)
Розуміння часової природи даних (train/validation split, data drift)
Розуміння проблем data leakage та методів його уникнення
Досвід роботи з незбалансованими розподілами та складними таргетами (long-tail, zero-inflated)
Розуміння когортного аналізу та часових залежностей у даних
Досвід побудови reproducible ML pipeline (навчання, інференс, версіонування)
Відмінні комунікативні навички та ділове володіння англійською мовою
Буде плюсом:
Досвід роботи з Google Cloud (BigQuery, GCS тощо)
Досвід роботи з mobile або subscription продуктами
Досвід прогнозування користувацької поведінки, retention або revenue
Досвід роботи з маркетинговими або атрибуційними даними
Досвід розробки та деплою ML-моделей у production
Розуміння batch inference та підходів до масштабування моделей
Обов’язки:
Розробка та навчання ML-моделей на табличних даних (user-level та агреговані дані)
Побудова складного feature engineering
Робота з часовими даними (коректні split, врахування drift)
Контроль і запобігання data leakage
Робота зі складними таргетами та нерівномірними розподілами
Оцінка якості моделей на різних рівнях (окремі спостереження та агрегати)
Побудова та підтримка reproducible ML pipeline (навчання, інференс, версіонування)
Оптимізація моделей та підбір підходящих алгоритмів
Аналіз та структурування великих обсягів даних
Безперервне вдосконалення підходів до моделювання та роботи з даними
Ми пропонуємо:
ЗП $2500 - 4000;
Своєчасна заробітна плата;
Можливість кар'єрного росту;
Оплачувана відпустка;
Молодий дружній колектив;
Круті корпоративні заходи;
Затишний офіс;
Ігрова приставка та настільний теніс в офісі;
Стандартні плюшки — чай, кава, смаколики;
Зручний графік з 10:00 до 19:00.