Job VC

Middle ML Engineer (Computer Vision / NLP / LLM) - RaccoonDoc

INNORA · djinni · Middle · $$ · Тільки віддалено Україна
Open original ↗
Про продукт
RaccoonDoc
- це український AI-продукт для автоматизації обробки та розпізнавання документів.

Ми працюємо не з ідеальними PDF і не з навчальними датасетами, а з реальними документами бізнесу - актами, накладними, рахунками, договорами, сканами, фото, таблицями, нестандартними шаблонами, поганою якістю зображень і всім тим “документним хаосом”, який щодня проходить через бухгалтерію, фінанси, логістику та операційні підрозділи компаній.

Наші клієнти - компанії, де документи вимірюються не десятками, а тисячами й десятками тисяч на місяць.

Ми шукаємо
Middle ML Engineer
у продуктову команду RaccoonDoc - інженера, який уже має практичний досвід з ML/NLP/CV/LLM-задачами, вміє самостійно рухати задачі від ідеї до робочого рішення і не потребує постійного менторства.

Нам потрібна людина, яка не просто тренувала модель, а розуміє, що відбувається після цього - якість, швидкість, продакшн, інтеграція, стабільність, моніторинг, компроміси між точністю, вартістю та latency.

Що ти будеш робити
Працювати над ML/AI-ядром RaccoonDoc для розпізнавання, класифікації, розділення, аналізу та валідації документів.

Основні задачі:
розробляти та покращувати ML-моделі для обробки документів;
працювати з задачами Computer Vision, OCR, NLP, NER, LLM/VLM;
будувати пайплайни обробки документів - від вхідного файлу до структурованих даних;
покращувати якість витягування полів із документів;
працювати з класифікацією документів, визначенням типів документів, розділенням багатосторінкових файлів;
аналізувати помилки моделей і пропонувати конкретні способи покращення;
експериментувати з open-source моделями, OCR, LLM/VLM та оцінювати їхню придатність для продакшн-використання;
оптимізувати моделі та пайплайни за швидкістю, вартістю та якістю;
розгортати ML-рішення в хмарній інфраструктурі;
інтегрувати ML-компоненти з backend-частиною продукту.

Важливо, ми очікуємо, що ти зможеш взяти задачу, самостійно розібратись у контексті, запропонувати підхід, зробити експеримент, оцінити результат і довести рішення до робочого стану.

Технології, з якими ми працюємо
ML / AI
Python;
PyTorch / TensorFlow;
HuggingFace Transformers;
OCR / Document AI;
Object Detection, зокрема YOLO-подібні підходи;
NLP / NER;
LLM / VLM;
spaCy;
scikit-learn;
open-source моделі для роботи з текстом, зображеннями та документами.

Backend / API
FastAPI;
Flask;
REST API;
Docker;
інтеграція ML-сервісів із backend-системами.

Хмара та інфраструктура
Ми працюємо з Azure, тому досвід із цією екосистемою буде дуже корисним:
Azure ML;
Azure Functions;
Azure Web Apps;
Azure DevOps;
Azure Service Bus;
Azure Blob Storage;
Application Insights;
container-based deployment.

Також буде плюсом досвід з AWS.

Не потрібно знати все з цього списку. Але важливо мати реальний досвід із продакшн-підходом до ML, а не тільки навчальні експерименти.

Що ми очікуємо від Middle-рівня
Для цієї ролі нам важливо, щоб ти міг:
самостійно розібратись у новій задачі;
сформулювати гіпотези та запропонувати кілька варіантів рішення;
оцінити trade-off між якістю, швидкістю, складністю та вартістю;
не чекати детального технічного завдання на кожен крок;
вести задачу від аналізу проблеми до робочого результату;
чесно показувати, що працює, а що ні;
пропонувати покращення продукту на основі технічних спостережень;
працювати в команді з розробниками, аналітиками та менеджером по продукту.

Що ми пропонуємо
Продукт, а не одноразовий проєкт.
Ти працюватимеш над ядром RaccoonDoc, яке постійно розвивається і використовується реальними клієнтами.

Реальні дані та реальні задачі.
Тут не буде стерильних датасетів. Будуть документи, які щодня створюють проблеми бізнесу, і саме їх треба навчити систему обробляти краще, швидше й стабільніше.

Вплив на продукт.
ML у RaccoonDoc - це не декоративний модуль збоку. Це основа продукту. Твої рішення напряму впливатимуть на якість, швидкість і конкурентність платформи.

Сильний практичний контекст.
Ми працюємо з клієнтами, які мають реальні обсяги документів, реальні інтеграції, реальні вимоги до якості й відповідальності.

Гнучкий формат роботи.
Віддалено з будь-якого міста України. Ми розуміємо реалії війни, тривог, блекаутів і нестабільної інфраструктури.


Процес найму
Короткий кол (до 30 хв)
- знайомство, контекст продукту, твої очікування.
Технічний етап (60–90 хв)
- обговорення твоїх продакшн-кейсів, архітектурних рішень, експериментів.
Співбесіда з фаундером (30–45 хв)
- про бачення продукту, роль ML у RaccoonDoc, розвиток.
Оффер.

Кому ця роль точно підійде
Тому, хто хоче працювати не над ще одним pet-проєктом з AI, а над продуктом, де ML щодня вирішує конкретні бізнесові задачі.

Тому, кому цікаво будувати системи для реальних документів, реальних клієнтів і реального продакшену.

Тому, хто хоче не просто запускати моделі, а впливати на те, як AI-продукт для обробки документів буде виглядати через рік.

Якщо тобі цікаво працювати з документами, OCR, LLM/VLM, Computer Vision, NLP і продакшн-ML у реальному українському AI-продукті, будемо раді познайомитись.