Job VC

Umbrella Monitoring Duty Engineer (L1/L2)

Bank Pivdenny · dou · Not specified · Київ, Одеса, віддалено

Technologies

DNS Elasticsearch Grafana HTTP Jira Linux Prometheus TCP/IP Telemetry Windows

Description

Банк «Південний»
— один із лідерів фінансового ринку України, який займає третє місце у групі українських банків із приватним капіталом за розміром активів. Вже 32 роки «Південний» є надійним фінансовим партнером для для приватних та корпоративних клієнтів.
Команда «Південного» — це понад 1700 активних і цілеспрямованих співробітників по всій Україні. Чотири роки поспіль банк входить до рейтингу «50 найкращих роботодавців» за версією журналу Forbes.
Зараз ми запрошуємо в команду
Umbrella Monitoring Duty Engineer (L1/L2).
Що ми пропонуємо:
конкурентну заробітну плату;
медичне страхування;
роботу у функціональному комфортному офісі з можливістю дистанційної роботи;
корпоративного психолога;
можливість кар’єрного росту та розвитку;
можливість проходження курсів та навчання;
можливість працювати в стабільній та професійній компанії з дружньою командою.
Що потрібно буде робити:
Моніторинг та первинна обробка інцидентів у системі парасолькового моніторингу (Umbrella Monitoring);
Оперативне реагування на алерти та події (L1/L2 triage);
Ескалація інцидентів відповідним командам та контроль їх вирішення;
Підтримка актуальності алертів (зменшення false positives, tuning правил);
Контроль SLI/SLO показників у режимі реального часу;
Виявлення аномалій та деградацій сервісів;
Робота з інцидентами у системах On-Call (наприклад, Grafana OnCall / PagerDuty / Jira);
Ведення журналу інцидентів та пост-аналіз (postmortem input);
Комунікація з технічними командами під час інцидентів;
Участь у побудові статус-пейджів та інформуванні бізнесу про інциденти;
Контроль цілісності даних моніторингу (метрики, логи, трейси);
Участь у вдосконаленні процесів реагування та моніторингу;
Підтримка 24/7 чергування (за графіком).
Що для цього знадобиться:
Досвід роботи з системами моніторингу (Zabbix, Grafana, Prometheus або аналоги).
Розуміння принципів observability (metrics, logs, traces).
Базові знання Linux / Windows.
Базові знання мереж (TCP/IP, DNS, HTTP).
Навички аналізу логів.
Розуміння процесів Incident Management.
Досвід роботи з системами алертингу.
Вміння швидко аналізувати та приймати рішення під час інцидентів.
Базові знання SLI/SLO/SLA.
Буде плюсом:
Досвід роботи в NOC / SOC / Service Desk.
Досвід роботи з Grafana OnCall / PagerDuty / Opsgenie.
Досвід роботи з ELK / OpenSearch.
Досвід роботи зі статус-пейджами.
Досвід участі в postmortem процесах.
Якщо вас зацікавила наша пропозиція, надсилайте свій відгук та дізнавайтесь про деталі.
Термін розгляду резюме становить 14 днів. У разі, якщо ви не отримали від нас відповіді, це означає, що зараз ми не можемо запропонувати вам вакансію, але зберегли резюме до нашої бази, ми зв’яжемось з Вами у разі появи відповідної пропозиції. Дякуємо за проявлений інтерес до нашої вакансії!