Job VC

DevOps / SRE Engineer

More Local Clients · djinni · Not specified · Тільки віддалено Країни Європи та Україна

Description

Ми шукаємо Senior DevOps / SRE Engineer, який зможе взяти відповідальність за production-інфраструктуру, Kubernetes, CI/CD pipelines, Terraform, Cloudflare, storage, backups, observability та incident troubleshooting.
Основна ціль ролі: зробити інфраструктуру стабільнішою, краще автоматизованою та поступово зняти DevOps-навантаження з технічного керівника.
Основні задачі:

Підтримка та розвиток Kubernetes-кластерів.
Робота з Terraform, Helm, Kubespray.
Підтримка production, staging та development environments.
Налаштування Ingress, DNS, TLS, Cloudflare, Load Balancer.
Побудова та підтримка CI/CD pipelines.
Робота з Docker, containerd, image registries.
Підтримка backup/restore процесів для баз даних та stateful-сервісів.
Робота з Kubernetes storage: PVC, StorageClass, snapshots, Longhorn або аналоги.
Підтримка PostgreSQL, MongoDB, Redis на рівні DevOps-супроводу.
Робота з S3-compatible storage: MinIO або аналоги.
Налаштування centralized logging, metrics, alerts та dashboards.
Діагностика production incidents та пошук root cause.
Автоматизація ручних DevOps-операцій.
Документування важливих змін та runbooks.
Must-have

4+ років досвіду в DevOps / SRE / Infrastructure Engineering.
Впевнений production-досвід з Kubernetes.
Досвід з Terraform та Helm.
Досвід з Linux server administration.
Розуміння Docker / containerd.
Досвід побудови та підтримки CI/CD pipelines.
Розуміння Kubernetes networking: Ingress, Services, DNS, LoadBalancer, NodePort.
Досвід з NGINX Ingress або аналогами.
Досвід з Cloudflare або подібними CDN/DNS/WAF сервісами.
Досвід з backup/restore production-систем.
Вміння дебажити складні production-проблеми.
Вміння працювати самостійно та брати ownership за результат.
Nice-to-have:

Kubespray.
Bare metal Kubernetes.
Hetzner / OVH / DigitalOcean / GCP.
Cilium.
MetalLB.
Longhorn.
Strimzi Kafka Operator.
MinIO.
Harbor.
OpenSearch, Fluent Bit, Vector.
Authentik.
Ansible.
CloudNativePG.
Яку людину ми шукаємо
Нам потрібен інженер, який:

Не боїться складної production-інфраструктури.
Може самостійно розібратись у проблемі без постійного hand-holding.
Думає не тільки “як запустити”, а “як це буде працювати через рік”.
Розуміє, що backup без restore-перевірки не є backup.
Пише просту документацію після важливих змін.
Вміє працювати з legacy, але поступово переводить його у контрольований стан.
Має здорову параною щодо production, доступів, бекапів, сертифікатів і оновлень.
Приклади задач:

Оновити Kubernetes-кластер через Kubespray.
Розібратись з проблемою Ingress / Cloudflare / TLS.
Налаштувати backup/restore для PostgreSQL або MongoDB.
Винести ручні налаштування у Terraform або Ansible.
Налаштувати centralized logging для Kubernetes-сервісів.
Додати staging environment, максимально схоже на production.
Діагностувати проблему з PVC або StorageClass.
Підготувати план оновлення Kubernetes, containerd або Helm charts.
Побудувати runbook для аварійних ситуацій.

Побажання до робочого місця:
Ми пропонуємо нашим співробітникам повністю віддалений формат роботи, саме тому для нас важливо, щоб ви мали комфортне робоче місце, а саме:
окремий простір для роботи;
комп’ютер мінімально: Core i5/12 ГБ ОЗУ/SSD 256 ГБ;
наявність гарнітури, веб-камери та надійного інтернету.
Умови роботи:
повний робочий день (40 годин на тиждень);
оплачувані лікарняні;
18 робочих днів оплачуваної відпустки;
компенсація занять з вивчення англійскої мови;
оплачувані овертайми.