Senior ML Engineer

Занятость Полная занятость
Полная занятость
Адрес Казахстан, Астана
Описание вакансии

Казахтелеком — крупнейший оператор телекоммуникаций Казахстана, лидер в сфере цифровых решений и инфокоммуникаций.

Работа в Казахтелеком — это не просто стабильность и надежность, а возможность внести вклад в развитие цифрового будущего страны и раскрыть свой профессиональный потенциал.

Мы ищем опытного Senior Data Engineer, который станет ключевым участником нашей команды и будет отвечать за разработку, поддержку и оптимизацию масштабируемых решений для обработки данных. В этой роли вы будете работать с большими объёмами данных, выстраивать современные DataOps-практики и обеспечивать надёжность всей инфраструктуры данных компании.

Обязанности:
  • Разрабатывать и поддерживать масштабируемые ETL/ELT-конвейеры для интеграции структурированных и неструктурированных данных.

  • Проектировать и сопровождать хранилища данных (Data Warehouse, Data Lake) на базе SQL и NoSQL-технологий.

  • Оптимизировать производительность запросов и пайплайнов с использованием Apache Spark, Dask или аналогичных решений.

  • Настраивать оркестрацию процессов в Airflow / Prefect, обеспечивать отказоустойчивость и автоматическое восстановление (auto-recovery).

  • Обеспечивать качество данных и внедрять DataOps-практики: профилирование, валидацию (Great Expectations), мониторинг.

  • Развёртывать и сопровождать контейнеризованные data-сервисы (Docker, Kubernetes), автоматизировать инфраструктуру с помощью Terraform / Ansible.

  • Настраивать мониторинг метрик и логирования (Prometheus, Grafana, ELK) с построением дашбордов и системой оповещений.

  • Сотрудничать с Data Scientists и ML Engineers для предоставления высококачественных данных.

  • Наставлять middle/junior Data Engineers: проводить код-ревью, воркшопы и обмен знаниями.

Требования:
  • Опыт работы от 3 лет в роли Data Engineer или аналогичной, с акцентом на продакшн-инженерию данных.

  • Уверенное владение Python и/или Scala, опыт работы с Pandas, PySpark или аналогами.

  • Глубокие знания SQL, опыт проектирования схем star/snowflake, работа с PostgreSQL, MySQL, ClickHouse или аналогичными СУБД.

  • Опыт разработки и оптимизации job-ов в Apache Spark, Dask или Hadoop.

  • Практический опыт настройки DAG-ов в Airflow / Prefect, с реализацией retry и SLA.

  • Опыт применения инструментов обеспечения качества данных (Great Expectations или аналоги).

  • Уверенные навыки работы с Docker, Kubernetes, а также инфраструктурой как код (Terraform, Ansible).

  • Опыт настройки мониторинга и логирования (Prometheus, Grafana, ELK).

  • Развитые soft skills: умение ясно доносить технические решения, критически анализировать процессы, наставлять коллег.

  • Опыт работы с облачными платформами (AWS, GCP или Azure: S3/GCS, EMR, BigQuery, Dataflow и др.).

Будет плюсом:
  • Сертификаты Databricks, CDP или Google Cloud Professional в области Big Data.

  • Опыт внедрения GitOps и policy-as-code для DataOps.

  • Знание инструментов потоковой обработки данных (Kafka, Kinesis, Pulsar).

  • Участие в open-source проектах или публикация технических статей.

Условия:

  • Работа в национальном лидере телекоммуникаций

  • Своевременная и конкурентная заработная плата;

  • Премии, бонусы, корпоративные льготы;

  • Официальное трудоустройство согласно Трудовому кодексу РК;

  • Дополнительное медицинское страхование, 30 календарных дней отпуска.

Требования
Опыт От 3 до 6 лет
Условия работы
График работы Полный день
Добавлено вчера
Для связи с работодателем или просмотра контактов нажмите на кнопку