Senior ML Engineer
Занятость | Полная занятость |
Полная занятость | |
Адрес | Казахстан, Астана |
Казахтелеком — крупнейший оператор телекоммуникаций Казахстана, лидер в сфере цифровых решений и инфокоммуникаций.
Работа в Казахтелеком — это не просто стабильность и надежность, а возможность внести вклад в развитие цифрового будущего страны и раскрыть свой профессиональный потенциал.
Мы ищем опытного Senior Data Engineer, который станет ключевым участником нашей команды и будет отвечать за разработку, поддержку и оптимизацию масштабируемых решений для обработки данных. В этой роли вы будете работать с большими объёмами данных, выстраивать современные DataOps-практики и обеспечивать надёжность всей инфраструктуры данных компании.
-
Разрабатывать и поддерживать масштабируемые ETL/ELT-конвейеры для интеграции структурированных и неструктурированных данных.
-
Проектировать и сопровождать хранилища данных (Data Warehouse, Data Lake) на базе SQL и NoSQL-технологий.
-
Оптимизировать производительность запросов и пайплайнов с использованием Apache Spark, Dask или аналогичных решений.
-
Настраивать оркестрацию процессов в Airflow / Prefect, обеспечивать отказоустойчивость и автоматическое восстановление (auto-recovery).
-
Обеспечивать качество данных и внедрять DataOps-практики: профилирование, валидацию (Great Expectations), мониторинг.
-
Развёртывать и сопровождать контейнеризованные data-сервисы (Docker, Kubernetes), автоматизировать инфраструктуру с помощью Terraform / Ansible.
-
Настраивать мониторинг метрик и логирования (Prometheus, Grafana, ELK) с построением дашбордов и системой оповещений.
-
Сотрудничать с Data Scientists и ML Engineers для предоставления высококачественных данных.
-
Наставлять middle/junior Data Engineers: проводить код-ревью, воркшопы и обмен знаниями.
-
Опыт работы от 3 лет в роли Data Engineer или аналогичной, с акцентом на продакшн-инженерию данных.
-
Уверенное владение Python и/или Scala, опыт работы с Pandas, PySpark или аналогами.
-
Глубокие знания SQL, опыт проектирования схем star/snowflake, работа с PostgreSQL, MySQL, ClickHouse или аналогичными СУБД.
-
Опыт разработки и оптимизации job-ов в Apache Spark, Dask или Hadoop.
-
Практический опыт настройки DAG-ов в Airflow / Prefect, с реализацией retry и SLA.
-
Опыт применения инструментов обеспечения качества данных (Great Expectations или аналоги).
-
Уверенные навыки работы с Docker, Kubernetes, а также инфраструктурой как код (Terraform, Ansible).
-
Опыт настройки мониторинга и логирования (Prometheus, Grafana, ELK).
-
Развитые soft skills: умение ясно доносить технические решения, критически анализировать процессы, наставлять коллег.
-
Опыт работы с облачными платформами (AWS, GCP или Azure: S3/GCS, EMR, BigQuery, Dataflow и др.).
-
Сертификаты Databricks, CDP или Google Cloud Professional в области Big Data.
-
Опыт внедрения GitOps и policy-as-code для DataOps.
-
Знание инструментов потоковой обработки данных (Kafka, Kinesis, Pulsar).
-
Участие в open-source проектах или публикация технических статей.
Условия:
-
Работа в национальном лидере телекоммуникаций
-
Своевременная и конкурентная заработная плата;
-
Премии, бонусы, корпоративные льготы;
-
Официальное трудоустройство согласно Трудовому кодексу РК;
-
Дополнительное медицинское страхование, 30 календарных дней отпуска.
Опыт | От 3 до 6 лет |
График работы | Полный день |