Python ML/LLM Engineer
Занятость | Полная занятость |
Полная занятость | |
Адрес | Казахстан, Караганда |
Чем предстоит заниматься
-
Разработка микросервисов на FastAPI для транскрибации, аналитики звонков и LLM-пайплайнов (классификация, извлечение сущностей, RAG).
-
Создание API с аутентификацией, версионированием и мониторингом.
-
Разработка асинхронных воркеров для работы с очередями (AWS SQS, aioboto3), ретраями, DLQ, backpressure.
-
Построение ETL и индексации эмбеддингов.
-
Работа с данными: PostgreSQL, SQLAlchemy async, Alembic, pgvector.
-
Интеграции с OpenAI SDK (chat, embeddings, audio).
-
Работа с хранилищами (S3/Minio).
Наш стек
Python 3.11+, FastAPI, Uvicorn · SQLAlchemy[async], PostgreSQL, asyncpg, Alembic, pgvector · AWS S3/SQS (aioboto3) · OpenAI SDK · aiohttp · python-json-logger · cryptography · pandas/openpyxl.
Требования
-
3+ лет коммерческого опыта разработки на Python, уверенное владение asyncio.
-
Опыт работы с FastAPI, SQLAlchemy 2.0 (async), PostgreSQL, миграциями.
-
Опыт построения воркеров/очередей (желательно SQS).
-
Продакшн-опыт работы с LLM (OpenAI, RAG).
Будет плюсом
-
Знание голосовых стеков (ASR, диаризация, эмо-аналитика).
-
Опыт с pgvector/RAG, тюнинг поиска.
-
Опыт контейнеризации и мониторинга (Docker, K8s, Prometheus, Grafana, ELK).
Мы предлагаем
-
Участие в создании AI-системы нового поколения (голосовая аналитика + LLM).
-
Работу в продуктовой команде, где ценят инициативу и инженерное качество.
-
Конкурентное вознаграждение (обсуждается индивидуально).
-
Возможности профессионального роста и влияния на архитектуру продукта.
Опыт | От 3 до 6 лет |
График работы | Удаленная работа |