- Страна
- Казахстан
- Зарплата
- 7 000 $ – 15 000 $
Откликайтесь
на вакансии с ИИ

Senior AI Architect / Архитектор ИИ-ассистентов и инфраструктуры
Исключительно высокая заработная плата для региона, интересные технологические задачи на острие AI-индустрии и расширенный соцпакет с релокацией делают эту вакансию одной из лучших на рынке.
Сложность вакансии
Роль требует редкого сочетания навыков системного архитектора, DevOps/MLOps инженера и глубокой экспертизы в области LLM и RAG. Высокий порог входа обусловлен необходимостью проектирования сложных мультиагентных систем и управления инфраструктурой на базе Kubernetes.
Анализ зарплаты
Предлагаемая зарплата ($7,000 - $15,000) значительно превышает средние рыночные показатели для Senior/Lead позиций в Казахстане и СНГ, приближаясь к уровням топовых компаний Кремниевой долины для удаленной работы. Это топовое предложение для специалистов уровня Senior AI Architect.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Recrutoman уже сейчас
Присоединяйтесь к команде Recrutoman в Алматы и создавайте будущее ИИ-ассистентов с зарплатой до $15,000!
Описание вакансии
Публикатор: Сашка
Обсуждение: @devops_jobs
#вакансия #казахстан #оффлайн #devops, #архитектор, #dsml
Должность: Senior AI Architect / Архитектор ИИ-ассистентов и инфраструктуры
Компания: Recrutoman
Город: Алматы (даем релокейт)
Занятость: оффлайн
Оплата: от 7 000$ до 15 000$
HR консалтинг в Казахстане
Описание вакансии:
Что предстоит делать:
- Проектировать архитектуру AI-ассистентов: интеграция LLM, API, оркестрация данных и инструментов.
- Разрабатывать инфраструктуру для обучения, fine-tuning и эксплуатации моделей (собственных и внешних LLM).
- Внедрять RAG, memory management, multi-agent orchestration и адаптивные подсистемы контекстного ответа.
- Создавать пайплайны для сбора, очистки и аннотирования данных (Label Studio, Prodigy, custom flows).
- Настраивать CI/CD для AI-моделей, контейнеризацию и мониторинг (Docker, Kubernetes, Prometheus, Grafana).
- Разрабатывать системы контроля качества и автотестирования диалогов (eval pipelines, reward models, feedback loops).
- Документировать архитектурные стандарты и best practices, обеспечивать observability.
- Тесно взаимодействовать с командами AI-инженеров, DataOps и продуктовых команд.
- 3+ лет опыта в AI/ML, включая 1+ года в архитектуре AI-инфраструктуры.
- Опыт проектирования LLM-based ассистентов и RAG-систем.
- Знание инструментов и фреймворков: n8n, LangChain, LlamaIndex, Haystack, Semantic Kernel, OpenDevin.
- Опыт с embeddings и vector search: FAISS, Pinecone, Weaviate, Qdrant, Elasticsearch.
- Уверенные навыки Python (FastAPI, Pydantic, asyncio), REST/gRPC, микросервисная и event-driven архитектура.
- Опыт работы с облачными AI-платформами: Azure OpenAI, AWS Bedrock, GCP Vertex AI, Hugging Face Hub.
- Желательно: DevOps/MLOps инструменты: MLflow, Airflow, DVC, Prefect, BentoML, Ray Serve.
- Официальное трудоустройство по ТК РК, график 5/2.
- Развитие и карьерный рост, обучение за счет компании.
- Бесплатный тренажерный зал, языковые курсы, электронная библиотека.
- Chill-зона, уютный дворик с workout-площадкой, скамейками и качелями.
- Отсутствие дресс-кода.
Контакты:
Telegram Откликнуться
Whatsapp +7 776 523 1773 / Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- LLM
- RAG
- Python
- FastAPI
- Docker
- Kubernetes
- LangChain
- LlamaIndex
- FAISS
- Qdrant
- MLflow
- Airflow
- Prometheus
- Grafana
- CI/CD
- Microservices
- Event-Driven Architecture
Возможные вопросы на собеседовании
Вопрос проверяет понимание архитектурных паттернов для работы с контекстом в LLM.
Как бы вы спроектировали систему RAG для работы с миллионами документов, обеспечив при этом минимальную задержку (latency) ответа?
Важно понять, как кандидат обеспечивает надежность и воспроизводимость ИИ-решений.
Опишите ваш подход к организации CI/CD пайплайна именно для ML-моделей: как вы автоматизируете тестирование качества ответов (eval pipelines)?
Проверка опыта работы с векторными хранилищами, указанными в вакансии.
В каких случаях вы выберете Qdrant вместо Elasticsearch для векторного поиска, и какие параметры индексации будут критичны?
Вакансия предполагает работу с мультиагентными системами.
С какими сложностями вы сталкивались при реализации multi-agent orchestration и как решали проблему зацикливания или конфликтов между агентами?
Проверка навыков MLOps и управления ресурсами.
Как вы организуете мониторинг и observability для LLM в продакшене, чтобы вовремя отследить деградацию качества или аномальный расход токенов?
Похожие вакансии
AI Engineer/Senior ML Engineer
Senior AI Engineer
Python разработчик (Senior)
Python-разработчик в команду LLM платформы
Преподаватель и Автор курса по AI agent (Senior LLM engineer)
Senior / Lead LLM Engineer
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Казахстан
- Зарплата
- 7 000 $ – 15 000 $