yandex
G
gruve
Страна
США
Зарплата
80 $ – 85 $
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоКонтракт

Senior Software Engineer - AI/ML

ИИОценка ИИ

Привлекательная позиция для опытных инженеров благодаря работе с передовым стеком (LLM, RAG) и высокой почасовой ставке. Однако статус контракта (3-6 месяцев) и отсутствие спонсорства виз могут снизить интерес для некоторых кандидатов.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Высокая сложность обусловлена требованиями к глубоким знаниям в области LLM, RAG и MLOps, а также необходимостью работать в строго регулируемой среде здравоохранения (HIPAA). Роль предполагает техническое лидерство и владение полным жизненным циклом AI-решений.

Анализ зарплаты

Медиана175 000 $
Рынок150 000 $ – 210 000 $
ИИОценка ИИ

Предлагаемая ставка $80–85 в час (примерно $160k–170k в год при полной занятости) соответствует рыночному уровню для Senior AI инженеров в США, особенно для контрактных позиций в сфере Healthcare AI. Это конкурентоспособная оплата для опытного специалиста в Калифорнии.

Сопроводительное письмо

I am writing to express my strong interest in the Senior Software Engineer - AI/ML position at Gruve. With extensive experience in architecting and deploying production-grade RAG systems and fine-tuning transformer models, I am confident in my ability to deliver high-impact AI solutions for your healthcare clients. My background includes deep expertise in Python, PyTorch, and vector databases like Pinecone and Milvus, which aligns perfectly with your technical requirements.

Throughout my career, I have focused on building secure, scalable ML pipelines and have a proven track record of implementing advanced techniques like LoRA and Q-LoRA. I am particularly excited about the opportunity to work within the complex healthcare environment, ensuring HIPAA compliance while optimizing LLM performance. I am eager to bring my technical leadership and passion for AI innovation to the Gruve team and contribute to your mission of transforming enterprises into AI powerhouses.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в gruve уже сейчас

Присоединяйтесь к Gruve и создавайте передовые AI-решения для здравоохранения уже сегодня!

Описание вакансии

About Gruve

Gruve is an innovative software services startup dedicated to transforming enterprises to AI powerhouses. We specialize in cybersecurity, customer experience, cloud infrastructure, and advanced technologies such as Large Language Models (LLMs). Our mission is to assist our customers in their business strategies utilizing their data to make more intelligent decisions. As a well-funded early-stage startup, Gruve offers a dynamic environment with strong customer and partner networks.

About the Role

We are seeking a highly skilled Senior Software Engineer - AI/ML to architect and deliver enterprise-grade AI solutions within a complex healthcare environment. This role focuses on designing, building, and deploying Large Language Model (LLM) and Retrieval-Augmented Generation (RAG) systems that integrate securely and seamlessly into clinical and operational workflows.

The ideal candidate brings deep expertise in transformer-based models, production-scale ML systems, and cloud-native architectures, with experience operating in regulated environments such as healthcare. This is a hands-on technical leadership role requiring ownership of the full AI lifecycle—from design through deployment and optimization.

Key Responsibilities

  • Architect and deliver scalable AI/ML solutions with emphasis on LLMs, RAG architectures, and deep learning systems.
  • Own the full AI lifecycle including data ingestion, document indexing, embedding generation, retrieval design, preprocessing, fine-tuning, evaluation, and production deployment.
  • Design and optimize RAG pipelines leveraging vector databases (FAISS, Pinecone, Milvus, Weaviate) and frameworks such as LangChain and LlamaIndex.
  • Implement advanced fine-tuning methodologies including LoRA and Q-LoRA for domain-specific transformer optimization.
  • Develop hybrid RAG + reasoning workflows for complex enterprise use cases.
  • Curate and manage structured and unstructured healthcare datasets; implement chunking, embedding, and retrieval strategies to enhance contextual accuracy.
  • Establish robust evaluation frameworks measuring retrieval accuracy, faithfulness, latency, hallucination rates, and response relevance.
  • Optimize model performance through embedding tuning, reranking strategies, inference optimization, and efficient compute utilization.
  • Build and maintain MLOps / LLMOps pipelines covering CI/CD, deployment automation, monitoring, drift detection, and continuous improvement.
  • Deploy AI services across AWS and Azure in secure cloud-native and hybrid architectures.
  • Develop APIs and microservices to integrate AI capabilities into enterprise healthcare systems.
  • Ensure HIPAA-aligned data security, privacy, and regulatory compliance standards.
  • Collaborate with cross-functional stakeholders including clinical, product, engineering, and compliance teams.
  • Mentor engineers and establish best practices in AI architecture and production-grade ML systems.

Basic Qualifications

  • 5–8+ years of experience in AI/ML engineering or related roles.
  • Strong foundation in machine learning, deep learning, and transformer architectures.
  • Hands-on experience with Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) systems.
  • Proficiency in Python and ML frameworks such as PyTorch, TensorFlow, and scikit-learn.
  • Experience working with vector databases (e.g., FAISS, Pinecone, Milvus, Weaviate).
  • Experience designing and deploying production-grade AI systems.
  • Familiarity with cloud platforms (AWS, Azure) and containerized deployment models.
  • Experience operating in regulated environments with healthcare compliance standards (HIPAA or similar).
  • Strong problem-solving skills and cross-functional communication abilities.

Preferred Qualifications

  • Experience designing hybrid Vector + Graph RAG architectures.
  • Hands-on experience with knowledge graph design and graph databases (Neo4j, RDF/SPARQL, Cypher).
  • Expertise in advanced fine-tuning techniques such as LoRA and Q-LoRA.
  • Experience implementing LLM evaluation frameworks and hallucination detection systems.
  • Background in healthcare AI systems or clinical data integration.
  • Experience building scalable microservices architectures for AI platforms.
  • Prior experience mentoring engineers or leading AI architecture initiatives.

Salary Range & Employment Details

Hourly Rate: $80–85 per hour

*This position is being hired for a customer of Gruve.*

Candidates may engage in one of the following ways:

  • W-2 employee of Gruve, contracted to provide services to one of our clients
  • Corp-to-Corp contractor arrangement

This is an initial 3–6-monthcontract, with the opportunity for renewal or extension based on performance and client needs.

Gruve is unable to provide visa sponsorship for this role. Applicants must be authorized to work in the United States without the need for current or future sponsorship.

Why Gruve

At Gruve, we foster a culture of innovation, collaboration, and continuous learning. We are committed to building a diverse and inclusive workplace where everyone can thrive and contribute their best work. If you’re passionate about technology and eager to make an impact, we’d love to hear from you.

Gruve is an equal opportunity employer. We welcome applicants from all backgrounds and thank all who apply; however, only those selected for an interview will be contacted.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • AWS
  • Azure
  • Python
  • PyTorch
  • LLM
  • Kubernetes
  • MLOps
  • HIPAA
  • RAG
  • Scikit-learn
  • Docker
  • TensorFlow
  • LangChain
  • Pinecone
  • Weaviate
  • FAISS
  • Neo4j
  • Milvus
  • LlamaIndex

Возможные вопросы на собеседовании

Проверка практического опыта оптимизации RAG-систем, что является ключевой задачей роли.

Какие стратегии чанкинга и индексации вы бы использовали для обработки сложных медицинских документов в RAG-системе?

Оценка навыков работы с LLM в условиях ограниченных ресурсов или специфических доменов.

В каких случаях вы предпочтете использование LoRA/Q-LoRA вместо обычного Prompt Engineering для задач в здравоохранении?

Важно для работы в медицинском секторе, где точность критична.

Как вы выстраиваете процесс оценки галлюцинаций и релевантности ответов LLM в продакшене?

Проверка навыков проектирования архитектуры и MLOps.

Опишите ваш опыт развертывания AI-сервисов в облачной инфраструктуре AWS или Azure с соблюдением стандартов безопасности.

Оценка способности кандидата внедрять инновационные подходы, упомянутые в предпочтительных требованиях.

Каковы преимущества и сложности внедрения гибридной архитектуры Vector + Graph RAG по сравнению с чисто векторным поиском?

Похожие вакансии

HP
HaaS Platform
от 4 500 $

AI Engineer (Agents)

SeniorУдалённо
Python · C++ · LLM · LangChain · LlamaIndex · Whisper · STT · TTS · vLLM · Ollama · llama.cpp · RAG · Fine-tuning · Linux · SIP · RTP · Hugging Face
+17 навыков
NDA
Не указана

Middle+ / Senior AI / LLM Engineer

SeniorУдалённо
Python · ML · Generative AI · LLM · FastAPI · asyncio · LangChain · LangGraph · Milvus · Qdrant · FAISS · pgvector · MLflow · Langfuse · DeepEval · LangSmith · Java
+17 навыков
F
FixPrice
173 416 ₽ – 306 000 ₽

Python разработчик (Senior)

SeniorУдалённо
Python · asyncio · FastAPI · Pydantic · PostgreSQL · Redis · MongoDB · Docker · Docker Compose · Kubernetes · RabbitMQ · Kafka · Celery · HTMX · Bootstrap · Streamlit · LLM · OpenAI · Claude · DeepSeek · RAG · TorchServe · Triton Inference Server · ONNX · MLOps · MLflow · Weights & Biases
+27 навыков
SD
Standard Data
180 000 ₽ – 230 000 ₽

Преподаватель и Автор курса по AI agent (Senior LLM engineer)

SeniorУдалённо
LLM · NLP · LangGraph · LoRA · Python · AI Agents
+6 навыков
А
Арт-Финтех
до 300 000 ₽

AI Engineer/Senior ML Engineer

SeniorУдалённо
Python · FastAPI · Pydantic · SQLAlchemy · Alembic · PostgreSQL · Redis · gRPC · WebSocket · Docker · Kubernetes · CI/CD · LLM · Embeddings · Vector Search · OAuth2 · JWT · REST
+18 навыков
OA
OF AI Models
Не указана

Middle+ / Senior AI Developer — генерация визуального контента

SeniorУдалённо
Stable Diffusion · LoRA · DreamBooth · ComfyUI · Automatic1111 · Runway · CogVideoX · Python · CI/CD · DevOps · Fullstack Development
+11 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

G
gruve
Страна
США
Зарплата
80 $ – 85 $