- Страна
- США
Откликайтесь
на вакансии с ИИ

Staff Site Reliability Engineer, Database
Высокий балл обусловлен статусом компании (Series D, $320M+ инвестиций), удаленным форматом работы и возможностью работать с передовыми технологиями в финтехе. Предлагаются конкурентные бонусы и опционы, что делает вакансию очень привлекательной для опытных инженеров.
Сложность вакансии
Роль требует исключительной экспертизы в PostgreSQL на масштабах в несколько терабайт и глубокого понимания финтех-домена. Сочетание навыков разработки на Go и системного администрирования Linux делает эту позицию крайне сложной и ответственной.
Анализ зарплаты
Учитывая уровень Staff и требования к работе с терабайтными БД в США/Северной Америке, рыночная зарплата значительно выше средней по рынку РФ и Европы. Предложение Alpaca соответствует топовому сегменту для удаленных сотрудников в часовом поясе EST.
Сопроводительное письмо
I am writing to express my strong interest in the Staff Site Reliability Engineer (Database) position at Alpaca. With over 5 years of experience managing multi-terabyte PostgreSQL clusters and a deep background in Go and Prometheus, I have consistently delivered high-availability solutions for complex, low-latency financial systems. My expertise in schema migration for massive datasets and implementing robust SLOs aligns perfectly with Alpaca's mission to provide institutional-grade brokerage infrastructure.
Throughout my career, I have focused on bridging the gap between software engineering and database operations. I am particularly impressed by Alpaca's commitment to open-source and its rapid growth in the self-clearing broker-dealer space. I am confident that my technical skills in performance tuning and incident management, combined with my accountability-driven mindset, will contribute significantly to the scalability and reliability of your global trading platform.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в alpaca уже сейчас
Присоединяйтесь к Alpaca и станьте ключевым архитектором надежности для глобальной финтех-платформы нового поколения!
Описание вакансии
Who We Are:
Alpaca is a US-headquartered self-clearing broker-dealer and brokerage infrastructure for stocks, ETFs, options, crypto, fixed income, 24/5 trading, and more. Our recent Series D funding round brought our total investment to over $320 million, fueling our ambitious vision.
Amongst our subsidiaries, Alpaca is a licensed financial services company, serving hundreds of financial institutions across 40 countries with our institutional-grade APIs. This includes broker-dealers, investment advisors, wealth managers, hedge funds, and crypto exchanges, totalling over 9 million brokerage accounts.
Our global team is a diverse group of experienced engineers, traders, and brokerage professionals who are working to achieve our mission of opening financial services to everyone on the planet. We're deeply committed to open-source contributions and fostering a vibrant community, continuously enhancing our award-winning, developer-friendly API and the robust infrastructure behind it.
Alpaca is proudly backed by top-tier global investors, including Portage Ventures, Spark Capital, Tribe Capital, Social Leverage, Horizons Ventures, Unbound, SBI Group, Derayah Financial, Elefund, and Y Combinator.
Our Team Members:
We're a dynamic team of 230+ globally distributed members who thrive working from our favorite places around the world, with teammates spanning the USA, Canada, Japan, Hungary, Nigeria, Brazil, the UK, and beyond!
We're searching for passionate individuals eager to contribute to Alpaca's rapid growth. If you align with our core values—Stay Curious, Have Empathy, and Be Accountable—and are ready to make a significant impact, we encourage you to apply.
Your Role:
As a Site Reliability Engineer (SRE) at Alpaca, you will ensure the reliability, scalability, and performance of our systems and services. You will work closely with development, operations and devops teams to build and maintain robust applications, ensuring they run smoothly and efficiently. This role requires a blend of software engineering and operations skills, with a strong ability to troubleshoot technical issues and resolve problems before they impact our users.
Things You Get To Do:
- Triage difficult technical problems and implement solutions
- Improve our observability stack (monitoring, logging, profiling)
- Incident Management: Respond to and resolve incidents in a timely manner, conducting post-incident reviews to identify and implement improvements.
- Collaboration: Work closely with development teams to ensure new features and services are designed with reliability and scalability in mind.
- Capacity Planning: Monitor system capacity and performance, making recommendations and implementing changes to handle future growth.
Who you are (must-haves):
- 5+ years of experience in Site Reliability Engineering, Performance Engineering, or similar roles.
- 5+ years of experience with multi-terabyte scale PostgreSQL clusters.
- Proven track record of managing and maintaining large-scale, high-availability, and high-performance PostgreSQL database.
- Experience designing and implementing SLIs, SLOs, and SLAs for internal systems and databases.
- Experience with troubleshooting PostgreSQL performance problems and slow queries.
- Extensive experience with efficient schema design and efficient query design.
- Experience migrating multi-terabyte tables into more efficient schemas.
- Proficient with Go.
- Proficient with Prometheus.
- Proficient with Linux.
- Knowledgeable in trading/fintech domains.
- Experience with low-latency systems.
- Experience with distributed tracing.
- Experience scaling PostgreSQL clusters rapidly.
- Experience with pgx, gorm, or sqlc.
How We Take Care of You:
- Competitive Salary & Stock Options
- Health Benefits
- New Hire Home-Office Setup: One-time USD $500
- Monthly Stipend: USD $150 per month via a Brex Card
Alpaca is proud to be an equal opportunity workplace dedicated to pursuing and hiring a diverse workforce.
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- PostgreSQL
- Go
- Prometheus
- Linux
- Distributed Tracing
- Performance Engineering
- Site Reliability Engineering
- SQL
- Observability
- Incident Management
Возможные вопросы на собеседовании
Проверка опыта работы с высоконагруженными БД и понимания механизмов PostgreSQL.
Расскажите о вашем самом сложном опыте миграции таблицы размером в несколько терабайт: с какими блокировками вы столкнулись и как минимизировали простой?
Оценка навыков оптимизации производительности.
Как вы подходите к диагностике 'раздувания' (bloat) в PostgreSQL и какие стратегии используете для его устранения в высоконагруженной системе?
Проверка умения проектировать системы мониторинга.
Какие специфические метрики PostgreSQL вы бы включили в Prometheus для мониторинга SLI доступности и задержки (latency)?
Оценка навыков разработки на Go в контексте SRE.
Опишите ваш опыт использования библиотек pgx или sqlc: какие преимущества они дают по сравнению со стандартным database/sql при работе с высокопроизводительными сервисами?
Проверка понимания специфики финтеха.
Как вы обеспечиваете консистентность данных и минимизацию задержек при масштабировании базы данных для торговой платформы, работающей в режиме 24/5?
Похожие вакансии
Site Administrator
Principal DevSecOps Engineer
Azure Core Operations - Associate Manager
Cloud Engineer (AWS)
Site Reliability Engineer - Storage Engineer
Technical Operations Specialist (TOPS)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- США