For job seekers
For companies
Set your preferences and let your AI copilot handle the job search while you sleep.
What You’ll Be Doing:
研究如何用技术快速识别问题、定位问题、以及恢复故障,达到1-5-10目标;
负责slo/sla制定和落地,以目标为导向保证业务稳定性;
持续建设稳定性保障工具平台,包括巡检系统、问题根因诊断系统、风险库等,让问题发现、定位、分析更准确和高效;
制定、推动稳定性规范落地,确保产品设计和编码符合稳定性原则;
持续关注业界前沿技术动态,组织团队学习提升,适时引入、推进新技术的升级迭代
What We Look For In You:
计算机或相关专业本科以上学历,7年以上研发、架构经验,有基础架构、框架类研发经验者更佳;
熟练掌握java、熟练应用springcloud微服务技术栈,具有良好的编码风格和算法能力;
熟练应用flink、elasticsearch、clickhouse、skywalking、prometheus/VictoriaMetrics、python等数据计算与分析工具;
具有RAG/Agent开发和调优经验更佳;
善于发现问题、分析问题、解决问题,有清晰的分析逻辑和全局架构思维;
具有产品化思维,熟悉研发流程,熟悉故障分析和故障处理流程,善于使用工具解决问题;
具备良好的沟通能力和领导能力,能够与跨部门团队协作,推动稳定性相关工作,能英语沟通者更佳;
有稳定性保障建设、巡检系统、问题根因诊断系统、混沌工程系统实践者更佳。
Perks & Benefits
Competitive total compensation
Comprehensive insurance coverage for employees and their dependants
More that we love to tell you along the process!
Help us maintain the quality of jobs posted on Empllo!
Is this position not a remote job?
Let us know!