运维工程师

上海 全职 IT部 1人
岗位职责

1基础设施运维与保障:负责公司量化交易相关基础设施的部署、监控与维护,包括服务器(物理机、虚拟机)、网络设备、存储系统等,搭建稳定、高效的硬件环境。制定基础设施巡检计划,定期检查设备运行状态,及时处理硬件故障、性能瓶颈等问题,保障量化交易系统 7x24 小时不间断运行,避免因基础设施故障影响交易执行;

2交易系统运维与优化:参与量化交易系统的部署、配置与运维工作,熟悉系统架构及业务逻辑。监控交易系统运行指标(如响应时间、订单成功率、行情接收延迟),分析系统性能瓶颈,通过参数调优、资源扩容等方式提升系统处理能力,确保交易指令快速、准确执行,满足量化策略对低延迟、高可靠性的要求

3数据安全与备份管理:构建并维护公司数据安全防护体系,制定数据访问权限控制策略,防止敏感金融数据(如行情数据、交易数据、策略数据)泄露、篡改或丢失。设计并执行数据备份与恢复方案,涵盖数据库备份(全量、增量、日志备份)、文件备份等,定期开展备份恢复演练,验证备份有效性,保障数据在极端情况下(如系统崩溃、自然灾害)可快速恢复,符合行业合规要求

4自动化运维体系建设:推动运维工作自动化、标准化,使用 Ansible、Jenkins、Terraform 等工具搭建自动化运维平台,实现服务器部署、配置管理、应用发布、监控告警等流程的自动化。编写 Shell、Python 等脚本简化重复运维操作,减少人工干预,降低人为失误风险,提升运维效率,支撑量化业务快速迭代需求

5监控告警与应急响应:搭建全链路监控体系,覆盖网络层、系统层、应用层、业务层等多层级,使用 Prometheus、Grafana、ELK Stack 等工具实现指标采集、可视化展示与异常告警。制定应急响应预案,明确故障分级标准及处理流程,在系统出现异常(如交易延迟、服务宕机、网络中断)时,快速定位问题根源,启动应急预案,协调研发、业务团队解决问题,并记录故障处理过程,形成复盘报告,持续优化系统稳定性

6跨团队协作与技术支持:紧密配合策略团队,理解业务需求,提供运维技术支持。协助策略团队进行系统测试、版本上线,解决测试与上线过程中的运维问题;为策略团队提供日常系统使用指导,快速响应交易过程中的突发运维需求,保障团队工作顺畅开展。


任职条件

1985、211或海外知名院校本科及以上学历,理工科背景,计算机相关专业优先(计算机、软工、电子、自动化)

2有3年及以上IT运维相关工作经验,其中1年以上金融行业(尤其是量化私募、券商、基金公司)运维经验者优先

3精通 Linux 操作系统(如 CentOS、Ubuntu)的运维与管理,熟练运用 Shell、Python 等脚本语言编写自动化运维脚本,具备丰富的 Linux 系统故障排查与性能优化经验

4熟悉网络原理与网络设备配置,掌握 TCP/IP、VLAN、路由、防火墙等网络技术,能够排查网络故障(如延迟、丢包、端口不通),有金融行业低延迟网络运维经验者优先

5了解主流数据库(如 MySQL、PostgreSQL、ClickHouse等)的运维管理,熟悉数据库备份恢复、性能调优、高可用架构(如主从复制、集群),能处理数据库常见故障

6掌握自动化运维工具与技术,如 Ansible(配置管理)、Jenkins(持续集成 / 持续部署)、Prometheus+Grafana(监控)、ELK Stack(日志分析),有自动化运维平台搭建经验者优先

7具备服务器、存储设备等硬件运维能力,了解服务器虚拟化技术(如 VMware、KVM),熟悉容器技术(如 Docker、Kubernetes)者优先

8了解信息安全相关技术,如防火墙、入侵检测 / 防御系统(IDS/IPS)、数据加密、漏洞扫描,有信息安全合规(如等保)经验者优先

9对新技术充满热情,善于学习并解决实际问题

10做事积极主动,责任心强,结果导向,有较强的沟通能力和抗压能力。

投递邮箱:hr@doublesafeguard.com