高级资深专家 Sre工程师 此岗支持重庆成都职场

高级/资深/专家 SRE工程师 此岗支持重庆/成都职场

岗位职责: 1.负责公司产品的持续集成、持续交付、⾃动化部署、监控及⽇常运维⼯作。 2.熟悉k8s部署及维护,熟悉高可用、边缘节点方案,有3年以上k8s实战经验。 3.参与系统架构设计,推进自动化部署⼯具链的选择和实施。设计、编写、维护⾃动化脚本、helm脚本、docker-compose等,提⾼私有化部署、测试、监控等环节的⾃动化程度。 4.监控系统健康状况(prometheus/grafana),快速定位和解决线上问题,确保系统稳定运⾏。与开发团队紧密合作,确保软件的可部署性和可观察性。 5.定期进⾏系统性能优化、安全加固、备份与恢复策略的制定和实施。 6.参与容器化、云原⽣技术的研究和实施,包括不限于Docker(apptainer)、Kubernetes、volcano等。 7.GPU/NPU/DCU服务器软硬件管理,GPU调度、虚拟化等。 8.HPC调度平台管理(slurm调度器)。 9.负责⽇常的系统维护、更新、升级、故障排查等⼯作。 10.参与制定和优化运维流程和规范,提⾼团队的⼯作效率,定期组织技术分享和培训,提⾼团队的技术⽔平。 岗位要求: 1.计算机相关专业本科及以上学历,5年以上DevOps或运维相关⼯作经验。 2.熟悉Linux系统管理、⽹络配置、性能调优、编译linux软件经验,熟悉OpenPBS/slurm等作业编排软件。 3.熟练使⽤⾄少⼀种脚本语⾔,如Python、Shell、go等,熟悉go开发优先考虑。 4.熟悉常见的异构计算硬件架构,了解GPU运行机制。 5.熟悉grafana和promethues,会自定义监控面板及定制化监控指标。 6.熟悉IB与RDMA优先。 7.有3年以上Docker、Kubernetes(必备)等容器技术的实践经验、会编写开发helm。 8.熟悉IDC机房架构及云服务平台,如AWS、华为、腾讯、阿⾥云等,并有实际操作经验。 9.熟悉常⻅的存储、数据库、中间件、消息队列等技术,并有实际操作经验。 10.具备良好的问题分析和解决能⼒,能够独⽴处理紧急情况。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

急招岗位 技术要求 1、精通虚拟化原理、业内主流的虚拟化技术(如VMware、Hyper-V、Xen、KVM、OpenStack等),具备H3C CloudOS5.0/7.0、CAS解决方案运维经验者优先。 2、云计算领域至少5-10年以上运维工作经验,具备运维标准、云计算领域、项目管理等认证优先(比如ITIL、PMP、H3C、华为、阿里、腾讯等云认证)。 2、精通K8S的基本架构和核心组件,能进行疑难的故障定位并解决,保障云平台K8S集群的稳定运行。 3、熟悉常见网络和安全设备的安装、调试、维护,具备网络故障的分析、判断、解决能力,具备大型网络的设计维护和SDN维护经验者优先。 4、熟悉常见操作系统如Windows、Linux等,对日常的运维管理维护、疑难问题定位和处理。 5、熟悉主流云计算厂商的软、硬件产品(云平台、服务器、网络、安全设备)的维护与配置。 6、有较强的沟通协调能力及责任心,工作能动性积极主动者优先。 岗位职责 1、负责对公司云平台环境软硬件的日常巡检、维护等全生命周期运维管理工作,确保系统7*24小时稳定运行。 2、处理云内、云外等各类网络安全等相关问题,保障云环境的网络安全。 3、配合二线、研发定位,甚至后期可独立处理云平台的各类问题,包括但不限于平台资源工单交付类、平台异常故障处理等问题。 4、审批项目上驻场工程师的变更方案,并做技术指导 5、技术经理统管云平台的运行状态,进行性能分析和容量规划,及时发现并处理潜在风险,保障系统安全稳定运行。 6、作为技术经理配合运维经理对现场进行管理,能够快速响应和处理运维中的突发事件和故障,进行问题定位、分析和解决,并撰写故障报告,提出改进建议等。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

职责描述: 1、Linux\Unix\Windows平台下主流数据库规划、部署、备份、迁移、恢复、监控、运行状态检查、问题跟进、账户维护、补丁安装、安全配置等; 2.负责MySQL/Oracle/PGSQL/Mongodb等主流数据库高可用架构方案设计、维护、优化工作; 3、负责日常技术运维支持工作,支持开发团队审核,优化SQL语句及调试工作; 4、撰写数据库案例分析报告、数据库方案设计报告。。

职位要求: 1、全日制统招本科学历以上,有5年以上中大型企业数据库全职维护经历; 2、熟悉MySQL数据库MHA、MGA、Percona Cluster等高可用方案,熟悉其工作原理;熟悉No-SQL技术(Redis MongoDB等),了解相关高可用技术方案; 3、具有独立撰写技术方案和文档能力;有较强的沟通协调能力及高度责任心,能服从工作安排; 4、熟悉Oracle RAC\DATA GUARD等高可用技术,取得OCP证书者优先考虑; 5、具备国产数据库运维经验优先考虑。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

岗位职责: 1)负责线下平台和云平台(阿里云、华为云等)的日常运维、监控、优化和故障处理。 2)设计、部署和维护基于Kubernetes(K8S)的容器化平台,确保其高效稳定运行。 3)参与制定和实施运维自动化方案,提升运维效率。 4)负责系统性能优化、容量规划及灾难恢复方案的制定与实施。 5)配合开发团队完成CI/CD流水线的搭建与优化。 6)监控系统运行状态,及时发现并解决潜在问题,保障系统7x24小时高可用。 7)编写和维护运维相关文档,包括系统架构、操作手册、故障处理流程等。 任职要求: 1)学历要求:计算机相关专业本科及以上学历。 2)工作经验:3年以上互联网运维相关工作经验。 3)熟练掌握Kubernetes(K8S)的部署、管理和优化,具备大规模集群运维经验。 4)熟悉阿里云、华为云等主流云平台的服务和架构,具备云资源管理和优化经验。 5)熟悉CI/CD工具(如Jenkins、GitLab CI等)以推动devops者优先。 6)具备云计算相关认证(如阿里云ACP、华为云HCIE等)者优先。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

岗位职责: 1、负责应用系统版本部署和维护,服务器的配置,维护,监控,调优和故障排除。 2、负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进; 3、负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告; 4、负责系统监控和应急反应,以确保证系统有7*24小时的持续运作能力; 5、负责日常系统维护,包括数据、流量监控、应急响应并提交报告,保证系统的稳定。 任职要求: 1、大学本科,计算机相关专业; 2、3年及以上工作经验,有金融业或大型互联网经验者优先; 3、精通Linux系统,有一定的网络及数据库基础,熟悉常用排障命令及工具如jstack,jmap,tcpdump,wireshark等; 4、有一定的开发经验,至少熟悉Bash Shell,Python,go其中一种; 5、对CI/CD有比较深的理解,熟悉k8s生态; 6、具有团队合作精神、思维清晰、细致耐心、责任心强,能独立完成工作。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

要求大专或本科学历,计算机相关专业优先。通常需要2 - 5年及以上云计算相关工作经验,部分岗位会要求有特定行业的云平台运维经验。

  • 专业技能:
  • 云计算平台:熟悉主流云计算平台(如阿里云、华为云等)的架构设计、运维管理及故障排查。
  • 中间件与组件:掌握常用中间件(如mysql、redis等),熟悉云原生组件的架构设计、运维管理及故障排查;熟悉docker、k8s等容器技术及相关原理。
  • 操作系统与语言:熟悉Linux操作系统,至少熟练掌握一种常用开发语言,如Python、Go、Java等。
  • 网络知识:熟悉TCP/IP原理、多层交换网络及常见路由协议原理和配置,有网络高级认证者优先。
  • 其他能力:具备良好的沟通和团队协作能力,能承受一定工作压力,有较强的责任心;掌握ITIL理论,了解DevOps理论 ,理解运维自动化趋势者优先。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

职位诱惑: 技术领先,团队精锐,项目靠谱,资金充足

职位描述: 1、负责云计算后台产品的研发与运营; 2、负责云计算产品的后台管理系统研发; 3、和产品团队合作进行性能分析和架构优化,引入业界新技术改进云平台产品; 4、基于灵雀云的产品,结合客户的需求,设计并开发针对客户场景的产品功能或解决方案; 5、参与客户现场需求交流,负责客户现场的交付与实施。

任职资格: 1、熟练掌握至少一门编程语言,如Python、Golang、C++、Java等; 2、熟悉基于Linux平台上编程; 3、优秀的架构设计能力; 4、优秀的分析与解决问题能力; 5、熟悉通用设计模式,能独立进行软件开发; 6、有较强的学习和沟通能力,以及团队合作精神; 7、诚实、踏实、积极主动、抗压能力强,喜欢挑战困难。

【加分项】 1、有云计算领域背景; 2、掌握Golang、Kubernetes,了解Docker以及相关开源软件; 3、参与过开源项目,或者有自己的开源软件作品; 4、对新技术、新知识充满热情。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

  1. 3 年及以上运维开发或相关工作经验
  2. 精通至少一种编程语言(Python/Go 优先),具备扎实的代码编写能力,能独立完成自动化工具的开发;熟练掌握 Shell 脚本编程
  3. 熟悉主流运维自动化工具,如 Ansible,有实际使用经验
  4. 深入理解容器化技术(Docker)与 Kubernetes 生态,具备 K8s 集群部署、运维、调优经验者优先
  5. 熟悉监控与日志分析体系,如 Prometheus、Grafana、ELK、Zabbix,有搭建监控告警方案的经验
  6. 了解主流数据库(MySQL、Redis)、中间件(Nginx、RabbitMQ)的基本运维与调优方法
  7. 具备云平台(阿里云、AWS、腾讯云等)使用经验,熟悉云资源管理与运维者优先
  8. 具备较强的问题排查与解决能力,责任心强,有良好的沟通协作能力与抗压能力,能快速响应线上问题
  9. 有持续学习意识,关注运维领域新技术(如云原生、AI 运维),并能结合业务场景落地 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

工作职责: 1、负责公司Linux操作系统的日常运维和优化; 2、负责nginx集群的运维管理 3、响应及解决各类技术需求、疑问以及系统使用过程中遇到的各种问题; 4、运维体系建设和开发运维工具或自动化系统来优化和提升系统的稳定性和健壮性。

职位要求: 1、熟悉Linux/Unix平台的C编程,熟悉常用脚本语言SHell,Python等。 2、具备较强的问题分析、排查、解决和沟通协调能力,善于处理跨团队合作; 3、熟悉TCP/IP、HTTP、SSL/TLS、WebSocket、QUIC、DNS等一种或多种网络协议; 4、有高并发WEB Server设计、开发经验者优先; 5、有LB/Nginx/OpenResty/K8S/公有云(AWS/ALI/AZURE) 等运维经验; 6、计算机或相关专业本科或以上学历,5年以上系统运维经验。 岗位要求: 1、有丰富的云资源运维管理经验,具备大规模公有云或者私有云的运维管理经验优先 2、有较强的自动化运维理念,能充分利用线上运维的优势,有创新的思维制定完整的自动化运维体系 3、具有资源运营、用户运营、成本运营、账号权限管理、产品运营的能力 4、有较强的沟通能力,有跨部门沟通协调能力。 5、有较强的项目管理思维,推动内部外部的上云项目落地,管理项目周期、协调有效资源推动项目落地执行。 6、结合现网资源和业务发展目标,给出资源建设、云服务运营管理的策略和建议; 7、、基于现网容量、运营等数据,对资源分配率、使用率、资源池投入产出等关键经营指标进行监控与分析,分析资源如何最大程度变现,给出资源配比调整,给出云服务资源运营优化建议。

职位要求: 1、熟悉各大公有云厂商的运营模式 2、具备公有云厂商工作经验 3、良好的沟通、组织协调能力和强烈的责任心、能够随时响应并处理各类故障。 岗位职责: 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

1.精通SQL语言,熟悉SQL性能优化方法,了解数据表、视图的设计原则;2.熟练使用Oracle数据库、PL/SQL、Mysq!,能独立开发存储过程、自定义函数; 3.熟悉ETL开发工作,熟练使用至少一种EI开发工具和调度工具:4.对大数据平台有一定的认识,了解HQL与SQL的差异;5.具备良好的沟通能力和学习能力: 对银行业务有一定了解的优先,有阿里大数据平台经验的优先。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

岗位职责: 一、云平台运维保障

  1. 负责阿里云平台(ECS/RDS/SLB/Redis/K8S等)的日常部署、监控及维护,确保7×24高可用性。
  2. 实施全链路监控(Prometheus/Zabbix/ELK),定期健康检查,提前发现并治理稳定性风险。
  3. 管理数据备份与恢复策略(全量/增量备份),设计容灾切换方案,确保故障时用户无感知。

二、故障处理与性能优化

  1. 快速定位并解决典型问题。
  2. 优化云资源性能(计算/存储/网络),调整中间件配置(DB/Nginx/Redis/Kafka),提升系统并发能力与低延迟响应。
  3. 分析日志及监控数据,提出架构优化建议(如自动扩缩容、缓存策略调整)。

三、安全与合规管理

  1. 配置安全组、防火墙规则,定期漏洞扫描与修复,防范DDoS/数据泄露等风险。
  2. 确保符合电商行业安全规范(如支付安全、用户隐私保护)及重庆本地数据合规要求。

四、自动化与协作

  1. 开发运维脚本(Shell/Python)及工具(日志分析、服务自愈),减少人工干预。
  2. 协同开发团队完成版本迭代,支持大促活动护航,提供容量评估与资源规划。
  3. 撰写运维文档,定期向团队汇报系统状态及优化成果 任职要求: 学历:统招本科及以上,计算机相关专业(优秀大专生可放宽)。 经验: 3年以上云平台运维经验,1年以上电商场景经验,熟悉高并发流量处理。 精通阿里云核心产品(ECS/SLB/RDS/Redis/OSS)及混合云架构。 技术能力: 熟练Linux系统调优、网络协议(TCP/HTTP)及中间件(MySQL/Nginx/Redis)。 掌握容器化技术(Docker/K8s)、自动化运维工具。 脚本开发能力(Shell/Python),有运维工具二次开发经验者优先。 认证:阿里云ACP/ACE、网络认证(CCIE/HCIE)优先。 有APP上架经验优先。 软性素质 系统性思维:能逐层分析问题(日志→代码→架构),抗压处理突发故障。 沟通协作:与开发、客户高效协作,具备技术方案输出能力。 责任心:严格遵循运维规范,主动优化流程。

来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

工作职责: 1.负责业务与财务场景的数据分析、报表开发与系统支持; 2.使用 SQL 进行数据提取、加工和逻辑实现,支撑财务核算、成本分摊、收入对账等关键流程; 3.与财务及业务团队沟通需求,将业务规则转化为高效的数据处理方案; 4.参与数据治理,保障数据准确性和及时性,支持管理决策。 任职资格: 1.全日制本科及以上学历,5年以上数据开发经验,至少1年以上财务或业财相关项目经验; 2.熟悉 Python 或 Shell 脚本,能完成自动化数据处理任务; 3.精通 SQL,能熟练编写复杂查询、多表关联、窗口函数,具备性能优化能力; 4.具备良好的问题排查能力,可快速定位数据异常、任务失败等问题; 5.有财务对账、成本计算、收入分摊等实际项目经验者优先; 6.学习能力强,善于沟通,能快速理解业务并落地数据支持方案。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

岗位职责: 1、负责私有云项目的全生命周期运维管理工作,确保系统7*24小时稳定运行。 2、组织实施运维计划,制定并优化运维流程、规范和标准,持续提升系统效率和运维质量。 3、监控系统运行状态,进行性能分析和容量规划,及时发现并处理潜在风险,保障系统安全稳定运行。 4、快速响应和处理运维中的突发事件和故障,进行问题定位、分析和解决,并撰写故障报告,提出改进建议。 5、参与私有云平台的架构设计、部署实施和性能优化,提供技术支持和解决方案。 6、跟踪云计算领域最新技术发展趋势,探索并引入先进的运维工具和技术,提升运维自动化水平。 任职要求: 1、云计算领域至少五年以上运维工作经验,具备ITIL认证或者PMP认证者优先; 2、精通服务器虚拟化和云计算相关技术(如VMware、Hyper-V、Xen、KVM、OpenStack等)、主流的私有云、混合云解决方案架构,具备H3C CloudOS、CAS解决方案运维经验者优先; 3、具备华为 FusionStorage、深信服 HCI 分布式存储、H3C UniStor X10000 等商业化分布式存储产品的规划设计或运维经验; 4、熟悉基本的网络技术和TCP/IP协议原理,具备大型网络的设计维护和SDN维护经验者优先; 5、了解基本的安全技术,如入侵检测、病毒防护、防火墙、VPN等; 6、具备团队管理经验,有政务云管理经验者优先; 7、本科以上学历,5年以上运维相关工作经验,1年以上团队管理或者项目管理经验。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs

任职资格: 1.计算机相关专业本科及以上学历,至少有3年主流云平台的建设、运维相关经验。 2.精通Linux操作系统和常用组件(Nginx,Tomcat,Elasticsearch,Redis,Kafka等)的部署优化,以及故障定位和处理。 3.精通一种以上编程语言,至少掌握python/java/go中的一种编程语言,能自主开发自动化运维平台或工具,提高运维效率。 4.熟悉Docker、Mesos、DC/OS、Kubernetes等主流容器技术的功能及原理,有大规模集群运维经验。 5.熟悉Ansible、SaltStack、Prometheus、Grafana、Zabbix、Pinpoint、Skywalking等开源运维工具。 6.了解HADOOP集群、PAAS组件,了解SPARK、HIVE、HBASE等技术,掌握SQL基本操作,具备编写存储过程的运营研发能力。 7.具备良好的服务意识、具备吃苦耐劳精神,能站在分公司一线角度分析、支撑问题。 8.具备通信运营商行业相关的大数据应用系统开发、运维工作经验者优先。 岗位职责: 1.负责大数据项目管理,负责基于主流公有云产品的业务系统的规划、建设、维护与优化,确保业务系统的稳定性、高可用性和可扩展性。 2.负责大数据应用系统核心架构的性能调优,定位并修复系统的疑难问题,负责按运维需求完成自动化脚本的开发。 3.掌握云产品运维过程,针对应用系统资源需求、场景、部署、应用、优化、安全等进行实施支撑。 4.负责大数据应用系统日常运维,包括日/月数据维护作业处理、系统安全、系统监控和巡检、故障处理和预案优化等; 5.负责大数据应用系统新功能测试、上线割接和验证,保障系统升级全过程的稳定性; 6.负责大数据应用系统日常问题支撑,包括问题核查、全过程管控和支撑回复,提升业务人员使用系统的感知和满意度。 7.负责推动运维工作朝着自动化、智能化的方向演进,提升整体运维管理效率。 来源:BOSS直聘 链接:https://www.zhipin.com/web/geek/jobs