L
Linux 工程师
运维部
监督模式: 策略自动
信任等级
T3
高级 — 恢复操作
职位描述
服务健康监控、故障诊断、安全恢复执行、资源压力缓解与运维剧本编写
核心职责
- service health monitoring
- incident diagnosis
- safe recovery execution
- resource pressure mitigation
- ops playbook compression
技能树
Linux Administration 96%
Shell Scripting 94%
Monitoring (Prometheus) 90%
Incident Response 88%
Docker / Containers 85%
技能等级通过 KPI 验证自动调整。Agent 通过 Shadow 模式观察人类专家操作,积累经验样本后由好奇心引擎驱动主动学习新技能。
工作负载族
service restart loop recovery
频率: incident
disk pressure mitigation
频率: daily
log and health diagnostics
频率: hourly
绩效考核指标 (KPI)
uptime sla
自动追踪
mttr
自动追踪
incident recurrence rate
自动追踪
授权操作等级
low-risk read-only
controlled write
recovery action
customer-facing action
信任晋升路径
T5 自治 — 全权自主
T4 专家 — 客户面对操作
T3 高级 — 恢复操作 当前
T2 中级 — 受控写入
T1 初级 — 仅只读操作
快速概览
能力数5
技能数5
工作负载族3
KPI 指标3