Octopus 应用现状分析
基于代码库版本号、测试覆盖、部署配置和运行时状态的真实现状评估。
1. 开发阶段总览
已完成的里程碑
| 里程碑 | 完成时间 | 核心成果 |
|---|
| AGI Enhancement(4 阶段) | 2026-03 | 173 新测试,633 总测试,6 个 ADR |
| Tranche 5: 能力生态 + 语义状态 | 2026-03 | 11 族 39 包,1302 总测试,0 门禁失败 |
| Capability Learning v1.0 | 2026-03 | 6 步学习管线,250 测试 |
| Capability Learning v1.1 | 2026-03 | 注册表 UI + 发现 + 反馈,76 新测试 |
| Capability Learning v1.2 | 2026-03 | Dashboard + 反馈钩子 + 发现策略,67 新测试 |
| Capability Learning v1.3 | 2026-03 | 产品视图 + 重验证 + 结果质量,91 新测试 |
| Base Node v1.2 | 2026-03-13 | 9 个 systemd 服务,58 个 MCP 服务器 |
| ScreenOS Phase 1 (DesktopOS) | 2026-03-14 | 屏幕感知/操作,88 测试 |
代码证据
- 里程碑记录:
docs/milestone_node_v1.md
- 能力生态主图:
docs/tranche5/CAPABILITY_ECOSYSTEM_MASTER_MAP.md
- ADR 文档:
kernel/docs/ADR-002 至 ADR-008
2. 测试覆盖现状
测试数量统计
| 层 | 测试数 | 说明 |
|---|
| Kernel 契约 + 域 | 1,612 | 含 1 个预存 stub-policy 失败 |
| Shared 能力学习 | 103 | v1.1 + v1.2 + v1.3 |
| Shared 框架 | 130 | 能力包测试 |
| Shared 能力包 | 195 | 39 首批包测试 |
| Shared 集成 | 142 | 集成 + E2E 测试文件 |
| CLI 产品 | 9 | 9 个测试文件 |
| Web 产品 | 30+ | 组件/hooks/页面测试 |
| 合计 | ~2,221+ | |
门禁质量
- 52 个 Gate 检查,由
python3 -m ops.gates all 统一运行
- 0 个新门禁失败(v1.3 后)
- 12 个预存门禁失败(遗留代码中的 memory tokens、self-goal 等)
- 27 个预存门禁失败(AGI Enhancement 阶段,大部分已在后续清理)
E2E 测试脚本
代码位置: scripts/run_*_e2e.sh — 23 个 E2E 流程
| 脚本 | 覆盖 |
|---|
run_linux_engineer_v03_benchmark.sh | linux-engineer 角色基准(10 轮) |
run_personal_assistant_chat_e2e.sh | 天气/聊天场景 E2E |
run_skills_lifecycle_e2e.sh | 技能生命周期 |
run_goal_engine_e2e.sh | 目标引擎 |
run_curiosity_e2e.sh | 好奇心引擎 |
run_cerebellum_e2e.sh | 小脑路由 |
| 其他 17 个 | 各域 E2E |
3. 生产节点部署现状
硬件配置
代码证据: docs/milestone_node_v1.md
| 配置项 | 规格 |
|---|
| 主机名 | octopus-os |
| IP | (内网,见部署文档) |
| CPU | Intel i9-14900(24 核 32 线程) |
| 内存 | 94 GB |
| GPU | NVIDIA RTX 4060 |
| 存储 | 2 × 3.6 TiB NVMe |
| OS | Ubuntu |
用户配置
| 用户 | 用途 | 权限 |
|---|
ran | 管理员 | 完整 sudo |
claude | AI Agent | NOPASSWD sudo |
octopus | 运行时 | nologin |
9 个 systemd 服务
octopus-kernel :9071 Kernel 核心服务
octopus-http :8000 HTTP API 服务
caddy :80/:443 反向代理 + 自动 HTTPS
redis :6379 任务队列(凭据见部署文档)
prometheus :9090 指标采集
node-exporter :9100 主机指标导出
grafana :3000 指标仪表盘(凭据见部署文档)
octopus-worker 守护进程 任务执行器
octopus-planner 定时器 每小时计划生成
所有服务配置: Restart=always, ProtectSystem=strict, NoNewPrivileges=true
辅助节点
| 节点 | IP | 用途 | 代码证据 |
|---|
| Kali Linux | (内网) | 安全测试 | octopus-kali.service :8001 |
4. MCP 服务器接入现状
统计数据
已启用的核心 MCP
| MCP | 能力 |
|---|
| filesystem | 文件系统操作 |
| memory | 记忆管理 |
| git | Git 操作 |
| fetch | HTTP 获取 |
待激活分类
| 类别 | 数量 | 示例 |
|---|
| Core | 2 | time, brave-search |
| AWS | 26 | awslabs.* 全套 |
| DevTools | 7 | github, playwright, terraform |
| Database | 4 | mongodb, mariadb, redis |
| Communication | 5 | slack, notion, twilio |
| Business | 8 | sentry, stripe, paypal |
风险分级
| 风险等级 | 数量 |
|---|
| LOW | 6 |
| MEDIUM | 14 |
| HIGH | 27 |
| CRITICAL | 11 |
治理配置
三文件体系:
mcp-catalog.yaml — 发现目录
registry.yaml v2.0 — 策略与风险分级
mcp-servers.json — 运行时执行配置
5. 角色成熟度现状
46+ 角色定义
代码位置: roles/ 目录
| 成熟度 | 版本 | 角色 | 数量 |
|---|
| 完整规范 | v0.3+ | linux-engineer, programmer, database-engineer, frontend-engineer, backend-engineer, qa-engineer | 6 |
| 部分规范 | v0.1 | security-analyst, cloud-engineer, devops-engineer, network-engineer, sre, data-engineer | 6 |
| 模板级 | v0.1 | sales-lead, account-manager, finance-lead, customer-success-manager, support-engineer, product-manager 等 | 30+ |
| 专项角色 | v1.0 | kali-engineer | 1 |
完整角色示例:linux-engineer v0.3
- 场景覆盖: service_restart_loop, disk_pressure, cpu_pressure, repeated_manual_fix, permission_denied_repair
- 安全红线: “rm requires high-risk recognition”
- 自治阶段: observe → experiment → promote → expand
- 学习事件: 7 种事件类型
- 文档: ROLE_PRODUCT_V1.md, PRODUCT_ENTRYPOINTS.md, KERNEL_UPGRADE_PROFILE.md
6. Capability 包现状
首批 39 包 × 11 族
| 族 | 包数 | 包名 |
|---|
| browser | 4 | dom_interact, extract, navigate, session_basic |
| business | 4 | crm_read, crm_write, dynamics_read, work_management |
| cloud | 5 | aws_inspect, azure_inspect, gcp_inspect, iac_plan, kubernetes_inspect |
| coding | 3 | build_test_lint, git_ops, search_symbols |
| communication | 3 | calendar_read, chat_summary, email_read |
| database | 3 | discovery, readonly_query, schema_inspect |
| document | 4 | generic_read, notion_basic, office_write, sheet_basic |
| identity | 2 | lookup, permission_inspect |
| knowledge | 3 | grounding, retrieve_basic, retrieve_hybrid |
| network | 4 | connectivity_probe, edge_cloudflare, tls_dns_inspect, tunnel_ngrok |
| search | 3 | docs_api, web_general, web_news |
扩展 22 包
| 包 | 用途 |
|---|
| aws_operations | AWS SDK 操作 |
| capability_learning | 学习管线 |
| monitoring_query | Prometheus 查询 |
| teams_integration | Microsoft Teams |
| web_search | Web 搜索 |
| linux_command_skill_compiler | Linux 命令代码生成 |
| office_document_parser | Office 文档解析 |
| 其他 15 个 | 各类连接器和工具 |
7. CLI 工具现状
octopus CLI v1.1
代码位置: /usr/local/bin/octopus
已实现命令:
| 命令 | 用途 |
|---|
octopus status | 服务状态检查 |
octopus health | 健康探测 |
octopus info | 节点信息 |
octopus project | 项目管理 |
octopus sandbox | 沙盒管理 |
octopus mcp | MCP 服务器管理 |
octopus start/stop/restart | 服务生命周期 |
octopus logs | 日志查看 |
产品 CLI
代码位置: products/cli/
| 命令 | 用途 |
|---|
octopus chat | 交互式对话 REPL |
octopus init | 首次配置向导 |
octopus up/down | 本地服务器启停 |
octopus status | 健康检查 |
octopus learn <target> | 触发能力学习 |
octopus roles | 角色列表 |
octopus completions | Shell 补全 |
octopus version | 版本信息 |
8. Web Dashboard 现状
能力注册表仪表盘
代码位置: server/shared/adapters/http/_routes_capability_registry.py
功能:
- 能力列表(颜色编码徽章:origin, risk, staleness)
- 操作按钮(promote/demote/block/reverify)
- 发现候选区域
- 统计工具栏
- 客户端筛选栏(Origin/Risk/Drift 下拉)
- 视图切换(All/Shadow/Promoted/Demoted)
- Grade 列(主导等级徽章 + 不稳定性警告 + 退化指示器)
- Reverify 队列(紧迫度徽章)
- URL 参数持久化
Web 控制台 9 页面
代码位置: products/web/src/main.tsx
| 页面 | 路由 | 功能 |
|---|
| Chat | / | 对话界面(默认) |
| Dashboard | /dashboard | 仪表盘 |
| Organization | /organization | 组织视图 |
| Tasks | /tasks | 任务列表 |
| Roles | /roles | 角色管理 |
| Role Detail | /roles/:roleId | 角色详情 |
| Memory | /memory | 记忆管理 |
| History | /history | 历史记录 |
| Settings | /settings | 设置 |
9. 学习管线运行现状
已验证的 E2E 场景
代码证据: 能力学习 E2E 测试(6 个场景)
| 场景 | 来源 | 结果 |
|---|
| GitHub / FastAPI | github.com/tiangolo/fastapi | 成功学习 |
| OpenAPI / Petstore | petstore.swagger.io | 成功学习 |
| npm / lodash | npmjs.com/lodash | 成功学习 |
| Docker / nginx | hub.docker.com/nginx | 成功学习 |
| 高风险拒绝 | 高风险包 | 正确拒绝 |
| Shadow-only | 影子模式 | 正确隔离 |
自动发现源
| 来源 | 获取策略 |
|---|
| GitHub Trending | 热门仓库 |
| npm Popular | 流行包 |
| Docker Official | 官方镜像 |
| PyPI Well-Known | 知名 Python 包 |
发现策略配额
| 配额类型 | 限额 |
|---|
| 每源每日 | 25 个候选 |
| 全局每日 | 100 个候选 |
| 重提议冷却 | 14 天 |
10. 开发同步现状
dev-sync 工具
代码位置: scripts/dev-sync.sh
使用 rsync + fswatch 实现本地开发到远程节点的实时同步。
同步目标:
11. 文档现状
| 文档类别 | 数量 | 位置 |
|---|
| ADR 决策记录 | 20+ | docs/adr/, kernel/docs/ADR-* |
| 冻结规范 | 5 | kernel/docs/KERNEL_FREEZE.md 等 |
| 工作台文档 | 10+ | docs/workbench/ |
| 设计文档 | 5+ | docs/design/ |
| Tranche 5 规范 | 6 | docs/tranche5/ |
| 角色产品文档 | 46+ × 4 | roles/*/docs/ |
| 里程碑文档 | 2 | docs/milestone_* |
12. 已知问题与限制
预存门禁失败
- memory tokens — 记忆 Token 相关
- self-goal — 自我目标域
- system-governor — 系统治理
- fault_tolerance determinism — 容错确定性
- purity in legacy code — 遗留代码纯净性
架构限制
- 内存存储: v1.1 的发现/反馈存储为模块级字典(重启丢失,v1.1 可接受)
- MCP 激活: 58 个已安装但仅 4 个已启用,54 个待配置凭据后激活
- 角色模板: 30+ 商务角色仅有模板级定义,缺乏场景和策略细化
- 移动端: App 架构完整但功能待补全
下一步方向
- MCP 集成/适配 — 连接 54 个待激活服务器
- 角色深化 — 从模板级提升到完整规范
- ScreenOS Phase 2 (MobileOS) / Phase 3 (TabletOS) — 复用契约,新增适配器
- 能力自主成长 — 激活 base/agent/growth/ 的自动学习循环