Octopus 应用现状分析

基于代码库版本号、测试覆盖、部署配置和运行时状态的真实现状评估。


1. 开发阶段总览

已完成的里程碑

里程碑完成时间核心成果
AGI Enhancement(4 阶段)2026-03173 新测试,633 总测试,6 个 ADR
Tranche 5: 能力生态 + 语义状态2026-0311 族 39 包,1302 总测试,0 门禁失败
Capability Learning v1.02026-036 步学习管线,250 测试
Capability Learning v1.12026-03注册表 UI + 发现 + 反馈,76 新测试
Capability Learning v1.22026-03Dashboard + 反馈钩子 + 发现策略,67 新测试
Capability Learning v1.32026-03产品视图 + 重验证 + 结果质量,91 新测试
Base Node v1.22026-03-139 个 systemd 服务,58 个 MCP 服务器
ScreenOS Phase 1 (DesktopOS)2026-03-14屏幕感知/操作,88 测试

代码证据

  • 里程碑记录:docs/milestone_node_v1.md
  • 能力生态主图:docs/tranche5/CAPABILITY_ECOSYSTEM_MASTER_MAP.md
  • ADR 文档:kernel/docs/ADR-002ADR-008

2. 测试覆盖现状

测试数量统计

测试数说明
Kernel 契约 + 域1,612含 1 个预存 stub-policy 失败
Shared 能力学习103v1.1 + v1.2 + v1.3
Shared 框架130能力包测试
Shared 能力包19539 首批包测试
Shared 集成142集成 + E2E 测试文件
CLI 产品99 个测试文件
Web 产品30+组件/hooks/页面测试
合计~2,221+

门禁质量

  • 52 个 Gate 检查,由 python3 -m ops.gates all 统一运行
  • 0 个新门禁失败(v1.3 后)
  • 12 个预存门禁失败(遗留代码中的 memory tokens、self-goal 等)
  • 27 个预存门禁失败(AGI Enhancement 阶段,大部分已在后续清理)

E2E 测试脚本

代码位置: scripts/run_*_e2e.sh — 23 个 E2E 流程

脚本覆盖
run_linux_engineer_v03_benchmark.shlinux-engineer 角色基准(10 轮)
run_personal_assistant_chat_e2e.sh天气/聊天场景 E2E
run_skills_lifecycle_e2e.sh技能生命周期
run_goal_engine_e2e.sh目标引擎
run_curiosity_e2e.sh好奇心引擎
run_cerebellum_e2e.sh小脑路由
其他 17 个各域 E2E

3. 生产节点部署现状

硬件配置

代码证据: docs/milestone_node_v1.md

配置项规格
主机名octopus-os
IP(内网,见部署文档)
CPUIntel i9-14900(24 核 32 线程)
内存94 GB
GPUNVIDIA RTX 4060
存储2 × 3.6 TiB NVMe
OSUbuntu

用户配置

用户用途权限
ran管理员完整 sudo
claudeAI AgentNOPASSWD sudo
octopus运行时nologin

9 个 systemd 服务

octopus-kernel    :9071    Kernel 核心服务
octopus-http      :8000    HTTP API 服务
caddy             :80/:443 反向代理 + 自动 HTTPS
redis             :6379    任务队列(凭据见部署文档)
prometheus        :9090    指标采集
node-exporter     :9100    主机指标导出
grafana           :3000    指标仪表盘(凭据见部署文档)
octopus-worker    守护进程  任务执行器
octopus-planner   定时器   每小时计划生成

所有服务配置: Restart=always, ProtectSystem=strict, NoNewPrivileges=true

辅助节点

节点IP用途代码证据
Kali Linux(内网)安全测试octopus-kali.service :8001

4. MCP 服务器接入现状

统计数据

状态数量
已安装58
已启用4
待激活54

已启用的核心 MCP

MCP能力
filesystem文件系统操作
memory记忆管理
gitGit 操作
fetchHTTP 获取

待激活分类

类别数量示例
Core2time, brave-search
AWS26awslabs.* 全套
DevTools7github, playwright, terraform
Database4mongodb, mariadb, redis
Communication5slack, notion, twilio
Business8sentry, stripe, paypal

风险分级

风险等级数量
LOW6
MEDIUM14
HIGH27
CRITICAL11

治理配置

三文件体系:

  • mcp-catalog.yaml — 发现目录
  • registry.yaml v2.0 — 策略与风险分级
  • mcp-servers.json — 运行时执行配置

5. 角色成熟度现状

46+ 角色定义

代码位置: roles/ 目录

成熟度版本角色数量
完整规范v0.3+linux-engineer, programmer, database-engineer, frontend-engineer, backend-engineer, qa-engineer6
部分规范v0.1security-analyst, cloud-engineer, devops-engineer, network-engineer, sre, data-engineer6
模板级v0.1sales-lead, account-manager, finance-lead, customer-success-manager, support-engineer, product-manager 等30+
专项角色v1.0kali-engineer1

完整角色示例:linux-engineer v0.3

  • 场景覆盖: service_restart_loop, disk_pressure, cpu_pressure, repeated_manual_fix, permission_denied_repair
  • 安全红线: “rm requires high-risk recognition”
  • 自治阶段: observe → experiment → promote → expand
  • 学习事件: 7 种事件类型
  • 文档: ROLE_PRODUCT_V1.md, PRODUCT_ENTRYPOINTS.md, KERNEL_UPGRADE_PROFILE.md

6. Capability 包现状

首批 39 包 × 11 族

包数包名
browser4dom_interact, extract, navigate, session_basic
business4crm_read, crm_write, dynamics_read, work_management
cloud5aws_inspect, azure_inspect, gcp_inspect, iac_plan, kubernetes_inspect
coding3build_test_lint, git_ops, search_symbols
communication3calendar_read, chat_summary, email_read
database3discovery, readonly_query, schema_inspect
document4generic_read, notion_basic, office_write, sheet_basic
identity2lookup, permission_inspect
knowledge3grounding, retrieve_basic, retrieve_hybrid
network4connectivity_probe, edge_cloudflare, tls_dns_inspect, tunnel_ngrok
search3docs_api, web_general, web_news

扩展 22 包

用途
aws_operationsAWS SDK 操作
capability_learning学习管线
monitoring_queryPrometheus 查询
teams_integrationMicrosoft Teams
web_searchWeb 搜索
linux_command_skill_compilerLinux 命令代码生成
office_document_parserOffice 文档解析
其他 15 个各类连接器和工具

7. CLI 工具现状

octopus CLI v1.1

代码位置: /usr/local/bin/octopus

已实现命令:

命令用途
octopus status服务状态检查
octopus health健康探测
octopus info节点信息
octopus project项目管理
octopus sandbox沙盒管理
octopus mcpMCP 服务器管理
octopus start/stop/restart服务生命周期
octopus logs日志查看

产品 CLI

代码位置: products/cli/

命令用途
octopus chat交互式对话 REPL
octopus init首次配置向导
octopus up/down本地服务器启停
octopus status健康检查
octopus learn <target>触发能力学习
octopus roles角色列表
octopus completionsShell 补全
octopus version版本信息

8. Web Dashboard 现状

能力注册表仪表盘

代码位置: server/shared/adapters/http/_routes_capability_registry.py

功能:

  • 能力列表(颜色编码徽章:origin, risk, staleness)
  • 操作按钮(promote/demote/block/reverify)
  • 发现候选区域
  • 统计工具栏
  • 客户端筛选栏(Origin/Risk/Drift 下拉)
  • 视图切换(All/Shadow/Promoted/Demoted)
  • Grade 列(主导等级徽章 + 不稳定性警告 + 退化指示器)
  • Reverify 队列(紧迫度徽章)
  • URL 参数持久化

Web 控制台 9 页面

代码位置: products/web/src/main.tsx

页面路由功能
Chat/对话界面(默认)
Dashboard/dashboard仪表盘
Organization/organization组织视图
Tasks/tasks任务列表
Roles/roles角色管理
Role Detail/roles/:roleId角色详情
Memory/memory记忆管理
History/history历史记录
Settings/settings设置

9. 学习管线运行现状

已验证的 E2E 场景

代码证据: 能力学习 E2E 测试(6 个场景)

场景来源结果
GitHub / FastAPIgithub.com/tiangolo/fastapi成功学习
OpenAPI / Petstorepetstore.swagger.io成功学习
npm / lodashnpmjs.com/lodash成功学习
Docker / nginxhub.docker.com/nginx成功学习
高风险拒绝高风险包正确拒绝
Shadow-only影子模式正确隔离

自动发现源

来源获取策略
GitHub Trending热门仓库
npm Popular流行包
Docker Official官方镜像
PyPI Well-Known知名 Python 包

发现策略配额

配额类型限额
每源每日25 个候选
全局每日100 个候选
重提议冷却14 天

10. 开发同步现状

dev-sync 工具

代码位置: scripts/dev-sync.sh

使用 rsync + fswatch 实现本地开发到远程节点的实时同步。

同步目标:

  • octopus-os 节点
  • kali 节点

11. 文档现状

文档类别数量位置
ADR 决策记录20+docs/adr/, kernel/docs/ADR-*
冻结规范5kernel/docs/KERNEL_FREEZE.md
工作台文档10+docs/workbench/
设计文档5+docs/design/
Tranche 5 规范6docs/tranche5/
角色产品文档46+ × 4roles/*/docs/
里程碑文档2docs/milestone_*

12. 已知问题与限制

预存门禁失败

  • memory tokens — 记忆 Token 相关
  • self-goal — 自我目标域
  • system-governor — 系统治理
  • fault_tolerance determinism — 容错确定性
  • purity in legacy code — 遗留代码纯净性

架构限制

  • 内存存储: v1.1 的发现/反馈存储为模块级字典(重启丢失,v1.1 可接受)
  • MCP 激活: 58 个已安装但仅 4 个已启用,54 个待配置凭据后激活
  • 角色模板: 30+ 商务角色仅有模板级定义,缺乏场景和策略细化
  • 移动端: App 架构完整但功能待补全

下一步方向

  • MCP 集成/适配 — 连接 54 个待激活服务器
  • 角色深化 — 从模板级提升到完整规范
  • ScreenOS Phase 2 (MobileOS) / Phase 3 (TabletOS) — 复用契约,新增适配器
  • 能力自主成长 — 激活 base/agent/growth/ 的自动学习循环
OctopusOS
How can we help?