OpenClaw AGENTS.md 与 My Claude.md 规则横评

评测对象

  • OpenClaw: https://raw.githubusercontent.com/openclaw/openclaw/refs/heads/main/AGENTS.md
  • My: https://gist.githubusercontent.com/mingyang91/475a9750c5609ff5dfe59a5de1a09b6e/raw/51116ffd45c1f711039699c24cb0a7528b7febdf/Claude.md
  • 项目定位补充依据:OpenClaw README.md

评测前提

  • 95%+ 的代码由 AI 编码代理编写、修改、阅读、调试
  • 人类负责架构决策、需求定义、现实世界反馈注入、最终审查和生产操作确认
  • 执行模型为“单会话主 Agent + 按需子 Agent”
  • 评分采用适用性前置判定;不适用项不进入分母

Part 1 — 基础画像

OpenClaw

  • 项目定位:personal AI assistant,single-user,local-first,同时具备 multi-agent routing、multi-channel 和 sandboxed non-main sessions
  • 规则文件角色:AI 维护者作战手册
  • 核心设计理念:优先防止 AI 在真实仓库、真实 GitHub 流程、真实发布链路里误操作
  • 结构特点:覆盖面极广,包含 triage、PR、测试、发布、GHSA、多 Agent Git 安全、文档、移动端、插件、密钥与发布流程

My

  • 项目定位:multi-tenant backend service,Scala 3 + http4s + cats-effect + PostgreSQL
  • 规则文件角色:AI 强类型后端开发方法论
  • 核心设计理念:用类型系统、错误模型和模块边界降低 AI 的结构性错误率
  • 结构特点:围绕 refactoring philosophy、tagless final、typed error、schema isolation、RAC、OpenAPI、CI/CD 展开

结构对比

  • OpenClaw:约 296 行,约 3697 词,22 个标题,217 个 bullet
  • My:约 507 行,约 3202 词,36 个标题,122 个 bullet
  • 结论:OpenClaw 更像“广覆盖运行手册”,My 更像“高结构编码规范”

Part 2 — 量化评测表

总分

维度 OpenClaw My
D1 项目长期演进适配性 6.8 8.0
D2 规则可执行性与 Agent 遵循适配性 7.6 7.4
D3 上下文效率与 Agent 认知负荷管理 6.0 8.0
D4 工程全流程覆盖度 8.3 8.7
D5 安全与合规约束落地性 4.5 8.5
D6 规则体系可扩展性与可维护性 7.0 5.5
综合均分 6.9 7.6

D1 — 项目长期演进适配性

子项 OpenClaw My
新功能迭代流程规范 ✓ 8分。有新增 channel/extension/docs 的配套动作、默认 maintainer PR workflow、AGENTS/CLAUDE 同步要求。 ✓ 7分。有 route/DTO 变更后同步 OpenAPI、验证 spec、输出 deploy repo checklist。
模块拆分与依赖约束 ✓ 8分。目录、插件依赖归属、dynamic import 边界、文件规模都有明确规则。 ✓ 9分Routes → Services → Repositories、统一 feature template、约束 route→service→repository 端到端传播。
技术债务识别与治理路径 ✓ 6分。强调不要 speculative fix、不要 V2 复制、不要 prototype mutation,但缺少系统化债务治理流程。 ✓ 8分。鼓励 radical type-level refactor、typed errors 增量迁移、命名治理和约束前推。
API/DB/配置版本兼容与迁移规则 ✓ 5分。有 release channel、version locations、doctor/runbook,但兼容与迁移规则分散。 ✓ 7分。system/tenant migrations、禁止修改旧 migration、OpenAPI 同步要求明确。
存量代码改造与新旧规范衔接 ✓ 7分。docs i18n、legacy migration、SwiftUI 状态管理迁移等有衔接规则。 ✓ 9分。新服务采用 typed errors,旧服务在下次修改时迁移,属于成熟的渐进式改造策略。

D1 结论: My 更擅长“持续把系统改得更稳”,OpenClaw 更擅长“在复杂产品持续演化中保持流程可控”。

D2 — 规则可执行性与 Agent 遵循适配性

子项 OpenClaw My
规则颗粒度 ✓ 9分。大量规则是禁令、脚本、命令模板、明确动作。 ✓ 9分。大量 bad/good 例子、ADT 示例、RAC 场景,可直接执行。
规则过载风险 ✓ 4分。低频规则常驻过多,包含 GHSA、1Password、plugin release、docs i18n、VM ops 等。 ✓ 7分。虽然篇幅更长,但内容集中在后端编码和工程主链。
模糊性风险 ✓ 7分。大多具体,但仍有 use existing patternsguideline only 之类模糊项。 ✓ 7分。主体清晰,但“if it compiles, it's correct”把语义正确性过多外包给编译器。
可验证性 ✓ 9分。build、typecheck、lint、test、coverage、smoke、release-check,再叠加 bug-fix 证据门槛。 ✓ 8分。compile、test、format、OpenAPI validate、TestContainers、CI/CD 验证链完整。
冲突与异常的优先级兜底机制 ✓ 9分。标签自动关闭优先、批量操作确认、依赖 patch/发布需批准、冲突即停。 ✓ 6分。有 trusted/untrusted path 与禁止本地构建发布镜像等规则,但缺少统一优先级体系。

D2 结论: OpenClaw 更强于“防错误动作”,My 更强于“防错误代码”。

D3 — 上下文效率与 Agent 认知负荷管理

子项 OpenClaw My
主 Agent 上下文预算效率 ✓ 4分。常驻低频知识过多,纯编码任务的上下文成本偏高。 ✓ 7分。结构更细,核心编码信息更集中,更适合作为常驻规则骨架。
规则的层级化组织 ✓ 6分。有分节,但全局强约束与低频 runbook 未彻底拆层。 ✓ 8分。Overview → Philosophy → Architecture → Testing → Workflow → CI/CD 的层次清楚。
子 Agent 任务委托友好度 ✓ 7分。适用理由:本评测前提即主 Agent + 子 Agent。目录和多 Agent safety 让委托较安全,但无关规则较多。 ✓ 8分。适用理由同左。统一 feature 结构和 layer 模式使局部加载成本更低。
规则的结构化程度 ✓ 7分。有目录、命名、schema、测试命名规则,但更多是经验 bullet 集。 ✓ 9分。tagless final、typed error、feature template、RAC 均可直接转化为 Agent 分析框架。

D3 结论: My 更适合作为长期常驻规则;OpenClaw 需要拆出最小常驻规则集。

D4 — 工程全流程覆盖度

子项 OpenClaw My
技术栈专属规范 ✓ 9分。Node/Bun/TypeScript/Vitest/Oxlint/Oxfmt/SwiftUI/Mintlify/1Password/Notary 都有具体规则。 ✓ 9分。Scala 3/http4s/cats-effect/Doobie/Flyway/OpenTelemetry/Sentry/Kubernetes/ArgoCD 都有具体规则。
全生命周期覆盖 ✓ 9分。编码、测试、PR、issue triage、GHSA、发布、插件发布、troubleshooting 均覆盖。 ✓ 8分。编码、测试、迁移、OpenAPI、CI/CD、deploy checklist 覆盖较全,但运维 runbook 相对较少。
配置/密钥/环境变量管理规范 ✓ 7分。有 credentials 路径、敏感值禁入 repo、notary env vars、1Password publish 规则,但信息分散。 ✓ 9分。env vars、required secrets、fallback、deploy 变更影响均明确。

D4 结论: 两者都强。OpenClaw 强在仓库级维护流程,My 强在服务端工程链闭环。

D5 — 安全与合规约束落地性

子项 OpenClaw My
权限校验与数据隔离规则 ✓ 5分。有 SECURITY.md 前置要求、敏感值禁入 repo、外部消息面禁止 partial reply,但核心安全模型较多外置。 ✓ 9分。schema isolation、JWT auth、tenant route pattern、search_path RAC 断言都属于强落地规则。
异常处理 / 日志脱敏 / 数据校验强制规范 ✓ 4分。有高置信回答、不要提交真实值等守则,但缺少系统化异常处理与日志脱敏规范。 ✓ 8分。fail-fast、trusted/untrusted path、ADT errors、logger 级别、RAC 构成较完整闭环。
行业合规编码约束 ✗ 不适用。理由:OpenClaw README 明确为 personal single-user assistant,未声明医疗、金融、政务等行业合规场景。 ✗ 不适用。理由:My 仅声明为 multi-tenant backend service,未声明受监管行业领域。

D5 结论: 如果评估“权限、隔离、数据一致性”的编码安全模型,My 明显领先;OpenClaw 更强的是操作安全与流程安全。

D6 — 规则体系可扩展性与可维护性

子项 OpenClaw My
新增 / 废弃规则的迭代流程 ✓ 5分。有外挂 skill、外链 workflow、AGENTS/CLAUDE 同步要求,但缺少规则自身版本化与废弃机制。 ✓ 4分。更多讲代码如何演进,较少讲规则文件自身如何演进。
目录结构与检索效率 ✓ 7分。section 丰富、关键词可检索,但单文件承载内容过多。 ✓ 8分。结构稳定、feature template 明确、important files 清楚。
规则间一致性与自洽性 ✓ 6分。总体一致,但已出现文件长度 <700 LOC<500 LOC 两套标准。 ✓ 8分。从 type-first 到 typed error 到 RAC 相对自洽,主要问题是过度乐观地信任编译器。
多 Agent 并行安全 ✓ 10分。适用理由:本评测前提即主 Agent + 子 Agent。禁止 stash/autostashworktree、切分支,并规定提交范围和 push 行为。 ✓ 2分。适用理由同左。缺少 Git 状态隔离、文件归属边界、提交范围约束,基本仍是单 Agent 心智模型。

D6 结论: OpenClaw 在多 Agent 仓库协作安全上明显领先;My 在该维度存在明显短板。

Part 3 — 横向对比结论

核心优劣势

OpenClaw

优势:

  • 最懂 AI 在真实仓库中会如何误操作
  • 对 bug-fix 幻觉、发布误操作、多 Agent Git 互踩有成熟护栏
  • 更适合处理 triage、incident 修复、发布前验证、GHSA 和维护运营类任务

短板:

  • 常驻上下文成本高
  • 低频规则常驻过多
  • 编码安全模型相对分散,部分关键规则依赖外部文档

My

优势:

  • 最懂如何让 AI 在强类型后端里持续写对代码
  • 类型系统、错误模型、模块边界和迁移策略高度统一
  • 规则结构化程度高,适合主 Agent 和子 Agent 直接消费

短板:

  • 对编译器过于乐观
  • 缺少 bug-fix 证据化门槛
  • 缺少多 Agent Git 安全协议
  • 缺少高风险操作审批型护栏

适用场景差异

  • 强类型后端、API 服务、模块边界清晰、需要 AI 高频重构的项目:优先参考 My
  • 公开仓库、多维护流程、多发布面、真实运维压力较大的 AI-first 项目:优先参考 OpenClaw

哪份规则对 AI 代理执行友好度更高

  • 仅看“写代码、改代码、局部重构”的执行友好度:My 更高
  • 看“真实项目全流程落地”的执行稳健性:OpenClaw 更稳

落地风险提示

  • OpenClaw 的主要风险是规则过胖,应拆分最小常驻规则集
  • My 的主要风险是协作安全和验证闭环不足,应补多 Agent Git 安全、bug-fix 证据门槛和高风险操作审批

Part 4 — 制定者能力画像对比

能力维度 OpenClaw 制定者 My 制定者
架构设计与技术前瞻性 专家 专家
大型项目工程化管控能力 专家 资深
AI 编码代理认知与应用深度 专家 资深
安全风险体系化防控能力 资深 资深
技术债务治理与可持续演进能力 资深 专家

能力差异总结

  • OpenClaw 制定者更像专家级 maintainer-operator,强项是流程防错、仓库协作安全、发布与安全公告处理
  • My 制定者更像专家级 backend architect,强项是类型驱动设计、模块边界约束、长期演进策略

超出当前项目最低需求但能体现制定者能力的正向证据

  • OpenClaw 明确是 personal single-user assistant,但规则文件补上了成熟的多 Agent Git 安全协议,体现出制定者在 AI 协作安全上的前瞻性
  • My 把 deploy impact reporting 写进规则,要求 Agent 把代码变更映射到 deploy repo 变更,体现出平台级系统工程视角

Part 5 — Agent 适配性分析

对主 Agent

OpenClaw

  • 优势:更适合 issue/PR triage、incident 修复、证据校验、发布预检查、GHSA 处理
  • 不足:编码任务会被大量低频维护规则稀释注意力

My

  • 优势:更适合 feature 骨架设计、跨模块签名重构、typed error 建模、多租户边界设计、增量迁移旧代码
  • 不足:需要额外补仓库协作与高风险操作护栏

对子 Agent

OpenClaw

  • 优势:委托安全性高,多 Agent 并发风险控制成熟
  • 不足:子 Agent 需要承受较多与当前局部任务无关的规则负荷

My

  • 优势:局部理解和局部重构效率高,模块化和结构化程度更适合委托
  • 不足:缺少原生并发协作安全协议

推荐场景

  • 0→1 的强类型后端项目:My
  • 进入多人协作、复杂发布、频繁 triage 阶段的 AI-first 仓库:OpenClaw
  • 成熟大项目的最佳组合:My 负责编码核心约束,OpenClaw 负责验证、发布、协作与高风险流程护栏

Part 6 — AI 诚实自评

选择

如果只能选一份作为新项目 AI 规则模板,我选 My

理由

  • 它更适合构造高信噪比、强结构、易执行的编码规则骨架
  • 它更能降低我在写代码时的结构性错误和歧义成本
  • 它更适合作为主 Agent 和子 Agent 的常驻规则基底

代价

选择 My 后,我会失去 OpenClaw 的三类关键能力:

  • bug-fix 证据门槛
  • 多 Agent Git 并发安全协议
  • 高风险操作的 operator consent 与 runbook 化约束

这意味着项目一旦进入公开协作、频繁发布、线上问题高压期,我会明显更不安。

如果可以从落选文件中补 3 个设计决策

我会从 OpenClaw 补这 3 项到 My:

  1. bug-fix 必须提供 symptom evidence、root cause、implicated code path、regression test 或 manual proof
  2. 多 Agent Git 安全协议:不准 stash、不准乱切分支、不准乱动 worktree、只提交自己的改动
  3. 高风险操作审批机制:依赖 patch、release、publish、GHSA 都需要明确批准和明确 runbook

最终结论

  • OpenClaw 更像 AI 维护作战手册
  • My 更像 AI 强类型后端开发宪法
  • 如果最缺的是“别让 Agent 在真实仓库里闯祸”,优先借鉴 OpenClaw
  • 如果最缺的是“让 Agent 稳定写对代码”,优先借鉴 My
  • 如果要服务 95%+ AI 编码的长期工程实践,最佳方案不是二选一,而是把两者组合:My 做编码骨架,OpenClaw 做验证、协作和高风险流程护栏