Skip to content

规划 BitFun 可配置开发体验与工程治理能力建设 #1136

@limityan

Description

@limityan

背景

AI 编程工具正在从代码补全和单次智能体执行,演进为覆盖理解、修改、验证、审查、发布、运行反馈和复盘的智能体开发体验。BitFun 需要同时服务两类体验:

  • 质量保障要求较低的任务、探索性改动、演示原型和文档改动:默认简洁快速,只给必要提示和轻量结果摘要。
  • 团队协作、核心路径、权限、网络、发布、迁移、合规和受管项目:按配置、风险和阶段逐步显露证据、审查、门禁、风险接受和审计能力。

本 issue 用于长期跟踪该方向,不应因为某个设计文档 PR 合入或关闭而自动关闭。后续 PR 可以关联本 issue,但不使用自动关闭语义。

关键文档

  • 总览:文档入口,说明文档结构、稳定边界和阅读顺序。
  • 产品需求:定义产品定位、用户画像、核心体验路径、产品规格、关键用例与体验增益、平台入口差异和成功指标。
  • 架构设计:承接产品需求,定义领域模型、配置层级、模块边界、BitFun 与 Harness 的边界和架构风险。
  • 实施计划:按 P-1 到 P4 描述阶段交付、验收条件、过程风险和落地顺序。
  • 追踪矩阵:把产品需求、设计承接、功能规格、执行阶段和测试方法连起来,避免关键体验只停留在单份文档中。
  • 配置化策略画像:说明任务意图、操作风险、环境信任度、项目规则、团队策略和用户覆盖如何生成内部策略决策并投影为用户体验。
  • 安全边界:定义 prompt 注入、主动配置、MCP、hook、shell、网络、凭据、跨目录写入和发布凭据等执行安全底线。
  • 指标规格:定义速度、打断、安全提示、PR 就绪度、关键用例验收覆盖率和长期治理指标的口径。

产品定位

BitFun 的默认体验应是面向任意目标项目的快速智能体开发:先帮助用户更快理解、修改、运行和交付;当任务、权限、发布链路、团队规则或合规要求变复杂时,通过配置化策略升级到上下文保障、团队治理或合规 / 发布体验。

Harness 作为内部术语边界,用于指代受控执行、证据校验、风险分级、策略约束、审查投影和评测回放等支撑能力。项目画像、交付物图谱、质量数据面、证据包和评测系统应服务于产品体验,并按 PR、团队、发布、事故或合规场景显露。

用户画像

  • 快速试验者:无配置启动,直接完成低风险任务;质量建议可跳过,安全边界常驻。
  • 独立开发者:复用 README、脚本和仓库规则;重点展示未验证项、信心摘要和下一步建议。
  • 团队开发者 / 审查人:准备 PR 或进入团队规则时展示就绪度、规则来源和风险接受入口。
  • 技术负责人 / 架构师:关注核心路径、接口、迁移、发布影响、影响候选和风险接受。
  • 安全 / 合规负责人:在受管场景保留审计、批准、发布和回滚证据;组织策略高于本地覆盖。
  • 平台 / 插件维护者:管理 hook、plugin、MCP、自定义工具、工具复写和远程执行面;主动配置先作为未授权候选。

用户画像用于选择默认入口、解释语言和提示密度。用户侧不直接学习内部策略枚举;体验呈现聚焦任务状态、弱提示、确认、受限原因、设置项和下一步。

核心原则

  • 默认快速:没有明确信号时,普通任务使用轻量项目理解、结果摘要、推荐检查和未验证项提示。
  • 配置驱动:项目、路径、团队、用户偏好和当前任务共同决定策略画像,项目级配置只是默认值之一。
  • 风险升级:核心路径、权限、网络、凭据、数据迁移、发布、团队 PR 或证据过期时,提供上下文保障、验证建议和残余风险说明。
  • 高可靠治理可配置:深度审查、强制检查、风险接受和审计由项目/组织配置、受保护分支、合规要求或用户显式选择启用。
  • 安全独立:prompt 注入、恶意 hook、MCP、网络、凭据、跨目录写入、删除和发布凭据等执行安全风险始终受安全边界管理。
  • 用户可决策:允许单次、会话、任务或 worktree 范围的临时放行,但必须有范围、期限、后果说明、残余风险和撤销路径;组织拒绝策略和受管强制策略保持更高优先级。
  • 规则按作用域生效:复杂性可能来自路径、任务阶段、团队规则、外部工具、远程环境、发布链路或当前用户意图。
  • 证据先于结论:门禁、审查、发布就绪度或影响分析必须能追溯到证据;模型输出作为候选和解释,状态变化由确定性证据、用户决策和策略触发。
  • 体验指标同等重要:同时看首次有用动作耗时、打断率、误升级率、提示噪音、安全确认质量、关键用例验收覆盖率和用户覆盖后的后果,并按用户画像切片。

主要风险

  • 默认流程过重,导致质量保障要求较低的任务、探索性改动和文档改动被重治理劝退。
  • 执行安全与质量治理混在一起,导致安全底线被快速路径或质量建议降噪影响。
  • 过早暴露证据包、交付物图谱或质量数据面,让用户学习内部术语才能完成普通任务。
  • 把项目级配置当成唯一事实,忽略路径级规则、当前任务意图、快速修复、热修复、私有 CI、远程工作区和多仓库场景。
  • 主动配置风险:hook、plugin、MCP server、自定义工具和智能体规则会把项目配置转化为执行面,需要来源、hash/version、权限声明、超时、禁用路径和审计。
  • prompt 注入、恶意文档、恶意 issue、被修改的规则文件或工具描述污染策略来源。
  • 人工覆盖和应急放行缺少范围、期限和残余风险,导致自动化结论被误认为已验证事实。
  • 关键用例只停留在抽象原则,没有可回放用例、预期交互、用户收益和验收口径。
  • 评测数据污染:公开 benchmark、内部 golden set、私有 holdout 和线上回放混用后削弱策略评估可信度。

关键里程碑

  • M0:产品和架构边界可执行。定义用户画像、快速路径、上下文保障、团队治理、合规 / 发布体验、安全动作、配置优先级和关键用例清单。
  • M1:轻量项目画像可用。优先读取 AGENTS.md、CONTRIBUTING、CI、CODEOWNERS、包脚本和路径规则,支持未知、冲突、过期规则的解释。
  • M2:风险与策略分类可解释。输出风险原因、推荐检查、必需检查、用户覆盖选项、安全动作和策略来源。
  • M3:变更就绪度 / 可选 PR 门禁可用。默认输出简洁 PR 信心摘要;受管配置、受保护分支、组织策略或用户显式选择时进入强门禁。
  • M4:证据包、质量数据面和交付物图谱后台化。支撑审查、发布、事故和复盘,快速路径保留轻量摘要。
  • M5:团队治理和生命周期上下文接入。支持需求、PR、发布、事故、回滚和学习资产的追溯,同时保留低摩擦默认体验。
  • M6:长期评测闭环可运行。基于评测卡、数据血缘、holdout、轨迹回放、成本、安全和体验指标评估策略变化。

Metadata

Metadata

Assignees

Labels

No labels
No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions