GKCLAW · TECHNICAL DESIGN

GKclaw 智能问答 Agent 技术方案

本方案基于既有 v4/v5 文档沉淀,目标是在现有业务系统中构建可控、可追踪、可扩展的智能问答能力。 设计重点是把“可确定逻辑”收回系统,把“不确定推理”限定在可校验边界内,保障线上稳定性与可解释性。

Rule First Evidence Driven Single Output Gate Traceable Runtime

1. 技术背景

context

现状约束

  • 用户表达经常跨越“查卷、追问、批改”等多个意图,单轮路由难以覆盖。
  • 0 结果时缺少结构化降级,导致可用性断层。
  • 能力调用跨数据库与中台接口,失败类型不统一、排障链路不完整。

方案演进依据

  • v4 提供了可施工的分层与 LangGraph 循环骨架。
  • 评估文档识别了循环、注入、职责混用、trace 缺失等高风险点。
  • v5 引入规则优先、标准 Observation、TTL 内存时效控制与可观测增强。

2. 技术原理

principles

核心机制

采用“规则层优先 + LLM 决策补位 + 能力层执行 + 统一输出门”的闭环。 LLM 只负责动作决策,不直接生成事实,不直接访问数据库。

Planner 仅决策 Capability 仅执行 Responder 统一输出

数据与状态约束

AgentState: conversationState workingMemory(ttl) focusObject latestObservation trace_id / session_id / turn_id loop_count 双层循环保护: LangGraph recursion_limit = 15 业务阈值 loop_count > 8 强制收敛

3. 解决痛点

pain points

痛点 A:0 结果即失败

处理方式:将降级从硬编码改为策略引擎,按约束递减自动探测候选结果,返回可解释建议。

结果:从“直接失败”变为“有候选、有解释、有下一步”。

痛点 B:模型输出不稳定

处理方式:结构化动作协议 + 参数白名单校验 + 非法动作回退到澄清路径。

结果:输出可验证、行为可控,降低幻觉导致的错误执行。

痛点 C:异常导致主流程中断

处理方式:Capability 层统一超时/重试/熔断,异常转为 Observation,不允许裸异常穿透。

结果:主链路连续性提升,错误可追踪可恢复。

痛点 D:问题难复现

处理方式:trace_id + turn_id 贯穿节点,记录动作、参数摘要、耗时与错误码。

结果:任一异常可按链路回放,定位效率显著提升。

4. 方案架构(图)

architecture diagram
User Input Rule Engine Planner Capability Repository / External API Observation Responder rule hit fast path observe -> replan
主链路:规则未命中后进入 Planner 虚线:快速路径与重规划路径 最终输出统一由 Responder 生成

5. 补充:安全与运行边界

supplement

输入与执行安全

  • Prompt 输入只接收结构化序列化数据,禁止字符串裸拼接。
  • Repository 参数白名单校验,LLM 不可直接写 SQL。
  • 能力执行统一错误矩阵:timeout / 4xx / 5xx / unknown。

可观测与质量基线

  • 必备字段:trace_id、turn_id、action、latency、error_type。
  • 规则命中率异常下跌需触发告警(可能规则失效)。
  • 循环次数接近上限需告警并触发收敛策略。