GKCLAW · TECHNICAL DESIGN

GKclaw 智能问答 Agent 技术方案

本方案基于既有 v4/v5 文档沉淀，目标是在现有业务系统中构建可控、可追踪、可扩展的智能问答能力。设计重点是把“可确定逻辑”收回系统，把“不确定推理”限定在可校验边界内，保障线上稳定性与可解释性。

Rule First Evidence Driven Single Output Gate Traceable Runtime

1. 技术背景

context

现状约束

用户表达经常跨越“查卷、追问、批改”等多个意图，单轮路由难以覆盖。
0 结果时缺少结构化降级，导致可用性断层。
能力调用跨数据库与中台接口，失败类型不统一、排障链路不完整。

方案演进依据

v4 提供了可施工的分层与 LangGraph 循环骨架。
评估文档识别了循环、注入、职责混用、trace 缺失等高风险点。
v5 引入规则优先、标准 Observation、TTL 内存时效控制与可观测增强。

2. 技术原理

principles

核心机制

采用“规则层优先 + LLM 决策补位 + 能力层执行 + 统一输出门”的闭环。 LLM 只负责动作决策，不直接生成事实，不直接访问数据库。

Planner 仅决策 Capability 仅执行 Responder 统一输出

数据与状态约束

AgentState: conversationState workingMemory(ttl) focusObject latestObservation trace_id / session_id / turn_id loop_count 双层循环保护: LangGraph recursion_limit = 15 业务阈值 loop_count > 8 强制收敛

3. 解决痛点

pain points

痛点 A：0 结果即失败

处理方式：将降级从硬编码改为策略引擎，按约束递减自动探测候选结果，返回可解释建议。

结果：从“直接失败”变为“有候选、有解释、有下一步”。

痛点 B：模型输出不稳定

处理方式：结构化动作协议 + 参数白名单校验 + 非法动作回退到澄清路径。

结果：输出可验证、行为可控，降低幻觉导致的错误执行。

痛点 C：异常导致主流程中断

处理方式：Capability 层统一超时/重试/熔断，异常转为 Observation，不允许裸异常穿透。

结果：主链路连续性提升，错误可追踪可恢复。

痛点 D：问题难复现

处理方式：trace_id + turn_id 贯穿节点，记录动作、参数摘要、耗时与错误码。

结果：任一异常可按链路回放，定位效率显著提升。

4. 方案架构（图）

architecture diagram

主链路：规则未命中后进入 Planner 虚线：快速路径与重规划路径最终输出统一由 Responder 生成

5. 补充：安全与运行边界

supplement

输入与执行安全

Prompt 输入只接收结构化序列化数据，禁止字符串裸拼接。
Repository 参数白名单校验，LLM 不可直接写 SQL。
能力执行统一错误矩阵：timeout / 4xx / 5xx / unknown。

可观测与质量基线

必备字段：trace_id、turn_id、action、latency、error_type。
规则命中率异常下跌需触发告警（可能规则失效）。
循环次数接近上限需告警并触发收敛策略。