Plan-and-Execute Agent：从”知道”到”理解”#

学完 Plan-and-Execute 之后，我能说出大致的思想和实现，但如果再往深挖一层，追问具体的设计理由、实现细节，我就卡壳。这篇文章是我尝试把模糊的理解变成清晰认知的过程——用一个真实任务走完全部代码，把每个”为什么这样做”都讲透。

我的困惑#

学了两遍 Plan-and-Execute，我发现自己处于一种”似懂非懂”的状态：

我知道整体是”先规划后执行”，但具体数据怎么在模块之间流转，说不清
我知道拓扑排序和两遍扫描，但为什么要这样设计，说不清
我知道有 replan 机制，但 50% 这个阈值的完整理由链，说不清
我知道每个 Task 执行要调 LLM，但为什么需要循环、循环里到底发生了什么，说不清
我知道最终要返回结果，但为什么取叶子节点，说不清

根本原因：我在跟着 Java 版代码实现，缺少对设计决策背后”为什么”的思考。 下面的内容是我尝试补上这一课的记录。

用一个真实任务走完全部代码#

用户输入：“读取 config.json，分析里面的数据库配置，然后写一份分析报告到 report.txt”

我用这个任务，从第一行代码走到最后一行，把每一步发生了什么、为什么这样设计，都展开讲清楚。

第一步：为什么分离规划与执行#

代码入口：

1
def run(self, goal: str) -> str:
2
    return self._run_with_plan(goal)

注意：这里没有判断复杂度。旧版本有一个 _should_plan() 方法，靠关键词计数决定走规划还是走简单模式，但最新版删掉了。为什么？

两个原因。第一，判断不准——用户说”帮我看看这个文件”只有 4 个字，但可能需要多步操作；用户说”创建一个 Spring Boot 项目”只有一个关键词，但其实是复杂任务。第二，职责混乱——“用什么模式”是用户的事，不是 Agent 的事，应该由 CLI 层的 /plan 命令来决定。

面试答法：ReAct 是边推理边执行，碰到复杂任务会出现两个结构性缺陷——上下文窗口爆炸导致遗忘目标，以及无法利用独立步骤的并行性。Plan-Execute 通过先拆解再执行解决这两个问题。代价是多一次规划调用，且规划质量决定上限。

第二步：为什么用 LLM 拆任务而不用规则#

1
def create_plan(self, goal: str) -> ExecutionPlan:
2
    messages = [
3
        Message.system(PLANNING_PROMPT),
4
        Message.user(f"请为以下任务制定执行计划：\n{goal}"),
5
    ]
6
    response = self._llm.chat(messages)   # 注意：没有传 tools
7
    return self._parse_plan(goal, response.content or "")

为什么不能写 if-else 来拆任务？因为用户的输入是自然语言——“帮我读一下 main.py 然后分析结构再写个总结文件”，这种话你写规则拆不开。只有 LLM 能理解语义，判断哪些步骤是独立的、哪些有先后。

但 LLM 输出不稳定，所以 PLANNING_PROMPT 做了三件事来约束：

限定任务类型（只有 FILE_READ / FILE_WRITE / COMMAND / ANALYSIS / VERIFICATION 五种），不让 LLM 自由发挥
给定 JSON schema，要求按固定格式输出
规定”只输出 JSON”，减少废话干扰解析

还有一个细节：这里调 LLM 没有传 tools 参数。规划是纯文本生成，不需要调用工具。

LLM 返回的 JSON：

1
{
2
    "summary": "读取配置文件并分析数据库配置",
3
    "tasks": [
4
        {"id": "task_1", "description": "读取 config.json 文件", "type": "FILE_READ", "dependencies": []},
5
        {"id": "task_2", "description": "分析数据库配置信息", "type": "ANALYSIS", "dependencies": ["task_1"]},
6
        {"id": "task_3", "description": "写分析报告到 report.txt", "type": "FILE_WRITE", "dependencies": ["task_2"]}
7
    ]
8
}

第三步：两遍扫描——为什么是容错设计#

_parse_plan() 拿到 JSON 后，不是一遍搞定，而是分两遍：

第一遍：创建所有 Task 对象

1
id_mapping: dict[str, str] = {}
2
for i, task_node in enumerate(tasks_data, 1):
3
    original_id = task_node.get("id", f"task_{i}")   # LLM 给的 id
4
    new_id = f"task_{i}"                              # 统一映射
5
    id_mapping[original_id] = new_id
6

7
    plan.add_task(Task(id=new_id, description=..., type=...))

为什么需要 id_mapping？LLM 给的 id 不可控，可能是 read_config、step1、分析任务，需要统一映射成 task_1, task_2。而且 LLM 可能在 dependencies 里写的 id 和实际的 id 对不上，映射表来对齐。

走完第一遍，三个 Task 对象都建好了，但 dependencies 和 dependents 都是空的。

第二遍：处理依赖关系

1
for i, task_node in enumerate(tasks_data, 1):
2
    for dep_id in task_node.get("dependencies", []):
3
        mapped = id_mapping.get(dep_id, dep_id)
4
        if plan.get_task(mapped) is not None:
5
            task.dependencies.append(mapped)
6
            dep_task = plan.get_task(mapped)
7
            dep_task.dependents.append(new_id)

为什么不能一遍搞定？因为 LLM 可能写出前向引用——task_2 依赖 task_3，而 task_3 在 JSON 里排在 task_2 后面。遍历到 task_2 时 task_3 还没创建，依赖关系就连不上。第一遍先全部创建，第二遍再连边，不管 LLM 怎么排都能正确解析。

两遍扫描本质上是容错设计：不是假设 LLM 的输出一定按顺序排列，而是不管它怎么排都能处理。如果直接在遇到前向引用时报错，用户体验很差——LLM 稍微调整一下顺序就好了，但你让用户重新跑一遍。

走完第二遍的内存状态：

1
task_1: dependencies=[],          dependents=["task_2"]
2
task_2: dependencies=["task_1"],  dependents=["task_3"]
3
task_3: dependencies=["task_2"],  dependents=[]

这就是一个 DAG（有向无环图）的双向邻接表。

第四步：拓扑排序——为什么保证执行顺序#

1
if not plan.compute_execution_order():
2
    raise ValueError("计划中存在循环依赖")

拓扑排序用的是 DFS + 两个集合（visiting 和 visited），走一遍具体过程：

1
处理 task_1:
2
  visiting = {task_1}
3
  task_1 没有依赖 → 不递归
4
  visiting 移除 task_1, visited 加入 task_1
5
  execution_order = [task_1]
6

7
处理 task_2:
8
  visiting = {task_2}
9
  依赖 task_1 → task_1 已在 visited → 跳过
10
  visiting 移除 task_2, visited 加入 task_2
11
  execution_order = [task_1, task_2]
12

13
处理 task_3:
14
  visiting = {task_3}
15
  依赖 task_2 → task_2 已在 visited → 跳过
16
  visiting 移除 task_3, visited 加入 task_3
17
  execution_order = [task_1, task_2, task_3]

两个集合各司其职：

visiting：当前 DFS 路径上的节点，用来检测环——如果同一个节点在递归栈里出现两次，就是环
visited：所有已处理完的节点，用来避免重复处理

时间复杂度 O(V+E)，每个节点访问一次，每条依赖边检查一次。

第五步：执行计划——逐个跑 Task#

1
def _execute_plan(self, goal, plan):
2
    for task_id in plan.execution_order:        # [task_1, task_2, task_3]
3
        task = plan.get_task(task_id)
4

5
        tasks_map = {t.id: t for t in plan.all_tasks}
6
        if not task.is_executable(tasks_map):   # 所有依赖都 COMPLETED 了吗？
7
            task.mark_skipped()
8
            continue
9

10
        task.mark_started()
11
        result = self._execute_task(goal, plan, task)
12
        task.mark_completed(result)

is_executable() 的判断逻辑：自己必须是 PENDING + 所有依赖必须 COMPLETED。如果依赖是 FAILED 或 SKIPPED，当前任务永远不会变可执行，最终也被跳过。

执行 task_1（FILE_READ：读取 config.json）#

_execute_task() 现在有一个 ReAct 循环（MAX_TASK_ITERATIONS = 5），这是最新版本的关键改进。

先构建上下文：

1
prompt = EXECUTION_PROMPT.format(type="FILE_READ", desc="读取 config.json 文件")
2
messages = [
3
    Message.system(prompt),
4
    Message.user(self._build_task_context(goal, plan, task)),
5
]

_build_task_context 生成的 user message：

1
总目标：读取 config.json，分析数据库配置，然后写一份分析报告到 report.txt
2
当前任务：读取 config.json 文件
3
依赖任务：无
4
请执行此任务。

进入循环：

1
第 1 轮：
2
  LLM 返回 → tool_calls: [{name: "read_file", args: {"path": "config.json"}}]
3
  → messages.append(assistant(tool_calls))    # 记录 LLM 的决策
4
  → 执行 read_file → result = "文件内容:\n{\"db\": {\"host\": \"localhost\"...}}"
5
  → all_results.append(result)                # 累积结果
6
  → messages.append(tool_result(tc.id, result))  # 结果回灌给 LLM
7

8
第 2 轮：
9
  LLM 看到文件内容了，不需要再调工具
10
  → has_tool_calls() == False
11
  → return response.content    // "已成功读取 config.json"

为什么一个任务需要多轮？ 如果只调一次 LLM，LLM 调了 read_file 拿到内容就返回了——它没有机会基于文件内容做任何后续操作。加了循环之后，第一轮读文件 → 结果回灌 messages → 第二轮 LLM 看到内容，给出确认或继续操作。

messages 和 all_results 各自的作用：

messages：当前任务的对话历史，让 LLM 在多轮之间保持上下文连续性
all_results：所有工具调用的结果累积器，即使循环跑满了 5 次上限，也能把已收集的结果返回

为什么上限是 5？大多数任务 2-3 轮就够了，设太高浪费 Token 和时间，设太低复杂任务完不成。5 是安全余量。

执行 task_2（ANALYSIS：分析数据库配置）#

_build_task_context 这回有依赖了：

1
总目标：读取 config.json，分析数据库配置，然后写一份分析报告到 report.txt
2
当前任务：分析数据库配置信息
3
依赖任务结果：
4
- task_1 / 读取 config.json 文件 / 状态=COMPLETED
5
  文件内容:\n{"db": {"host": "localhost"...}}
6
请执行此任务。如果是ANALYSIS类型，请基于以上上下文直接给出结果。

关键点：task_1 的 result 被塞进了上下文。LLM 能直接看到文件内容，不需要再调 read_file 工具。

1
第 1 轮：
2
  LLM 返回 → content: "数据库配置分析：host 为 localhost，端口 3306..."
3
  → has_tool_calls() == False
4
  → return response.content

这就是 ANALYSIS 类型不需要工具的原因：上下文里已经有所需信息了，LLM 直接分析输出。EXECUTION_PROMPT 里有一句”如果是ANALYSIS或VERIFICATION类型任务，请直接输出分析结果”，就是这个作用。

执行 task_3（FILE_WRITE：写分析报告）#

和 task_1 类似，LLM 调 write_file 工具，结果回灌，下一轮确认写入成功后返回。

第六步：为什么取叶子节点作为最终结果#

所有任务执行完后：

1
def _build_final_result(plan):
2
    leaf_results = [t.result for t in plan.all_tasks if not t.dependents and t.result]

遍历所有任务找叶子节点（没有 dependents 的任务）：

task_1: dependents=[“task_2”] → 不是叶子
task_2: dependents=[“task_3”] → 不是叶子
task_3: dependents=[] → 是叶子

为什么只返回叶子节点？因为中间任务的结果已经被后续任务消费了。用户不需要看到 task_1 的”文件内容是 ABC”，也不需要看到 task_2 的”分析结论是 XYZ”——task_3 的”已成功写入报告”就是最终产出。取叶子节点就是在说”只给用户看最终结果，中间过程已经消费掉了”。

兜底逻辑（reversed(plan.all_tasks)）是防万一：如果所有任务都有 dependents（理论上不应该发生），就取最后一个有结果的。

第七步：失败重规划——50% 阈值的成本收益#

1
except Exception as e:
2
    task.mark_failed(str(e))
3
    if plan.progress < 0.5:
4
        replanned = self._planner.replan(plan, str(e))
5
        return self._execute_plan(goal, replanned)
6
    final_parts.append(f"任务 {task_id} 失败: {e}")

plan.progress = 已完成任务数 / 总任务数。50% 是”半程线”。

为什么不是 20% 或 80%？

如果阈值 20%（只完成不到 20% 才 replan）：太激进了，完成 25% 时规划已经明显有问题了但不 replan，浪费后续执行
如果阈值 80%（完成不到 80% 都 replan）：太保守了，完成 70% 时 replan 等于丢弃了之前几十次 LLM 调用的成果，Token 白白浪费
50% 是折中：完成不到一半说明规划本身有问题，值得重来；超过一半说明大部分任务是对的，带伤跑完比重来更划算

replan() 做了什么？把失败原因和已完成任务的描述喂给 LLM，重新调一次 create_plan()。本质上是用新的上下文重新走一遍”规划 → 解析 → 排序 → 执行”的完整流程。

全景图#

把上面的流程压缩成一张数据流图，这就是 Plan-and-Execute 的完整设计全景：

1
用户: "读取 config.json，分析数据库配置，写报告到 report.txt"
2
  │
3
  ▼
4
Planner.create_plan(goal)
5
  │
6
  ├─ 调 LLM（不带工具，纯文本生成）→ 拿回 JSON 字符串
7
  │
8
  ├─ _parse_plan():
9
  │   ├─ 第一遍：建 Task 对象 + id_mapping（容错：不管 LLM 怎么排都能建出来）
10
  │   ├─ 第二遍：连 dependencies + dependents（双向邻接表）
11
  │   └─ compute_execution_order() → DFS 拓扑排序（visiting 检测环，visited 防重复）
12
  │
13
  ▼
14
ExecutionPlan {
15
  execution_order: [task_1, task_2, task_3]
16
  task_1: type=FILE_READ,  deps=[],        result=null
17
  task_2: type=ANALYSIS,   deps=[task_1],  result=null
18
  task_3: type=FILE_WRITE, deps=[task_2],  result=null
19
}
20
  │
21
  ▼
22
_execute_plan() 逐个执行:
23
  │
24
  ├─ task_1 (FILE_READ):
25
  │   _execute_task():
26
  │     build context → 调 LLM(带工具) → read_file → 结果回灌 messages → 再调 LLM → 完成
27
  │   task_1.result = "文件内容..."
28
  │
29
  ├─ task_2 (ANALYSIS):
30
  │   _execute_task():
31
  │     build context（塞了 task_1.result）→ 调 LLM → 直接输出分析 → 完成
32
  │   task_2.result = "分析：数据库配置..."
33
  │
34
  ├─ task_3 (FILE_WRITE):
35
  │   _execute_task():
36
  │     build context（塞了 task_2.result）→ 调 LLM(带工具) → write_file → 结果回灌 → 完成
37
  │   task_3.result = "已写入报告"
38
  │
39
  ▼
40
_build_final_result():
41
  找叶子节点（没有 dependents 的任务）→ task_3
42
  返回 task_3.result 给用户

八个设计决策的完整总结#

设计决策	为什么这样做	不这样做的后果
分离规划与执行	ReAct 对复杂任务会遗忘目标、无法并行	多一次 LLM 调用的成本
用 LLM 拆任务	自然语言的任务分解需要语义理解，规则搞不定	输出不稳定，需要 schema 约束
两遍扫描解析	前向引用——task_2 可能依赖还没创建的 task_3	一遍扫描会丢失依赖关系
拓扑排序	保证执行顺序正确，同时检测循环依赖	环依赖导致无限循环
Task 内 ReAct 循环	单个任务可能需要多轮工具调用（读文件→分析→确认）	只调一次 LLM 的话，工具执行完没有机会做后续操作
replan 阈值 50%	完成不到一半说明规划有问题，超过一半带伤跑完更划算	阈值太高浪费 Token，太低会错过需要 replan 的时机
取叶子节点作为最终结果	中间任务的结果已被后续消费，用户只关心最终产出	返回中间过程信息，干扰用户理解
删掉 _should_plan	判断不准 + 职责不在 Agent（模式选择归 CLI 层）	Agent 职责不清晰
最小上下文策略	只塞直接依赖的 result，省 Token	可能丢失间接依赖的信息

附录#

附录 A：plan_execute_agent.py（最新版）#

plan_execute_agent.py（158 行）

1
"""Plan-and-Execute Agent — 先规划后执行。"""
2
from __future__ import annotations
3

4
from paicli.llm.client import LlmClient, Message
5
from paicli.llm import debug_logger
6
from paicli.plan.planner import Planner
7
from paicli.plan.task import Task, TaskStatus
8
from paicli.tool.registry import ToolRegistry
9

10
EXECUTION_PROMPT = """你是一个任务执行专家。请根据当前任务和上下文，选择合适的工具或生成回复。
11

12
当前任务类型：{type}
13
任务描述：{desc}
14

15
可用工具：
16
1. read_file - 读取文件内容，参数：{{"path": "文件路径"}}
17
2. write_file - 写入文件内容，参数：{{"path": "文件路径", "content": "内容"}}
18
3. execute_command - 执行命令，参数：{{"command": "命令"}}
19
4. create_project - 创建项目，参数：{{"name": "名称", "type": "java|python|node"}}
20

21
如果是ANALYSIS或VERIFICATION类型任务，请直接输出分析结果，不需要调用工具。
22

23
请用中文回复。"""
24

25
MAX_TASK_ITERATIONS = 5
26

27

28
class PlanExecuteAgent:
29
    """Plan-and-Execute Agent — 复杂任务分解后执行。"""
30

31
    def __init__(self, llm_client: LlmClient) -> None:
32
        self._llm = llm_client
33
        self._tools = ToolRegistry()
34
        self._planner = Planner(llm_client)
35

36
    def run(self, goal: str) -> str:
37
        """运行任务：规划 → 执行。"""
38
        try:
39
            return self._run_with_plan(goal)
40
        except Exception as e:
41
            debug_logger.generate_html_report()
42
            return f"❌ 执行失败: {e}"
43

44
    def _run_with_plan(self, goal: str) -> str:
45
        plan = self._planner.create_plan(goal)
46
        return self._execute_plan(goal, plan)
47

48
    def _execute_plan(self, goal: str, plan) -> str:
49
        print(plan.visualize())
50
        print("🚀 开始执行计划...\n")
51

52
        plan.mark_started()
53
        final_parts: list[str] = []
54

55
        for task_id in plan.execution_order:
56
            task = plan.get_task(task_id)
57
            if task is None:
58
                continue
59

60
            tasks_map = {t.id: t for t in plan.all_tasks}
61
            if not task.is_executable(tasks_map):
62
                print(f"⏭️ 跳过任务（依赖未完成）: {task_id}")
63
                task.mark_skipped()
64
                continue
65

66
            print(f"▶️ 执行任务: {task.description}")
67
            task.mark_started()
68

69
            try:
70
                result = self._execute_task(goal, plan, task)
71
                task.mark_completed(result)
72
                preview = result[:100] + ("..." if len(result) > 100 else "")
73
                print(f"✅ 完成: {preview}\n")
74

75
            except Exception as e:
76
                task.mark_failed(str(e))
77
                print(f"❌ 失败: {e}\n")
78

79
                if plan.progress < 0.5:
80
                    print("🔄 尝试重新规划...\n")
81
                    replanned = self._planner.replan(plan, str(e))
82
                    return self._execute_plan(goal, replanned)
83
                final_parts.append(f"任务 {task_id} 失败: {e}")
84

85
        if not final_parts:
86
            final_parts.append(self._build_final_result(plan))
87

88
        if plan.has_failed:
89
            plan.mark_failed()
90
            debug_logger.generate_html_report()
91
            return "⚠️ 计划部分完成，有任务失败。\n" + "\n".join(final_parts)
92

93
        plan.mark_completed()
94
        debug_logger.generate_html_report()
95
        return "✅ 计划执行完成！\n" + "\n".join(final_parts)
96

97
    def _execute_task(self, goal: str, plan, task: Task) -> str:
98
        """执行单个任务：多轮工具调用循环（类似 ReAct）。"""
99
        prompt = EXECUTION_PROMPT.format(type=task.type.value, desc=task.description)
100
        messages: list[Message] = [
101
            Message.system(prompt),
102
            Message.user(self._build_task_context(goal, plan, task)),
103
        ]
104

105
        all_results: list[str] = []
106

107
        for iteration in range(MAX_TASK_ITERATIONS):
108
            response = self._llm.chat(messages, tools=self._tools.get_tool_definitions())
109

110
            if not response.has_tool_calls():
111
                if all_results and not (response.content or "").strip():
112
                    return "\n".join(all_results).strip()
113
                return response.content or ""
114

115
            messages.append(Message.assistant(content=response.content, tool_calls=response.tool_calls))
116

117
            for tc in response.tool_calls:
118
                tool_name = tc.function.name
119
                print(f"   🔧 调用工具: {tool_name}")
120
                result = self._tools.execute_tool(tc.function.name, tc.function.arguments)
121
                debug_logger.log_tool_result(self._llm._call_id, tc.function.name, tc.function.arguments, result)
122
                all_results.append(result)
123
                messages.append(Message.tool_result(tc.id, result))
124

125
        return "\n".join(all_results).strip()
126

127
    @staticmethod
128
    def _build_task_context(goal: str, plan, task: Task) -> str:
129
        parts = [f"总目标：{goal}", f"当前任务：{task.description}"]
130
        if task.dependencies:
131
            parts.append("依赖任务结果：")
132
            for dep_id in task.dependencies:
133
                dep = plan.get_task(dep_id)
134
                if dep is None:
135
                    continue
136
                parts.append(f"- {dep.id} / {dep.description} / 状态={dep.status.value}")
137
                if dep.result:
138
                    parts.append(dep.result)
139
        else:
140
            parts.append("依赖任务：无")
141
        parts.append("请执行此任务。如果是ANALYSIS或VERIFICATION类型，请基于以上上下文直接给出结果。")
142
        return "\n".join(parts)
143

144
    @staticmethod
145
    def _build_final_result(plan) -> str:
146
        leaf_results = [
147
            t.result for t in plan.all_tasks
148
            if not t.dependents and t.result
149
        ]
150
        if leaf_results:
151
            return "\n".join(leaf_results)
152
        last = next((t.result for t in reversed(plan.all_tasks) if t.result), None)
153
        return last or ""

附录 B：planner.py#

planner.py（137 行）

1
"""规划器 — 使用 LLM 将复杂任务分解为执行计划。"""
2
from __future__ import annotations
3

4
import json
5
import re
6
import time
7

8
from paicli.llm.client import LlmClient, Message
9
from paicli.plan.task import Task, TaskType
10
from paicli.plan.execution_plan import ExecutionPlan
11

12
PLANNING_PROMPT = """你是一个任务规划专家。请将用户的复杂任务分解为一系列可执行的子任务。
13

14
可用任务类型：
15
- FILE_READ: 读取文件内容
16
- FILE_WRITE: 写入文件内容
17
- COMMAND: 执行Shell命令
18
- ANALYSIS: 分析结果并做出决策
19
- VERIFICATION: 验证结果是否正确
20

21
请按以下JSON格式输出执行计划：
22
{
23
    "summary": "任务摘要",
24
    "tasks": [
25
        {
26
            "id": "task_1",
27
            "description": "任务描述",
28
            "type": "FILE_READ",
29
            "dependencies": []
30
        },
31
        {
32
            "id": "task_2",
33
            "description": "任务描述",
34
            "type": "FILE_WRITE",
35
            "dependencies": ["task_1"]
36
        }
37
    ]
38
}
39

40
规则：
41
1. 每个任务必须有唯一的id（如 task_1, task_2）
42
2. dependencies列出依赖的任务id
43
3. 任务应该按执行顺序排列
44
4. 任务描述要具体明确
45
5. 复杂任务拆分为5-10个子任务
46

47
只输出JSON，不要有其他内容。"""
48

49

50
class Planner:
51
    """使用 LLM 将复杂任务分解为 ExecutionPlan。"""
52

53
    def __init__(self, llm_client: LlmClient) -> None:
54
        self._llm = llm_client
55

56
    def create_plan(self, goal: str) -> ExecutionPlan:
57
        print(f"📋 正在规划任务: {goal}\n")
58
        messages = [
59
            Message.system(PLANNING_PROMPT),
60
            Message.user(f"请为以下任务制定执行计划：\n{goal}"),
61
        ]
62
        response = self._llm.chat(messages)
63
        return self._parse_plan(goal, response.content or "")
64

65
    def replan(self, failed_plan: ExecutionPlan, failure_reason: str) -> ExecutionPlan:
66
        print(f"🔄 重新规划，原因: {failure_reason}\n")
67
        context_parts = [
68
            f"原任务: {failed_plan.goal}",
69
            f"失败原因: {failure_reason}",
70
            "已完成的任务:",
71
        ]
72
        for task in failed_plan.all_tasks:
73
            if task.status == TaskStatus.COMPLETED:
74
                context_parts.append(f"- {task.id}: {task.description}")
75
        context_parts.append("\n请制定新的执行计划，避开之前的问题。")
76
        return self.create_plan("\n".join(context_parts))
77

78
    def _parse_plan(self, goal: str, plan_json: str) -> ExecutionPlan:
79
        cleaned = re.sub(r"```json\s*", "", plan_json)
80
        cleaned = re.sub(r"```\s*", "", cleaned).strip()
81

82
        data = json.loads(cleaned)
83
        summary = data.get("summary", "")
84
        tasks_data = data.get("tasks", [])
85

86
        plan = ExecutionPlan(f"plan_{int(time.time() * 1000)}", goal)
87
        plan.summary = summary
88

89
        # 第一遍：创建任务（不处理依赖，因为可能有前向引用）
90
        id_mapping: dict[str, str] = {}
91
        for i, task_node in enumerate(tasks_data, 1):
92
            original_id = task_node.get("id", f"task_{i}")
93
            new_id = f"task_{i}"
94
            id_mapping[original_id] = new_id
95

96
            description = task_node.get("description", "")
97
            type_str = task_node.get("type", "ANALYSIS")
98
            task_type = self._parse_task_type(type_str)
99

100
            plan.add_task(Task(id=new_id, description=description, type=task_type))
101

102
        # 第二遍：处理依赖关系
103
        for i, task_node in enumerate(tasks_data, 1):
104
            new_id = f"task_{i}"
105
            task = plan.get_task(new_id)
106
            if task is None:
107
                continue
108

109
            for dep_id in task_node.get("dependencies", []):
110
                mapped = id_mapping.get(dep_id, dep_id)
111
                if plan.get_task(mapped) is not None:
112
                    task.dependencies.append(mapped)
113
                    dep_task = plan.get_task(mapped)
114
                    if dep_task is not None and new_id not in dep_task.dependents:
115
                        dep_task.dependents.append(new_id)
116

117
        if not plan.compute_execution_order():
118
            raise ValueError("计划中存在循环依赖")
119

120
        return plan
121

122
    @staticmethod
123
    def _parse_task_type(type_str: str) -> TaskType:
124
        try:
125
            return TaskType(type_str.upper())
126
        except ValueError:
127
            return TaskType.ANALYSIS

附录 C：task.py#

task.py（77 行）

1
"""任务节点 — 表示一个可执行的任务单元。"""
2
from __future__ import annotations
3

4
import time
5
from dataclasses import dataclass, field
6
from enum import Enum
7

8

9
class TaskType(Enum):
10
    PLANNING = "PLANNING"
11
    FILE_READ = "FILE_READ"
12
    FILE_WRITE = "FILE_WRITE"
13
    COMMAND = "COMMAND"
14
    ANALYSIS = "ANALYSIS"
15
    VERIFICATION = "VERIFICATION"
16

17

18
class TaskStatus(Enum):
19
    PENDING = "PENDING"
20
    RUNNING = "RUNNING"
21
    COMPLETED = "COMPLETED"
22
    FAILED = "FAILED"
23
    SKIPPED = "SKIPPED"
24

25

26
@dataclass
27
class Task:
28
    """一个可执行的任务单元，带依赖关系和状态追踪。"""
29
    id: str
30
    description: str
31
    type: TaskType
32
    status: TaskStatus = TaskStatus.PENDING
33
    result: str | None = None
34
    error: str | None = None
35
    dependencies: list[str] = field(default_factory=list)
36
    dependents: list[str] = field(default_factory=list)
37
    start_time: float = 0.0
38
    end_time: float = 0.0
39

40
    def mark_started(self) -> None:
41
        self.status = TaskStatus.RUNNING
42
        self.start_time = time.time()
43

44
    def mark_completed(self, result: str) -> None:
45
        self.status = TaskStatus.COMPLETED
46
        self.result = result
47
        self.end_time = time.time()
48

49
    def mark_failed(self, error: str) -> None:
50
        self.status = TaskStatus.FAILED
51
        self.error = error
52
        self.end_time = time.time()
53

54
    def mark_skipped(self) -> None:
55
        self.status = TaskStatus.SKIPPED
56
        self.end_time = time.time()
57

58
    @property
59
    def duration_ms(self) -> float:
60
        if self.start_time == 0:
61
            return 0.0
62
        end = self.end_time or time.time()
63
        return (end - self.start_time) * 1000
64

65
    def is_executable(self, all_tasks: dict[str, Task]) -> bool:
66
        if self.status != TaskStatus.PENDING:
67
            return False
68
        for dep_id in self.dependencies:
69
            dep = all_tasks.get(dep_id)
70
            if dep is None or dep.status != TaskStatus.COMPLETED:
71
                return False
72
        return True
73

74
    def __str__(self) -> str:
75
        return f"Task[{self.id}: {self.description}] ({self.status.value})"

附录 D：execution_plan.py#

execution_plan.py（157 行）

1
"""执行计划 — 包含一组有依赖关系的任务，支持拓扑排序与可视化。"""
2
from __future__ import annotations
3

4
import time
5
from enum import Enum
6

7
from paicli.plan.task import Task, TaskStatus
8

9

10
class PlanStatus(Enum):
11
    CREATED = "CREATED"
12
    RUNNING = "RUNNING"
13
    COMPLETED = "COMPLETED"
14
    FAILED = "FAILED"
15
    CANCELLED = "CANCELLED"
16

17

18
class ExecutionPlan:
19
    """执行计划：管理一组带依赖关系的任务，拓扑排序决定执行顺序。"""
20

21
    def __init__(self, plan_id: str, goal: str) -> None:
22
        self.id = plan_id
23
        self.goal = goal
24
        self.summary: str = ""
25
        self.status = PlanStatus.CREATED
26
        self._tasks: dict[str, Task] = {}
27
        self._execution_order: list[str] = []
28
        self.start_time: float = 0.0
29
        self.end_time: float = 0.0
30

31
    def add_task(self, task: Task) -> None:
32
        self._tasks[task.id] = task
33
        for dep_id in task.dependencies:
34
            dep = self._tasks.get(dep_id)
35
            if dep is not None and task.id not in dep.dependents:
36
                dep.dependents.append(task.id)
37

38
    def get_task(self, task_id: str) -> Task | None:
39
        return self._tasks.get(task_id)
40

41
    @property
42
    def all_tasks(self) -> list[Task]:
43
        return list(self._tasks.values())
44

45
    @property
46
    def root_tasks(self) -> list[Task]:
47
        return [t for t in self._tasks.values() if not t.dependencies]
48

49
    @property
50
    def executable_tasks(self) -> list[Task]:
51
        tasks_map = {t.id: t for t in self._tasks.values()}
52
        return [t for t in self._tasks.values() if t.is_executable(tasks_map)]
53

54
    def compute_execution_order(self) -> bool:
55
        self._execution_order.clear()
56
        visited: set[str] = set()
57
        visiting: set[str] = set()
58

59
        for task in self._tasks.values():
60
            if task.id not in visited:
61
                if not self._topological_sort(task, visited, visiting):
62
                    return False
63
        return True
64

65
    def _topological_sort(self, task: Task, visited: set[str], visiting: set[str]) -> bool:
66
        if task.id in visiting:
67
            return False
68
        if task.id in visited:
69
            return True
70

71
        visiting.add(task.id)
72
        for dep_id in task.dependencies:
73
            dep = self._tasks.get(dep_id)
74
            if dep is not None:
75
                if not self._topological_sort(dep, visited, visiting):
76
                    return False
77

78
        visiting.discard(task.id)
79
        visited.add(task.id)
80
        self._execution_order.append(task.id)
81
        return True
82

83
    @property
84
    def execution_order(self) -> list[str]:
85
        if not self._execution_order:
86
            self.compute_execution_order()
87
        return list(self._execution_order)
88

89
    @property
90
    def progress(self) -> float:
91
        if not self._tasks:
92
            return 1.0
93
        completed = sum(1 for t in self._tasks.values() if t.status == TaskStatus.COMPLETED)
94
        return completed / len(self._tasks)
95

96
    @property
97
    def is_all_completed(self) -> bool:
98
        return all(t.status == TaskStatus.COMPLETED for t in self._tasks.values())
99

100
    @property
101
    def has_failed(self) -> bool:
102
        return any(t.status == TaskStatus.FAILED for t in self._tasks.values())
103

104
    def mark_started(self) -> None:
105
        self.status = PlanStatus.RUNNING
106
        self.start_time = time.time()
107

108
    def mark_completed(self) -> None:
109
        self.status = PlanStatus.COMPLETED
110
        self.end_time = time.time()
111

112
    def mark_failed(self) -> None:
113
        self.status = PlanStatus.FAILED
114
        self.end_time = time.time()
115

116
    _STATUS_ICONS = {
117
        TaskStatus.PENDING: "⏳",
118
        TaskStatus.RUNNING: "▶️",
119
        TaskStatus.COMPLETED: "✅",
120
        TaskStatus.FAILED: "❌",
121
        TaskStatus.SKIPPED: "⏭️",
122
    }
123

124
    def visualize(self) -> str:
125
        lines: list[str] = []
126
        lines.append("╔══════════════════════════════════════════════════════════╗")
127
        goal_display = self.goal if len(self.goal) <= 46 else self.goal[:43] + "..."
128
        lines.append(f"║  执行计划: {goal_display:<46}║")
129
        lines.append("╠══════════════════════════════════════════════════════════╣")
130

131
        for i, task_id in enumerate(self.execution_order, 1):
132
            task = self._tasks[task_id]
133
            icon = self._STATUS_ICONS.get(task.status, "?")
134
            deps = "无" if not task.dependencies else ",".join(task.dependencies)
135
            desc = task.description if len(task.description) <= 50 else task.description[:47] + "..."
136
            lines.append(f"║  {i}. {icon} {task.id:<20} [{task.type.value:<10}] 依赖: {deps:<10}║")
137
            lines.append(f"║     {desc}")
138

139
        lines.append("╚══════════════════════════════════════════════════════════╝")
140
        lines.append(f"   进度: {self.progress * 100:.0f}% | 状态: {self.status.value}")
141
        return "\n".join(lines)
142

143
    def __str__(self) -> str:
144
        return f"ExecutionPlan[{self.id}: {self.goal}] ({len(self._tasks)} tasks, {self.status.value})"