OpenAI vs Anthropic SDK 深度对比

同一个模型（DeepSeek V4 Flash）、同一个问题、两种 API 格式的完整对比。
数据来源：真实运行日志，非手写示例。

一、整体设计哲学#

维度	OpenAI	Anthropic
核心抽象	消息列表	内容块列表
响应结构	`choices[0].message` — 单个 message 对象	`content[]` — 内容块数组，一个响应可以有 text + tool_use 多种类型
设计思路	消息是原子单位，tool_calls 是 message 的附属属性	内容块是原子单位，text 和 tool_use 是同一级的兄弟

这两家在 API 设计上走的是完全不同的路。OpenAI 把”文本回复”和”工具调用”放在同一个 message 对象的两个字段里（content + tool_calls），开发者拿到一个 message 对象，想看文字读 content，想看工具调用读 tool_calls，很直观。

Anthropic 把它们统一为 content 数组里不同 type 的块。所有内容都是块——不管是文字、工具调用、还是工具结果，地位完全平等。这种设计更”正交”，类型系统更统一，但开发者需要遍历 content 数组按 type 过滤。

谁更好？取决于你写什么层的代码。如果只是简单调用，OpenAI 更直观；如果你在写 Agent 框架，Anthropic 的统一块模型反而更容易做通用处理。

二、请求构造差异#

2.1 工具定义#

1
# ── OpenAI 格式 ──
2
tools = [{
3
    "type": "function",                    # 外层必须声明 type
4
    "function": {                          # 套一层 function
5
        "name": "get_weather",
6
        "description": "获取天气",
7
        "parameters": {                    # 字段叫 parameters
8
            "type": "object",
9
            "properties": {"city": {"type": "string"}},
10
            "required": ["city"],
11
        },
12
    },
13
}]
14

15
# ── Anthropic 格式 ──
16
tools = [{
17
    "name": "get_weather",                 # 直接在顶层
18
    "description": "获取天气",
19
    "input_schema": {                      # 字段叫 input_schema
20
        "type": "object",
21
        "properties": {"city": {"type": "string"}},
22
        "required": ["city"],
23
    },
24
}]

OpenAI 多了一层 function 嵌套（因为有 type: "function" 预留扩展其他类型，比如 type: "code_interpreter"），Anthropic 没有这个外层包装，更简洁。参数 Schema 字段名也不同：OpenAI 叫 parameters，Anthropic 叫 input_schema，语义一样，命名不同。

2.2 消息格式#

1
# ── OpenAI：消息是扁平的 dict ──
2
messages = [
3
    {"role": "user", "content": "你好"},
4
    {"role": "assistant", "content": "你好！"},
5
]
6

7
# ── Anthropic：content 可以是字符串，也可以是内容块数组 ──
8
messages = [
9
    {"role": "user", "content": "你好"},          # 简单场景：字符串
10
    {"role": "assistant", "content": [             # 复杂场景：内容块数组
11
        {"type": "text", "text": "你好！"},
12
        {"type": "tool_use", "id": "...", "name": "...", "input": {...}},
13
    ]},
14
]

Anthropic 的 content 支持两种类型（str 或 list[Block]），这意味着序列化/反序列化时要额外处理类型判断。OpenAI 的 content 永远是字符串，tool_calls 是独立字段，类型更确定。

2.3 System Prompt#

1
# OpenAI：system 是消息列表里的一条消息
2
messages = [
3
    {"role": "system", "content": "你是助手"},
4
    {"role": "user", "content": "你好"},
5
]
6

7
# Anthropic：system 是顶级参数，不在 messages 里
8
client.messages.create(
9
    system="你是助手",
10
    messages=[{"role": "user", "content": "你好"}],
11
)

Anthropic 的 system 不参与 messages 的顺序管理，更不容易出错（不会把 system 消息误插到中间）。OpenAI 的方式更灵活（可以在对话中间插入 system 消息），但也更容易误操作。

三、响应解析差异#

3.1 真实响应对比#

以下是同一个问题（“用一句话介绍你自己”）的两种格式的真实返回数据：

1
// OpenAI 响应
2
{
3
  "choices": [{
4
    "finish_reason": "stop",
5
    "message": {
6
      "role": "assistant",
7
      "content": "我是一名人造智能助手...",
8
      "tool_calls": null
9
    }
10
  }],
11
  "usage": { "prompt_tokens": 8, "completion_tokens": 25, "total_tokens": 33 }
12
}
13

14
// Anthropic 响应
15
{
16
  "role": "assistant",
17
  "stop_reason": "end_turn",
18
  "content": [
19
    {"type": "text", "text": "我是你身边的AI伙伴..."}
20
  ],
21
  "usage": { "input_tokens": 8, "output_tokens": 20 }
22
}

3.2 工具调用的响应对比#

同样的问题（“北京今天天气怎么样”），LLM 决定调用工具：

1
// OpenAI：tool_calls 是 message 的附属字段
2
{
3
  "choices": [{
4
    "finish_reason": "tool_calls",
5
    "message": {
6
      "content": "让我查一下北京今天的天气情况。",
7
      "tool_calls": [{
8
        "id": "call_00_8WcIl14wEDOeacZ0n8xL9829",
9
        "type": "function",
10
        "function": {
11
          "name": "get_weather",
12
          "arguments": "{\"city\": \"北京\"}"   // ← JSON 字符串
13
        }
14
      }]
15
    }
16
  }]
17
}
18

19
// Anthropic：tool_use 是 content 数组中的一个块
20
{
21
  "stop_reason": "tool_use",
22
  "content": [
23
    {"type": "text", "text": "让我查一下北京的天气情况。"},
24
    {"type": "tool_use", "id": "call_00_DnX2SEF9esVcv3HRBefj1699",
25
     "name": "get_weather", "input": {"city": "北京"}}   // ← 已解析的 dict
26
  ]
27
}

3.3 关键差异速查#

字段	OpenAI	Anthropic
文本内容	`choices[0].message.content`	`content[i]` where `type == "text"`
工具调用	`choices[0].message.tool_calls[]`	`content[i]` where `type == "tool_use"`
工具参数	`function.arguments`（JSON 字符串）	`input`（已解析的 dict）
结束原因	`finish_reason: "tool_calls"`	`stop_reason: "tool_use"`
Token 输入	`usage.prompt_tokens`	`usage.input_tokens`
Token 输出	`usage.completion_tokens`	`usage.output_tokens`

最容易踩的坑：工具参数的类型差异。OpenAI 的 arguments 是 JSON 字符串，需要 json.loads() 才能用。Anthropic 的 input 已经是解析好的 dict。这个差异意味着如果你在做 Agent 框架的抽象层，必须统一处理——要么都序列化为字符串，要么都解析为 dict。

另一个设计差异：OpenAI 用 choices 数组（设计上是支持多个候选回复的），但实际几乎永远只有一个 choice。Anthropic 没有 choices 层，content 直接在顶层。多 choice 的能力 OpenAI 至今也没真正开放。

四、工具结果回传（最关键的差异）#

这是构建 Agent 框架时最重要的部分——工具执行完，怎么把结果告诉 LLM。两家的做法差异很大。

4.1 OpenAI 的回传方式#

1
# 1. 把 assistant 消息（含 tool_calls）加入 messages
2
messages.append({
3
    "role": "assistant",
4
    "content": "让我查一下天气",
5
    "tool_calls": [{
6
        "id": "call_00_xxx",
7
        "type": "function",
8
        "function": {"name": "get_weather", "arguments": '{"city": "北京"}'},
9
    }],
10
})
11

12
# 2. 每个工具结果作为独立消息加入
13
messages.append({
14
    "role": "tool",                        # ← role 是 "tool"
15
    "tool_call_id": "call_00_xxx",         # ← 用 tool_call_id 配对
16
    "content": "北京：晴天，25°C",
17
})

4.2 Anthropic 的回传方式#

1
# 1. 把 assistant 的完整响应加入 messages
2
messages.append({
3
    "role": "assistant",
4
    "content": [                            # ← content 是块数组
5
        {"type": "text", "text": "让我查一下天气"},
6
        {"type": "tool_use", "id": "call_00_xxx", "name": "get_weather", "input": {"city": "北京"}},
7
    ],
8
})
9

10
# 2. 所有工具结果打包成一条 user 消息
11
messages.append({
12
    "role": "user",                         # ← role 是 "user"！不是 "tool"
13
    "content": [                            # ← content 是 tool_result 数组
14
        {
15
            "type": "tool_result",          # ← 类型标记
16
            "tool_use_id": "call_00_xxx",   # ← 用 tool_use_id 配对
17
            "content": "北京：晴天，25°C",
18
        },
19
    ],
20
})

4.3 回传结构对比#

1
OpenAI（每个工具结果一条消息）：           Anthropic（所有结果打包一条消息）：
2
messages:                                messages:
3
  [0] role=user                            [0] role=user
4
  [1] role=assistant + tool_calls          [1] role=assistant + content blocks
5
  [2] role=tool, id=call_00_aaa            [2] role=user, content=[
6
  [3] role=tool, id=call_00_bbb                  {tool_result, tool_use_id=call_00_aaa},
7
                                                 {tool_result, tool_use_id=call_00_bbb},
8
                                               ]

三个值得注意的差异：

第一，role 不同。 Anthropic 用 role: user 而不是 role: tool。这是因为 Anthropic 的设计哲学是”消息只有三种角色：user / assistant / system”。工具结果本质上是由用户侧（Agent 系统）提交的，所以归为 user。OpenAI 专门发明了 tool 角色，语义更精确但增加了角色种类。

第二，打包策略影响并行执行设计。 OpenAI 每个工具结果一条消息，可以逐个执行、逐个回传，天然支持流式工具执行。Anthropic 所有结果打包一条，必须等所有工具执行完才能回传。如果你的 Agent 框架要同时支持两种 API，这个差异会直接影响你并行执行模块的设计。

第三，ID 配对字段名不同。 OpenAI 用 tool_call_id，Anthropic 用 tool_use_id，语义完全一样——都是唯一标识符，用于把工具调用和结果配对。

五、多次工具调用 & 并行#

两种 API 都支持 LLM 在一次响应中返回多个工具调用（比如同时读 3 个文件），也支持多轮工具调用（第 1 轮调完工具，第 2 轮 LLM 可能继续调）。

1
// OpenAI：tool_calls 数组
2
"tool_calls": [
3
    {"id": "call_001", "function": {"name": "read_file", "arguments": '{"path":"a.py"}'}},
4
    {"id": "call_002", "function": {"name": "read_file", "arguments": '{"path":"b.py"}'}},
5
    {"id": "call_003", "function": {"name": "read_file", "arguments": '{"path":"c.py"}'}}
6
]
7

8
// Anthropic：content 数组中的 tool_use 块
9
"content": [
10
    {"type": "text", "text": "我来读取这三个文件"},
11
    {"type": "tool_use", "id": "call_001", "name": "read_file", "input": {"path": "a.py"}},
12
    {"type": "tool_use", "id": "call_002", "name": "read_file", "input": {"path": "b.py"}},
13
    {"type": "tool_use", "id": "call_003", "name": "read_file", "input": {"path": "c.py"}}
14
]

一个有趣的细节：Anthropic 可以在 tool_use 块之间穿插 text 块（先说一句话，再调两个工具，再说一句话）。OpenAI 的 tool_calls 是一个数组，文本和工具调用是分离的两个字段，没有这种穿插能力。

关于多轮调用，消息列表会持续增长：

1
轮次  messages 长度增长
2
1     user → assistant(tool_calls) → tool/tool_result   = 3 条
3
2     → assistant(tool_calls) → tool/tool_result        = 5 条
4
3     → assistant(content)                               = 6 条（最终回复）

直到 LLM 不再返回工具调用。这也是为什么 Agent 框架需要上下文压缩——Token 消耗在工具调用场景下增长极快。

六、Usage / Token 计费差异#

字段	OpenAI	Anthropic
输入 token	`usage.prompt_tokens`	`usage.input_tokens`
输出 token	`usage.completion_tokens`	`usage.output_tokens`
总计	`usage.total_tokens`	无（需自行计算）
缓存命中	`usage.prompt_cache_hit_tokens`	`usage.cache_read_input_tokens`
缓存写入	无	`usage.cache_creation_input_tokens`

从真实日志可以看到缓存的实际效果——同一个工具定义在第二轮请求中命中了缓存：

1
第 1 轮（OpenAI）:  prompt_tokens: 282, cached_tokens: 256
2
第 2 轮（OpenAI）:  prompt_tokens: 354, cached_tokens: 256  ← 工具定义被缓存

缓存命中的 token 单价更低，如果你在做 Agent 框架的成本监控，需要统一抽象 usage 的解析逻辑。

七、SDK 对象 vs 原始 dict#

	OpenAI SDK	Anthropic SDK
响应对象	`ChatCompletion`（Pydantic model）	`Message`（Pydantic model）
访问方式	`response.choices[0].message.tool_calls`	`response.content[0].type`
转为 dict	`response.model_dump()`	`response.model_dump()`
消息回传	可以直接 append SDK 对象的 `model_dump()`	需要注意 content 中的 Block 对象

一个常见的坑：Anthropic 的 content 里的 TextBlock / ToolUseBlock 是 Pydantic 对象不是 dict，直接 append 到 messages 可能导致序列化问题。需要显式转为 dict 或者让 SDK 自己处理。

八、对 Agent 框架设计的启示#

如果你的 Agent 框架要同时支持两种 API，抽象层至少要统一这些东西：

1
需要统一的          OpenAI 的叫法          Anthropic 的叫法
2
─────────────────────────────────────────────────────────
3
工具定义 schema     parameters             input_schema
4
工具调用 ID 字段    tool_call_id           tool_use_id
5
工具参数类型        JSON 字符串            已解析的 dict
6
工具结果 role       "tool"                 "user"
7
工具结果打包方式    每个结果一条消息        所有结果一条消息
8
结束标志            finish_reason          stop_reason
9
文本内容位置        message.content        content[i].text
10
工具调用位置        message.tool_calls     content[i] (type=tool_use)

一个设计良好的 Protocol 层会让上层 Agent 代码完全无感——Agent 只说”调工具”、“拿结果”、“回传”，不关心底层是 tool_call_id 还是 tool_use_id，是 arguments 字符串还是 input dict。

这也验证了一个重要的认知：API 格式本身不是模型能力决定的，是服务层的设计选择。同一个 DeepSeek V4 Flash 可以同时暴露 OpenAI 和 Anthropic 两种接口格式，你换的不是模型，而是 API 格式，框架要做的是无感切换。

附录#

附录 A：完整测试代码#

以下是用 DeepSeek V4 Flash 同时跑两种 SDK 的完整测试脚本，覆盖三个场景：纯文本对话、工具调用（第一轮）、完整 ReAct 两轮（工具调用 → 结果回传 → 最终回复）。

OpenAI SDK 测试代码

1
"""测试 OpenAI SDK 完整交互流程（含工具结果回传）。"""
2
import os
3
import json
4
from datetime import datetime
5
from pathlib import Path
6

7
from dotenv import load_dotenv
8
from openai import OpenAI
9

10
ROOT = Path(__file__).parent.parent
11
load_dotenv(ROOT / ".env")
12

13
LOG_DIR = ROOT / "logs" / "sdk"
14
LOG_DIR.mkdir(parents=True, exist_ok=True)
15

16
client = OpenAI(
17
    api_key=os.getenv("DEEPSEEK_API_KEY"),
18
    base_url="https://api.deepseek.com/v1",
19
)
20

21
MODEL = "deepseek-chat"
22

23
tools = [{
24
    "type": "function",
25
    "function": {
26
        "name": "get_weather",
27
        "description": "获取指定城市的天气",
28
        "parameters": {
29
            "type": "object",
30
            "properties": {"city": {"type": "string", "description": "城市名"}},
31
            "required": ["city"],
32
        },
33
    },
34
}]
35

36

37
def mock_execute_tool(name: str, args: dict) -> str:
38
    if name == "get_weather":
39
        return f"{args.get('city', '未知')}：晴天，25°C，微风"
40
    return f"未知工具: {name}"
41

42

43
results = {}
44

45
# ── 场景 A：纯文本 ──
46
r = client.chat.completions.create(
47
    model=MODEL,
48
    max_tokens=256,
49
    messages=[{"role": "user", "content": "用一句话介绍你自己"}],
50
)
51
results["A_纯文本"] = r.model_dump()
52

53
# ── 场景 B：工具调用（只看第一轮）──
54
r = client.chat.completions.create(
55
    model=MODEL,
56
    max_tokens=256,
57
    tools=tools,
58
    messages=[{"role": "user", "content": "北京今天天气怎么样"}],
59
)
60
results["B_工具调用"] = r.model_dump()
61

62
# ── 场景 C：完整 ReAct 两轮 ──
63
messages = [{"role": "user", "content": "北京今天天气怎么样"}]
64
r1 = client.chat.completions.create(model=MODEL, max_tokens=256, tools=tools, messages=messages)
65
msg1 = r1.choices[0].message
66

67
# 回传：先 append assistant 消息，再逐个 append tool 结果
68
messages.append(msg1.model_dump())
69
for tc in msg1.tool_calls:
70
    args = json.loads(tc.function.arguments)
71
    result = mock_execute_tool(tc.function.name, args)
72
    messages.append({
73
        "role": "tool",
74
        "tool_call_id": tc.id,
75
        "content": result,
76
    })
77

78
# 第 2 轮：把工具结果发给 LLM
79
r2 = client.chat.completions.create(model=MODEL, max_tokens=256, tools=tools, messages=messages)
80
results["C_完整两轮"] = {
81
    "第1轮_工具调用": r1.model_dump(),
82
    "回传的messages": messages,
83
    "第2轮_最终回复": r2.model_dump(),
84
}
85

86
# ── 写入日志 ──
87
date_str = datetime.now().strftime("%Y-%m-%d")
88
log_file = LOG_DIR / f"{date_str}-openai-response.json"
89
log_file.write_text(json.dumps(results, indent=2, ensure_ascii=False, default=str), encoding="utf-8")

Anthropic SDK 测试代码

1
"""测试 Anthropic SDK 完整交互流程（含工具结果回传）。"""
2
import os
3
import json
4
from datetime import datetime
5
from pathlib import Path
6

7
from dotenv import load_dotenv
8
from anthropic import Anthropic
9

10
ROOT = Path(__file__).parent.parent
11
load_dotenv(ROOT / ".env")
12

13
LOG_DIR = ROOT / "logs" / "sdk"
14
LOG_DIR.mkdir(parents=True, exist_ok=True)
15

16
client = Anthropic(
17
    api_key=os.getenv("DEEPSEEK_API_KEY"),
18
    base_url="https://api.deepseek.com/anthropic",
19
)
20

21
MODEL = "deepseek-chat"
22

23
tools = [{
24
    "name": "get_weather",
25
    "description": "获取指定城市的天气",
26
    "input_schema": {
27
        "type": "object",
28
        "properties": {"city": {"type": "string", "description": "城市名"}},
29
        "required": ["city"],
30
    },
31
}]
32

33

34
def mock_execute_tool(name: str, args: dict) -> str:
35
    if name == "get_weather":
36
        return f"{args.get('city', '未知')}：晴天，25°C，微风"
37
    return f"未知工具: {name}"
38

39

40
results = {}
41

42
# ── 场景 A：纯文本 ──
43
r = client.messages.create(
44
    model=MODEL,
45
    max_tokens=256,
46
    messages=[{"role": "user", "content": "用一句话介绍你自己"}],
47
)
48
results["A_纯文本"] = r.model_dump()
49

50
# ── 场景 B：工具调用（只看第一轮）──
51
r = client.messages.create(
52
    model=MODEL,
53
    max_tokens=256,
54
    tools=tools,
55
    messages=[{"role": "user", "content": "北京今天天气怎么样"}],
56
)
57
results["B_工具调用"] = r.model_dump()
58

59
# ── 场景 C：完整 ReAct 两轮 ──
60
messages = [{"role": "user", "content": "北京今天天气怎么样"}]
61
r1 = client.messages.create(model=MODEL, max_tokens=256, tools=tools, messages=messages)
62

63
# 回传：先 append assistant 消息（content 块数组），再打包所有 tool_result
64
messages.append({"role": "assistant", "content": r1.content})
65
tool_results = []
66
for block in r1.content:
67
    if block.type == "tool_use":
68
        result = mock_execute_tool(block.name, block.input)
69
        tool_results.append({
70
            "type": "tool_result",
71
            "tool_use_id": block.id,
72
            "content": result,
73
        })
74
messages.append({"role": "user", "content": tool_results})
75

76
# 第 2 轮：把工具结果发给 LLM
77
r2 = client.messages.create(model=MODEL, max_tokens=256, tools=tools, messages=messages)
78
results["C_完整两轮"] = {
79
    "第1轮_工具调用": r1.model_dump(),
80
    "回传的messages": str(messages),
81
    "第2轮_最终回复": r2.model_dump(),
82
}
83

84
# ── 写入日志 ──
85
date_str = datetime.now().strftime("%Y-%m-%d")
86
log_file = LOG_DIR / f"{date_str}-anthropic-response.json"
87
log_file.write_text(json.dumps(results, indent=2, ensure_ascii=False, default=str), encoding="utf-8")

附录 B：完整响应日志#

以下是三个场景的完整 API 响应日志（已精简无关字段）。注意对比两种格式在结构上的差异，尤其是工具调用场景下的响应结构。

OpenAI 完整响应日志

1
{
2
  "A_纯文本": {
3
    "id": "f38b2f23-16a1-48b9-837e-4c2238a6432c",
4
    "choices": [{
5
      "finish_reason": "stop",
6
      "index": 0,
7
      "message": {
8
        "role": "assistant",
9
        "content": "我是一名人造智能助手，旨在通过实时信息检索和多语言支持，为用户提供高效、准确且友好的帮助。",
10
        "tool_calls": null
11
      }
12
    }],
13
    "model": "deepseek-v4-flash",
14
    "usage": {
15
      "prompt_tokens": 8,
16
      "completion_tokens": 25,
17
      "total_tokens": 33
18
    }
19
  },
20
  "B_工具调用": {
21
    "id": "279e0d46-ca7e-4495-806b-e3d7449aa465",
22
    "choices": [{
23
      "finish_reason": "tool_calls",
24
      "index": 0,
25
      "message": {
26
        "role": "assistant",
27
        "content": "让我查一下北京今天的天气情况。",
28
        "tool_calls": [{
29
          "id": "call_00_8WcIl14wEDOeacZ0n8xL9829",
30
          "type": "function",
31
          "function": {
32
            "name": "get_weather",
33
            "arguments": "{\"city\": \"北京\"}"
34
          }
35
        }]
36
      }
37
    }],
38
    "model": "deepseek-v4-flash",
39
    "usage": {
40
      "prompt_tokens": 282,
41
      "completion_tokens": 52,
42
      "total_tokens": 334
43
    }
44
  },
45
  "C_完整两轮": {
46
    "第1轮_工具调用": {
47
      "choices": [{
48
        "finish_reason": "tool_calls",
49
        "message": {
50
          "content": "让我查询一下北京今天的天气情况。",
51
          "tool_calls": [{
52
            "id": "call_00_Sh0T5t8PXiCWHA6Gcr3w7264",
53
            "function": {
54
              "name": "get_weather",
55
              "arguments": "{\"city\": \"北京\"}"
56
            }
57
          }]
58
        }
59
      }]
60
    },
61
    "回传的messages": [
62
      {"role": "user", "content": "北京今天天气怎么样"},
63
      {
64
        "role": "assistant",
65
        "tool_calls": [{
66
          "id": "call_00_Sh0T5t8PXiCWHA6Gcr3w7264",
67
          "function": {"name": "get_weather", "arguments": "{\"city\": \"北京\"}"}
68
        }]
69
      },
70
      {
71
        "role": "tool",
72
        "tool_call_id": "call_00_Sh0T5t8PXiCWHA6Gcr3w7264",
73
        "content": "北京：晴天，25°C，微风"
74
      }
75
    ],
76
    "第2轮_最终回复": {
77
      "choices": [{
78
        "finish_reason": "stop",
79
        "message": {
80
          "content": "北京今天天气很好！具体情况如下：\n\n- **天气状况**：晴天\n- **气温**：25°C\n- **风力**：微风",
81
          "tool_calls": null
82
        }
83
      }],
84
      "usage": {
85
        "prompt_tokens": 354,
86
        "completion_tokens": 69,
87
        "total_tokens": 423
88
      }
89
    }
90
  }
91
}

Anthropic 完整响应日志

1
{
2
  "A_纯文本": {
3
    "id": "b12f46f3-b005-4b75-9a3e-b3cc98001d2e",
4
    "role": "assistant",
5
    "stop_reason": "end_turn",
6
    "content": [
7
      {"type": "text", "text": "我是你身边的AI伙伴，随时准备用精准又温暖的语言为你答疑解惑、碰撞灵感。"}
8
    ],
9
    "model": "deepseek-v4-flash",
10
    "usage": {
11
      "input_tokens": 8,
12
      "output_tokens": 20
13
    }
14
  },
15
  "B_工具调用": {
16
    "id": "2e6c9b04-dea3-461a-b4c9-e68a7b8254da",
17
    "role": "assistant",
18
    "stop_reason": "tool_use",
19
    "content": [
20
      {"type": "text", "text": "让我查一下北京的天气情况。"},
21
      {
22
        "type": "tool_use",
23
        "id": "call_00_DnX2SEF9esVcv3HRBefj1699",
24
        "name": "get_weather",
25
        "input": {"city": "北京"}
26
      }
27
    ],
28
    "model": "deepseek-v4-flash",
29
    "usage": {
30
      "input_tokens": 26,
31
      "output_tokens": 51
32
    }
33
  },
34
  "C_完整两轮": {
35
    "第1轮_工具调用": {
36
      "role": "assistant",
37
      "stop_reason": "tool_use",
38
      "content": [
39
        {"type": "text", "text": "让我查一下北京的天气情况。"},
40
        {
41
          "type": "tool_use",
42
          "id": "call_00_ORUjAw43qGE5D9xUlpTI2193",
43
          "name": "get_weather",
44
          "input": {"city": "北京"}
45
        }
46
      ]
47
    },
48
    "回传的messages": [
49
      {"role": "user", "content": "北京今天天气怎么样"},
50
      {
51
        "role": "assistant",
52
        "content": [
53
          {"type": "text", "text": "让我查一下北京的天气情况。"},
54
          {"type": "tool_use", "id": "call_00_ORUjAw43qGE5D9xUlpTI2193", "name": "get_weather", "input": {"city": "北京"}}
55
        ]
56
      },
57
      {
58
        "role": "user",
59
        "content": [
60
          {"type": "tool_result", "tool_use_id": "call_00_ORUjAw43qGE5D9xUlpTI2193", "content": "北京：晴天，25°C，微风"}
61
        ]
62
      }
63
    ],
64
    "第2轮_最终回复": {
65
      "role": "assistant",
66
      "stop_reason": "end_turn",
67
      "content": [
68
        {"type": "text", "text": "北京今天天气不错！具体情况如下：\n- 天气状况：晴天\n- 温度：25°C\n- 风力：微风"}
69
      ],
70
      "usage": {
71
        "input_tokens": 97,
72
        "output_tokens": 53
73
      }
74
    }
75
  }
76
}