openclaw/docs/zh-CN/concepts/model-providers.md

---
read_when:
  - 你需要一份逐提供商的模型设置参考
  - 你需要模型提供商的示例配置或 CLI 新手引导命令
summary: 模型提供商概览，包含示例配置和 CLI 流程
title: 模型提供商
x-i18n:
  generated_at: "2026-03-16T02:12:40Z"
  model: claude-opus-4-6
  provider: pi
  source_hash: 978798c80c5809c162f9807072ab48fdf99bfe0db39b2b3c245ce8b4e5451603
  source_path: concepts/model-providers.md
  workflow: 15
---

# 模型提供商

本页涵盖 **LLM/模型提供商** （不是 WhatsApp/Telegram 等聊天渠道）。
有关模型选择规则，请参阅 [/concepts/models](/concepts/models)。

## 快速规则

- 模型引用使用 `provider/model` （例如： `opencode/claude-opus-4-6`）。
- 如果你设置了 `agents.defaults.models`，它将成为允许列表。
- CLI 辅助命令： `openclaw onboard`， `openclaw models list`， `openclaw models set <provider/model>`。
- 提供商插件可以通过以下方式注入模型目录 `registerProvider({ catalog })`；
  OpenClaw 将该输出合并到 `models.providers` 之后再写入
  `models.json`。
- 提供商插件还可以通过以下方式控制提供商的运行时行为
  `resolveDynamicModel`， `prepareDynamicModel`， `normalizeResolvedModel`，
  `capabilities`， `prepareExtraParams`， `wrapStreamFn`，
  `isCacheTtlEligible`， `prepareRuntimeAuth`， `resolveUsageAuth`，以及
  `fetchUsageSnapshot`。

## 插件管理的提供商行为

提供商插件现在可以管理大部分提供商特定逻辑，而 OpenClaw 负责维护通用推理循环。

典型分工：

- `catalog`：提供商出现在 `models.providers`
- `resolveDynamicModel`：提供商接受尚未出现在本地静态目录中的模型 ID
- `prepareDynamicModel`：提供商在重试动态解析之前需要刷新元数据
- `normalizeResolvedModel`：提供商需要传输层或基础 URL 重写
- `capabilities`：提供商发布会话记录/工具/提供商系列的特殊行为
- `prepareExtraParams`：提供商默认或规范化每个模型的请求参数
- `wrapStreamFn`：提供商应用请求头/请求体/模型兼容性封装
- `isCacheTtlEligible`：提供商决定哪些上游模型 ID 支持 prompt-cache TTL
- `prepareRuntimeAuth`：提供商将配置的凭证转换为短期运行时令牌
- `resolveUsageAuth`：提供商为以下用途解析使用量/配额凭证 `/usage`
  以及相关的状态/报告界面
- `fetchUsageSnapshot`：提供商负责使用量端点的获取/解析，而核心仍负责摘要外壳和格式化

当前内置示例：

- `anthropic`：Claude 4.6 向前兼容回退、使用量端点获取，以及 cache-TTL/提供商系列元数据
- `openrouter`：直通模型 ID、请求封装、提供商能力提示，以及 cache-TTL 策略
- `github-copilot`：向前兼容模型回退、Claude-thinking 会话记录提示、运行时令牌交换，以及使用量端点获取
- `openai`：GPT-5.4 向前兼容回退、直接 OpenAI 传输规范化，以及提供商系列元数据
- `openai-codex`：向前兼容模型回退、传输规范化，以及默认传输参数和使用量端点获取
- `google-gemini-cli`：Gemini 3.1 向前兼容回退，以及使用量界面的 usage-token 解析和配额端点获取
- `moonshot`：共享传输、插件管理的 thinking 负载规范化
- `kilocode`：共享传输、插件管理的请求头、推理负载规范化、Gemini 会话记录提示，以及 cache-TTL 策略
- `zai`：GLM-5 向前兼容回退， `tool_stream` 默认值、cache-TTL 策略，以及使用量认证和配额获取
- `mistral`， `opencode`，以及`opencode-go`：插件管理的能力元数据
- `byteplus`， `cloudflare-ai-gateway`， `huggingface`， `kimi-coding`，
  `minimax-portal`， `modelstudio`， `nvidia`， `qianfan`， `qwen-portal`，
  `synthetic`， `together`， `venice`， `vercel-ai-gateway`，以及`volcengine`：仅限插件管理的目录
- `minimax` 和 `xiaomi`：插件管理的目录以及使用量认证/快照逻辑

以上涵盖了仍然适用于 OpenClaw 常规传输层的提供商。如果某个提供商需要完全自定义的请求执行器，则属于一个独立的、更深层的扩展层面。

## API 密钥轮换

- 支持对选定提供商的通用提供商轮换。
- 通过以下方式配置多个密钥：
  - `OPENCLAW_LIVE_<PROVIDER>_KEY` （单个实时覆盖，最高优先级）
  - `<PROVIDER>_API_KEYS` （逗号或分号分隔的列表）
  - `<PROVIDER>_API_KEY` （主密钥）
  - `<PROVIDER>_API_KEY_*` （编号列表，例如 `<PROVIDER>_API_KEY_1`）
- 对于 Google 提供商， `GOOGLE_API_KEY` 也作为备选项包含在内。
- 密钥选择顺序按优先级排列并去除重复值。
- 仅在速率限制响应时使用下一个密钥重试请求（例如 `429`， `rate_limit`， `quota`， `resource exhausted`）。
- 非速率限制的失败会立即报错；不会尝试密钥轮换。
- 当所有候选密钥均失败时，返回最后一次尝试的错误。

## 内置提供商（pi-ai 目录）

OpenClaw 附带 pi-ai 目录。这些提供商需要 **无需**
`models.providers` 配置；只需设置认证并选择一个模型。

### OpenAI

- 提供商： `openai`
- 认证： `OPENAI_API_KEY`
- 可选轮换： `OPENAI_API_KEYS`， `OPENAI_API_KEY_1`， `OPENAI_API_KEY_2`，加上 `OPENCLAW_LIVE_OPENAI_KEY` （单个覆盖）
- 示例模型： `openai/gpt-5.4`， `openai/gpt-5.4-pro`
- CLI： `openclaw onboard --auth-choice openai-api-key`
- 默认传输为 `auto` （WebSocket 优先，SSE 备选）
- 通过以下方式覆盖每个模型 `agents.defaults.models["openai/<model>"].params.transport` （`"sse"`， `"websocket"`，或 `"auto"`）
- OpenAI Responses WebSocket 预热默认通过以下方式启用 `params.openaiWsWarmup` （`true`/`false`）
- OpenAI 优先处理可以通过以下方式启用 `agents.defaults.models["openai/<model>"].params.serviceTier`
- OpenAI 快速模式可以通过以下方式为每个模型启用 `agents.defaults.models["<provider>/<model>"].params.fastMode`
- `openai/gpt-5.3-codex-spark` 在 OpenClaw 中被有意屏蔽，因为 OpenAI 实时 API 会拒绝它；Spark 被视为仅限 Codex 使用

```json5
{
  agents: { defaults: { model: { primary: "openai/gpt-5.4" } } },
}
```

### Anthropic

- 提供商： `anthropic`
- 认证： `ANTHROPIC_API_KEY` 或 `claude setup-token`
- 可选轮换： `ANTHROPIC_API_KEYS`， `ANTHROPIC_API_KEY_1`， `ANTHROPIC_API_KEY_2`，加上 `OPENCLAW_LIVE_ANTHROPIC_KEY` （单个覆盖）
- 示例模型： `anthropic/claude-opus-4-6`
- CLI： `openclaw onboard --auth-choice token` （粘贴 setup-token）或 `openclaw models auth paste-token --provider anthropic`
- 直接 API 密钥模型支持共享的 `/fast` 切换和 `params.fastMode`；OpenClaw 将其映射到 Anthropic 的 `service_tier` （`auto` 与 `standard_only`）
- 策略说明：setup-token 支持属于技术兼容性；Anthropic 过去曾阻止部分订阅在 Claude Code 之外的使用。请核实当前 Anthropic 条款，并根据你的风险承受能力做出决定。
- 建议：Anthropic API 密钥认证是比订阅 setup-token 认证更安全的推荐方式。

```json5
{
  agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },
}
```

### OpenAI Code (Codex)

- 提供商： `openai-codex`
- 认证：OAuth (ChatGPT)
- 示例模型： `openai-codex/gpt-5.4`
- CLI： `openclaw onboard --auth-choice openai-codex` 或 `openclaw models auth login --provider openai-codex`
- 默认传输为 `auto` （WebSocket 优先，SSE 备选）
- 通过以下方式覆盖每个模型 `agents.defaults.models["openai-codex/<model>"].params.transport` （`"sse"`， `"websocket"`，或 `"auto"`）
- 与相同的 `/fast` 切换和 `params.fastMode` 配置共享，如同直接的 `openai/*`
- `openai-codex/gpt-5.3-codex-spark` 当 Codex OAuth 目录公开时仍然可用；取决于授权资格
- 策略说明：OpenAI Codex OAuth 明确支持 OpenClaw 等外部工具/工作流。

```json5
{
  agents: { defaults: { model: { primary: "openai-codex/gpt-5.4" } } },
}
```

### OpenCode

- 认证： `OPENCODE_API_KEY` （或 `OPENCODE_ZEN_API_KEY`）
- Zen 运行时提供商： `opencode`
- Go 运行时提供商： `opencode-go`
- 示例模型： `opencode/claude-opus-4-6`， `opencode-go/kimi-k2.5`
- CLI： `openclaw onboard --auth-choice opencode-zen` 或 `openclaw onboard --auth-choice opencode-go`

```json5
{
  agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },
}
```

### Google Gemini（API 密钥）

- 提供商： `google`
- 认证： `GEMINI_API_KEY`
- 可选轮换： `GEMINI_API_KEYS`， `GEMINI_API_KEY_1`， `GEMINI_API_KEY_2`， `GOOGLE_API_KEY` 备选，以及 `OPENCLAW_LIVE_GEMINI_KEY` （单个覆盖）
- 示例模型： `google/gemini-3.1-pro-preview`， `google/gemini-3-flash-preview`
- 兼容性：使用旧版 OpenClaw 配置的 `google/gemini-3.1-flash-preview` 会被规范化为 `google/gemini-3-flash-preview`
- CLI： `openclaw onboard --auth-choice gemini-api-key`

### Google Vertex 和 Gemini CLI

- 提供商： `google-vertex`， `google-gemini-cli`
- 认证：Vertex 使用 gcloud ADC；Gemini CLI 使用其 OAuth 流程
- 注意：OpenClaw 中的 Gemini CLI OAuth 是非官方集成。部分用户报告称在使用第三方客户端后 Google 账户受到限制。请查阅 Google 条款，如果你选择继续，建议使用非关键账户。
- Gemini CLI OAuth 作为内置的 `google` 插件的一部分提供。
  - 启用： `openclaw plugins enable google`
  - 登录： `openclaw models auth login --provider google-gemini-cli --set-default`
  - 注意：你确实 **不** 需要将 client ID 或 secret 粘贴到 `openclaw.json`中。CLI 登录流程将令牌存储在 Gateway 网关主机的认证配置文件中。

### Z.AI (GLM)

- 提供商： `zai`
- 认证： `ZAI_API_KEY`
- 示例模型： `zai/glm-5`
- CLI： `openclaw onboard --auth-choice zai-api-key`
  - 别名： `z.ai/*` 和 `z-ai/*` 规范化为 `zai/*`

### Vercel AI Gateway

- 提供商： `vercel-ai-gateway`
- 认证： `AI_GATEWAY_API_KEY`
- 示例模型： `vercel-ai-gateway/anthropic/claude-opus-4.6`
- CLI： `openclaw onboard --auth-choice ai-gateway-api-key`

### Kilo Gateway

- 提供商： `kilocode`
- 认证： `KILOCODE_API_KEY`
- 示例模型： `kilocode/anthropic/claude-opus-4.6`
- CLI： `openclaw onboard --kilocode-api-key <key>`
- 基础 URL： `https://api.kilo.ai/api/gateway/`
- 扩展的内置目录包括 GLM-5 Free、MiniMax M2.5 Free、GPT-5.2、Gemini 3 Pro Preview、Gemini 3 Flash Preview、Grok Code Fast 1 和 Kimi K2.5。

参阅 [/providers/kilocode](/providers/kilocode) 了解详情。

### 其他内置提供商插件

- OpenRouter： `openrouter` （`OPENROUTER_API_KEY`）
- 示例模型： `openrouter/anthropic/claude-sonnet-4-5`
- Kilo Gateway： `kilocode` （`KILOCODE_API_KEY`）
- 示例模型： `kilocode/anthropic/claude-opus-4.6`
- MiniMax： `minimax` （`MINIMAX_API_KEY`）
- Moonshot： `moonshot` （`MOONSHOT_API_KEY`）
- Kimi Coding： `kimi-coding` （`KIMI_API_KEY` 或 `KIMICODE_API_KEY`）
- Qianfan： `qianfan` （`QIANFAN_API_KEY`）
- Model Studio： `modelstudio` （`MODELSTUDIO_API_KEY`）
- NVIDIA： `nvidia` （`NVIDIA_API_KEY`）
- Together： `together` （`TOGETHER_API_KEY`）
- Venice： `venice` （`VENICE_API_KEY`）
- Xiaomi： `xiaomi` （`XIAOMI_API_KEY`）
- Vercel AI Gateway： `vercel-ai-gateway` （`AI_GATEWAY_API_KEY`）
- Hugging Face Inference： `huggingface` （`HUGGINGFACE_HUB_TOKEN` 或 `HF_TOKEN`）
- Cloudflare AI Gateway： `cloudflare-ai-gateway` （`CLOUDFLARE_AI_GATEWAY_API_KEY`）
- Volcengine： `volcengine` （`VOLCANO_ENGINE_API_KEY`）
- BytePlus： `byteplus` （`BYTEPLUS_API_KEY`）
- xAI： `xai` （`XAI_API_KEY`）
- Mistral： `mistral` （`MISTRAL_API_KEY`）
- 示例模型： `mistral/mistral-large-latest`
- CLI： `openclaw onboard --auth-choice mistral-api-key`
- Groq： `groq` （`GROQ_API_KEY`）
- Cerebras： `cerebras` （`CEREBRAS_API_KEY`）
  - Cerebras 上的 GLM 模型使用 ID `zai-glm-4.7` 和 `zai-glm-4.6`。
  - 兼容 OpenAI 的基础 URL： `https://api.cerebras.ai/v1`。
- GitHub Copilot： `github-copilot` （`COPILOT_GITHUB_TOKEN`/`GH_TOKEN`/`GITHUB_TOKEN`）
- Hugging Face Inference 示例模型： `huggingface/deepseek-ai/DeepSeek-R1`；CLI： `openclaw onboard --auth-choice huggingface-api-key`。参阅 [Hugging Face (Inference)](/providers/huggingface)。

## 通过以下方式提供的提供商 `models.providers` （自定义/基础 URL）

使用 `models.providers` （或 `models.json`）来添加 **自定义** 提供商或 OpenAI/Anthropic 兼容代理。

下方许多内置提供商插件已经发布了默认目录。
使用显式的 `models.providers.<id>` 条目仅在你需要覆盖默认基础 URL、请求头或模型列表时使用。

### Moonshot AI (Kimi)

Moonshot 使用兼容 OpenAI 的端点，因此将其配置为自定义提供商：

- 提供商： `moonshot`
- 认证： `MOONSHOT_API_KEY`
- 示例模型： `moonshot/kimi-k2.5`

Kimi K2 模型 ID：

[//]: # "moonshot-kimi-k2-model-refs:start"

- `moonshot/kimi-k2.5`
- `moonshot/kimi-k2-0905-preview`
- `moonshot/kimi-k2-turbo-preview`
- `moonshot/kimi-k2-thinking`
- `moonshot/kimi-k2-thinking-turbo`

[//]: # "moonshot-kimi-k2-model-refs:end"

```json5
{
  agents: {
    defaults: { model: { primary: "moonshot/kimi-k2.5" } },
  },
  models: {
    mode: "merge",
    providers: {
      moonshot: {
        baseUrl: "https://api.moonshot.ai/v1",
        apiKey: "${MOONSHOT_API_KEY}",
        api: "openai-completions",
        models: [{ id: "kimi-k2.5", name: "Kimi K2.5" }],
      },
    },
  },
}
```

### Kimi Coding

Kimi Coding 使用 Moonshot AI 的 Anthropic 兼容端点：

- 提供商： `kimi-coding`
- 认证： `KIMI_API_KEY`
- 示例模型： `kimi-coding/k2p5`

```json5
{
  env: { KIMI_API_KEY: "sk-..." },
  agents: {
    defaults: { model: { primary: "kimi-coding/k2p5" } },
  },
}
```

### Qwen OAuth（免费套餐）

Qwen 通过设备码流程提供对 Qwen Coder + Vision 的 OAuth 访问。
内置提供商插件默认启用，只需登录：

```bash
openclaw models auth login --provider qwen-portal --set-default
```

模型引用：

- `qwen-portal/coder-model`
- `qwen-portal/vision-model`

参阅 [/providers/qwen](/providers/qwen) 了解详情和注意事项。

### 火山引擎（豆包）

火山引擎提供对豆包及中国其他模型的访问。

- 提供商： `volcengine` （编码： `volcengine-plan`）
- 认证： `VOLCANO_ENGINE_API_KEY`
- 示例模型： `volcengine/doubao-seed-1-8-251228`
- CLI： `openclaw onboard --auth-choice volcengine-api-key`

```json5
{
  agents: {
    defaults: { model: { primary: "volcengine/doubao-seed-1-8-251228" } },
  },
}
```

可用模型：

- `volcengine/doubao-seed-1-8-251228` （豆包 Seed 1.8）
- `volcengine/doubao-seed-code-preview-251028`
- `volcengine/kimi-k2-5-260127` （Kimi K2.5）
- `volcengine/glm-4-7-251222` （GLM 4.7）
- `volcengine/deepseek-v3-2-251201` （DeepSeek V3.2 128K）

编码模型（`volcengine-plan`）：

- `volcengine-plan/ark-code-latest`
- `volcengine-plan/doubao-seed-code`
- `volcengine-plan/kimi-k2.5`
- `volcengine-plan/kimi-k2-thinking`
- `volcengine-plan/glm-4.7`

### BytePlus（国际版）

BytePlus ARK 为国际用户提供与火山引擎相同的模型访问。

- 提供商： `byteplus` （编码： `byteplus-plan`）
- 认证： `BYTEPLUS_API_KEY`
- 示例模型： `byteplus/seed-1-8-251228`
- CLI： `openclaw onboard --auth-choice byteplus-api-key`

```json5
{
  agents: {
    defaults: { model: { primary: "byteplus/seed-1-8-251228" } },
  },
}
```

可用模型：

- `byteplus/seed-1-8-251228` （Seed 1.8）
- `byteplus/kimi-k2-5-260127` （Kimi K2.5）
- `byteplus/glm-4-7-251222` （GLM 4.7）

编码模型（`byteplus-plan`）：

- `byteplus-plan/ark-code-latest`
- `byteplus-plan/doubao-seed-code`
- `byteplus-plan/kimi-k2.5`
- `byteplus-plan/kimi-k2-thinking`
- `byteplus-plan/glm-4.7`

### Synthetic

Synthetic 提供 Anthropic 兼容模型，位于 `synthetic` 提供商背后：

- 提供商： `synthetic`
- 认证： `SYNTHETIC_API_KEY`
- 示例模型： `synthetic/hf:MiniMaxAI/MiniMax-M2.5`
- CLI： `openclaw onboard --auth-choice synthetic-api-key`

```json5
{
  agents: {
    defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },
  },
  models: {
    mode: "merge",
    providers: {
      synthetic: {
        baseUrl: "https://api.synthetic.new/anthropic",
        apiKey: "${SYNTHETIC_API_KEY}",
        api: "anthropic-messages",
        models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],
      },
    },
  },
}
```

### MiniMax

MiniMax 通过以下方式配置 `models.providers` ，因为它使用自定义端点：

- MiniMax（Anthropic 兼容）： `--auth-choice minimax-api`
- 认证： `MINIMAX_API_KEY`

参阅 [/providers/minimax](/providers/minimax) 了解详情、模型选项和配置代码片段。

### Ollama

Ollama 作为内置提供商插件提供，并使用 Ollama 的原生 API：

- 提供商： `ollama`
- 认证：无需（本地服务器）
- 示例模型： `ollama/llama3.3`
- 安装： [https://ollama.com/download](https://ollama.com/download)

```bash
# Install Ollama, then pull a model:
ollama pull llama3.3
```

```json5
{
  agents: {
    defaults: { model: { primary: "ollama/llama3.3" } },
  },
}
```

Ollama 在本地通过以下地址检测 `http://127.0.0.1:11434` 当你通过以下方式选择启用时
`OLLAMA_API_KEY`，内置提供商插件会将 Ollama 直接添加到
`openclaw onboard` 和模型选择器中。参阅 [/providers/ollama](/providers/ollama)
了解新手引导、云端/本地模式和自定义配置。

### vLLM

vLLM 作为内置提供商插件提供，用于本地/自托管的兼容 OpenAI 服务器：

- 提供商： `vllm`
- 认证：可选（取决于你的服务器）
- 默认基础 URL： `http://127.0.0.1:8000/v1`

要在本地选择启用自动发现（如果你的服务器不强制认证，任何值均可）：

```bash
export VLLM_API_KEY="vllm-local"
```

然后设置一个模型（替换为由 `/v1/models`）：

```json5
{
  agents: {
    defaults: { model: { primary: "vllm/your-model-id" } },
  },
}
```

参阅 [/providers/vllm](/providers/vllm) 了解详情。

### SGLang

SGLang 作为内置提供商插件提供，用于快速自托管的兼容 OpenAI 服务器：

- 提供商： `sglang`
- 认证：可选（取决于你的服务器）
- 默认基础 URL： `http://127.0.0.1:30000/v1`

要在本地选择启用自动发现（如果你的服务器不强制认证，任何值均可）：

```bash
export SGLANG_API_KEY="sglang-local"
```

然后设置一个模型（替换为由 `/v1/models`）：

```json5
{
  agents: {
    defaults: { model: { primary: "sglang/your-model-id" } },
  },
}
```

参阅 [/providers/sglang](/providers/sglang) 了解详情。

### 本地代理（LM Studio、vLLM、LiteLLM 等）

示例（兼容 OpenAI）：

```json5
{
  agents: {
    defaults: {
      model: { primary: "lmstudio/minimax-m2.5-gs32" },
      models: { "lmstudio/minimax-m2.5-gs32": { alias: "Minimax" } },
    },
  },
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        apiKey: "LMSTUDIO_KEY",
        api: "openai-completions",
        models: [
          {
            id: "minimax-m2.5-gs32",
            name: "MiniMax M2.5",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 200000,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}
```

注意事项：

- 对于自定义提供商， `reasoning`， `input`， `cost`， `contextWindow`，以及`maxTokens` 是可选的。
  省略时，OpenClaw 默认为：
  - `reasoning: false`
  - `input: ["text"]`
  - `cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }`
  - `contextWindow: 200000`
  - `maxTokens: 8192`
- 建议：设置与你的代理/模型限制相匹配的显式值。
- 对于 `api: "openai-completions"` 在非原生端点上（任何非空的 `baseUrl` 且主机不是 `api.openai.com`），OpenClaw 强制使用 `compat.supportsDeveloperRole: false` 以避免提供商对不支持的 `developer` 角色返回 400 错误。
- 如果 `baseUrl` 为空/省略，OpenClaw 保持默认的 OpenAI 行为（解析为 `api.openai.com`）。
- 为安全起见，显式的 `compat.supportsDeveloperRole: true` 在非原生 `openai-completions` 端点上仍会被覆盖。

## CLI 示例

```bash
openclaw onboard --auth-choice opencode-zen
openclaw models set opencode/claude-opus-4-6
openclaw models list
```

另请参阅： [/gateway/configuration](/gateway/configuration) 查看完整配置示例。