通用对话接口

统一的对话API接口，支持所有文本生成模型

通过 model 参数选择不同的AI模型
兼容 OpenAI Chat Completions API 格式

curl --request POST \
  --url https://ai.kaiho.cc/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-4o", # 可替换为任意支持的模型 ID
    "messages": [
      {
        "role": "system",
        "content": "你是一个专业的AI助手。"
      },
      {
        "role": "user",
        "content": "介绍一下人工智能的发展历史。"
      }
    ]
  }'

{
  "code": 200,
  "data": {
    "id": "chatcmpl-9876543210",
    "object": "chat.completion",
    "created": 1677652288,
    "model": "gpt-4o",
    "choices": [
      {
        "index": 0,
        "message": {
          "role": "assistant",
          "content": "人工智能（AI）的发展历史可以追溯到20世纪50年代...\n\n1. **早期阶段（1950s-1960s）**：图灵测试的提出标志着AI研究的开始...\n\n2. **专家系统时代（1970s-1980s）**：基于规则的系统开始应用于医疗诊断、金融分析等领域...\n\n3. **机器学习兴起（1990s-2000s）**：统计学习方法逐渐成为主流...\n\n4. **深度学习革命（2010s-至今）**：神经网络技术的突破带来了AI的爆发式发展..."
        },
        "finish_reason": "stop"
      }
    ],
    "usage": {
      "prompt_tokens": 28,
      "completion_tokens": 320,
      "total_tokens": 348
    }
  }
}

Authorizations

Authorization

string

required

所有接口均需要使用Bearer Token进行认证获取 API Key：访问 API Key 管理页面获取您的 API Key使用时在请求头中添加：

Authorization: Bearer YOUR_API_KEY

Body

model

string

required

模型名称支持的模型包括：

OpenAI: gpt-5, gpt-5-chat-latest, gpt-5-mini, gpt-5-nano, gpt-5-pro
Anthropic: claude-sonnet-4-5-20250929, claude-opus-4-1-20250805, claude-haiku-4-5-20251001, claude-opus-4-1-20250805-thinking, claude-sonnet-4-5-20250929-thinking
Google: gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-pro-thinking, gemini-2.5-flash-lite
DeepSeek: deepseek-v3.1-250821, deepseek-v3.1-think-250821, deepseek-v3-0324
Doubao: doubao-seed-1-6-251015, doubao-seed-1-6-flash-250828, doubao-seed-1-6-thinking-250715
更多模型持续更新中…

messages

array

required

对话消息列表每条消息包含：

role: 角色类型（system、user、assistant）
content: 消息内容（字符串或多模态内容数组）

temperature

number

控制输出随机性，范围 0-2

较低的值（如 0.2）使输出更确定
较高的值（如 1.8）使输出更随机

默认值：1.0

max_tokens

integer

生成的最大token数量不同模型有不同的最大值限制，请参考具体模型文档

stream

boolean

是否使用流式输出

true: 流式返回（SSE格式）
false: 一次性返回完整响应

默认值：false

top_p

number

核采样参数，范围 0-1控制生成文本的多样性，建议与 temperature 二选一使用默认值：1.0

frequency_penalty

number

频率惩罚，范围 -2.0 到 2.0正值会降低重复使用相同词汇的可能性默认值：0

presence_penalty

number

存在惩罚，范围 -2.0 到 2.0正值会增加谈论新主题的可能性默认值：0

stop

string or array

停止序列最多4个序列，遇到这些序列时将停止生成

integer

生成的回复数量默认值：1

Response

string

响应的唯一标识符

object

string

对象类型，固定为 chat.completion

created

integer

创建时间戳

model

string

实际使用的模型名称

choices

array

生成的回复列表

Show 属性

index

integer

选项索引

message

object

消息内容

Show 属性

role

string

角色类型（assistant）

content

string

生成的文本内容

finish_reason

string

结束原因可能的值：

stop - 自然结束
length - 达到最大长度
content_filter - 内容过滤
function_call - 函数调用

usage

object

token使用统计

Show 属性

prompt_tokens

integer

输入消息的token数

completion_tokens

integer

生成内容的token数

total_tokens

integer

总token数

支持的模型列表

OpenAI 系列

gpt-5 - GPT-5 基础模型
gpt-5-chat-latest - GPT-5 最新对话版本
gpt-5-mini - GPT-5 轻量级版本，性价比高
gpt-5-nano - GPT-5 超轻量版本
gpt-5-pro - GPT-5 专业增强版

Anthropic 系列

claude-haiku-4-5-20251001 - Claude 4.5 快速响应版本
claude-sonnet-4-5-20250929 - Claude 4.5 平衡版本
claude-opus-4-1-20250805 - 最强大的 Claude 4.1 旗舰模型
claude-opus-4-1-20250805-thinking - Claude 4.1 Opus 深度思考版
claude-sonnet-4-5-20250929-thinking - Claude 4.5 Sonnet 深度思考版

Google 系列

gemini-2.5-flash - Gemini 2.5 快速版
gemini-2.5-pro - Gemini 2.5 专业版
gemini-2.5-flash-lite - Gemini 2.5 超轻量版
gemini-2.5-pro-thinking - Gemini 2.5 Pro 深度思考版

DeepSeek 系列

deepseek-v3.1-250821 - DeepSeek V3.1 基础版
deepseek-v3.1-think-250821 - DeepSeek V3.1 思考版
deepseek-v3-0324 - DeepSeek V3 标准版

Doubao 系列

doubao-seed-1-6-flash-250828 - Doubao Seed 1.6 快速版
doubao-seed-1-6-thinking-250715 - Doubao Seed 1.6 思考版
doubao-seed-1-6-251015 - Doubao Seed 1.6 标准版

使用示例

基础对话

{
  "model": "gpt-4o",
  "messages": [
    {"role": "user", "content": "你好"}
  ]
}

系统提示词

{
  "model": "claude-3-5-sonnet",
  "messages": [
    {"role": "system", "content": "你是一位专业的Python编程导师"},
    {"role": "user", "content": "如何使用列表推导式？"}
  ]
}

多轮对话

{
  "model": "gemini-2.0-flash",
  "messages": [
    {"role": "user", "content": "什么是机器学习？"},
    {"role": "assistant", "content": "机器学习是人工智能的一个分支..."},
    {"role": "user", "content": "能举个例子吗？"}
  ]
}

流式输出

{
  "model": "gpt-4o",
  "messages": [
    {"role": "user", "content": "写一首关于春天的诗"}
  ],
  "stream": true
}

文本系列

图像系列

视频系列

音频系列

任务管理

通用对话接口

通用对话接口

Authorizations

Body

Response

支持的模型列表

OpenAI 系列

Anthropic 系列

Google 系列

DeepSeek 系列

Doubao 系列

使用示例

基础对话

系统提示词

多轮对话

流式输出

文本系列

图像系列

视频系列

音频系列

任务管理

​通用对话接口

​Authorizations

​Body

​Response

​支持的模型列表

​OpenAI 系列

​Anthropic 系列

​Google 系列

​DeepSeek 系列

​Doubao 系列

​使用示例

​基础对话

​系统提示词

​多轮对话

​流式输出

通用对话接口

Authorizations

Body

Response

支持的模型列表

OpenAI 系列

Anthropic 系列

Google 系列

DeepSeek 系列

Doubao 系列

使用示例

基础对话

系统提示词

多轮对话

流式输出