Skip to main content
POST
/
v1
/
chat
/
completions

curl --request POST \
  --url https://ai.kaiho.cc/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-4o", # 可替换为任意支持的模型 ID
    "messages": [
      {
        "role": "system",
        "content": "你是一个专业的AI助手。"
      },
      {
        "role": "user",
        "content": "介绍一下人工智能的发展历史。"
      }
    ]
  }'
{
  "code": 200,
  "data": {
    "id": "chatcmpl-9876543210",
    "object": "chat.completion",
    "created": 1677652288,
    "model": "gpt-4o",
    "choices": [
      {
        "index": 0,
        "message": {
          "role": "assistant",
          "content": "人工智能(AI)的发展历史可以追溯到20世纪50年代...\n\n1. **早期阶段(1950s-1960s)**:图灵测试的提出标志着AI研究的开始...\n\n2. **专家系统时代(1970s-1980s)**:基于规则的系统开始应用于医疗诊断、金融分析等领域...\n\n3. **机器学习兴起(1990s-2000s)**:统计学习方法逐渐成为主流...\n\n4. **深度学习革命(2010s-至今)**:神经网络技术的突破带来了AI的爆发式发展..."
        },
        "finish_reason": "stop"
      }
    ],
    "usage": {
      "prompt_tokens": 28,
      "completion_tokens": 320,
      "total_tokens": 348
    }
  }
}

通用对话接口

  • 统一的对话API接口,支持所有文本生成模型
  • 通过 model 参数选择不同的AI模型
  • 兼容 OpenAI Chat Completions API 格式

curl --request POST \
  --url https://ai.kaiho.cc/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-4o", # 可替换为任意支持的模型 ID
    "messages": [
      {
        "role": "system",
        "content": "你是一个专业的AI助手。"
      },
      {
        "role": "user",
        "content": "介绍一下人工智能的发展历史。"
      }
    ]
  }'
{
  "code": 200,
  "data": {
    "id": "chatcmpl-9876543210",
    "object": "chat.completion",
    "created": 1677652288,
    "model": "gpt-4o",
    "choices": [
      {
        "index": 0,
        "message": {
          "role": "assistant",
          "content": "人工智能(AI)的发展历史可以追溯到20世纪50年代...\n\n1. **早期阶段(1950s-1960s)**:图灵测试的提出标志着AI研究的开始...\n\n2. **专家系统时代(1970s-1980s)**:基于规则的系统开始应用于医疗诊断、金融分析等领域...\n\n3. **机器学习兴起(1990s-2000s)**:统计学习方法逐渐成为主流...\n\n4. **深度学习革命(2010s-至今)**:神经网络技术的突破带来了AI的爆发式发展..."
        },
        "finish_reason": "stop"
      }
    ],
    "usage": {
      "prompt_tokens": 28,
      "completion_tokens": 320,
      "total_tokens": 348
    }
  }
}

Authorizations

Authorization
string
required
所有接口均需要使用Bearer Token进行认证获取 API Key:访问 API Key 管理页面 获取您的 API Key使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY

Body

model
string
required
模型名称支持的模型包括:
  • OpenAI: gpt-5, gpt-5-chat-latest, gpt-5-mini, gpt-5-nano, gpt-5-pro
  • Anthropic: claude-sonnet-4-5-20250929, claude-opus-4-1-20250805, claude-haiku-4-5-20251001, claude-opus-4-1-20250805-thinking, claude-sonnet-4-5-20250929-thinking
  • Google: gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-pro-thinking, gemini-2.5-flash-lite
  • DeepSeek: deepseek-v3.1-250821, deepseek-v3.1-think-250821, deepseek-v3-0324
  • Doubao: doubao-seed-1-6-251015, doubao-seed-1-6-flash-250828, doubao-seed-1-6-thinking-250715
  • 更多模型持续更新中…
messages
array
required
对话消息列表每条消息包含:
  • role: 角色类型(systemuserassistant
  • content: 消息内容(字符串或多模态内容数组)
temperature
number
控制输出随机性,范围 0-2
  • 较低的值(如 0.2)使输出更确定
  • 较高的值(如 1.8)使输出更随机
默认值:1.0
max_tokens
integer
生成的最大token数量不同模型有不同的最大值限制,请参考具体模型文档
stream
boolean
是否使用流式输出
  • true: 流式返回(SSE格式)
  • false: 一次性返回完整响应
默认值:false
top_p
number
核采样参数,范围 0-1控制生成文本的多样性,建议与 temperature 二选一使用默认值:1.0
frequency_penalty
number
频率惩罚,范围 -2.0 到 2.0正值会降低重复使用相同词汇的可能性默认值:0
presence_penalty
number
存在惩罚,范围 -2.0 到 2.0正值会增加谈论新主题的可能性默认值:0
stop
string or array
停止序列最多4个序列,遇到这些序列时将停止生成
n
integer
生成的回复数量默认值:1

Response

id
string
响应的唯一标识符
object
string
对象类型,固定为 chat.completion
created
integer
创建时间戳
model
string
实际使用的模型名称
choices
array
生成的回复列表
usage
object
token使用统计

支持的模型列表

OpenAI 系列

  • gpt-5 - GPT-5 基础模型
  • gpt-5-chat-latest - GPT-5 最新对话版本
  • gpt-5-mini - GPT-5 轻量级版本,性价比高
  • gpt-5-nano - GPT-5 超轻量版本
  • gpt-5-pro - GPT-5 专业增强版

Anthropic 系列

  • claude-haiku-4-5-20251001 - Claude 4.5 快速响应版本
  • claude-sonnet-4-5-20250929 - Claude 4.5 平衡版本
  • claude-opus-4-1-20250805 - 最强大的 Claude 4.1 旗舰模型
  • claude-opus-4-1-20250805-thinking - Claude 4.1 Opus 深度思考版
  • claude-sonnet-4-5-20250929-thinking - Claude 4.5 Sonnet 深度思考版

Google 系列

  • gemini-2.5-flash - Gemini 2.5 快速版
  • gemini-2.5-pro - Gemini 2.5 专业版
  • gemini-2.5-flash-lite - Gemini 2.5 超轻量版
  • gemini-2.5-pro-thinking - Gemini 2.5 Pro 深度思考版

DeepSeek 系列

  • deepseek-v3.1-250821 - DeepSeek V3.1 基础版
  • deepseek-v3.1-think-250821 - DeepSeek V3.1 思考版
  • deepseek-v3-0324 - DeepSeek V3 标准版

Doubao 系列

  • doubao-seed-1-6-flash-250828 - Doubao Seed 1.6 快速版
  • doubao-seed-1-6-thinking-250715 - Doubao Seed 1.6 思考版
  • doubao-seed-1-6-251015 - Doubao Seed 1.6 标准版

使用示例

基础对话

{
  "model": "gpt-4o",
  "messages": [
    {"role": "user", "content": "你好"}
  ]
}

系统提示词

{
  "model": "claude-3-5-sonnet",
  "messages": [
    {"role": "system", "content": "你是一位专业的Python编程导师"},
    {"role": "user", "content": "如何使用列表推导式?"}
  ]
}

多轮对话

{
  "model": "gemini-2.0-flash",
  "messages": [
    {"role": "user", "content": "什么是机器学习?"},
    {"role": "assistant", "content": "机器学习是人工智能的一个分支..."},
    {"role": "user", "content": "能举个例子吗?"}
  ]
}

流式输出

{
  "model": "gpt-4o",
  "messages": [
    {"role": "user", "content": "写一首关于春天的诗"}
  ],
  "stream": true
}
I