概述
GPT-4o 图像生成 API 允许您通过文本描述创建高质量的 AI 生成图像,支持多种尺寸和风格。支持的模型
DALL-E 3
OpenAI 最新的图像生成模型
DALL-E 2
高性价比的图像生成
Stable Diffusion
开源图像生成模型
请求参数
图像描述文本,最多 4000 个字符。描述越详细,生成的图像越精确。
使用的模型:
dall-e-3- 最新最强大dall-e-2- 经济实惠stable-diffusion-xl- 开源选择
生成图像的数量,范围 1-10(DALL-E 3 仅支持 1)。
图像尺寸:
- DALL-E 3:
1024x1024,1024x1792,1792x1024 - DALL-E 2:
256x256,512x512,1024x1024
图像质量(仅 DALL-E 3):
standard- 标准质量hd- 高清质量(更慢,更贵)
图像风格(仅 DALL-E 3):
vivid- 生动鲜艳natural- 自然写实
响应格式:
url- 返回图像 URLb64_json- 返回 base64 编码
请求示例
响应格式
修订提示词: DALL-E 3 可能会自动优化您的提示词以提高图像质量,优化后的提示词会在
revised_prompt 字段返回。图像编辑
编辑现有图像(仅 DALL-E 2):图像变体
基于现有图像创建变体(仅 DALL-E 2):最佳实践
编写有效的提示词
编写有效的提示词
- 描述清晰具体
- 包含风格信息(如”水彩画”、“3D 渲染”)
- 描述光照和氛围
- 指定视角和构图
选择合适的尺寸
选择合适的尺寸
- 社交媒体:1024x1024
- 手机壁纸:1024x1792
- 桌面壁纸:1792x1024
控制成本
控制成本
- 使用 standard 质量进行测试
- 确定效果后再使用 hd 质量
- DALL-E 2 更经济实惠
提示词示例
- 写实风格
- 插画风格
- 艺术风格
内容政策
以下内容类型将被拒绝:- ❌ 暴力或血腥内容
- ❌ 成人或性暗示内容
- ❌ 仇恨或歧视性内容
- ❌ 真实人物肖像(未经许可)
使用限制: 生成的图像有效期为 24 小时,请及时下载保存。商业使用前请查看使用条款。
定价对比
| 模型 | 标准质量 | 高清质量 |
|---|---|---|
| DALL-E 3 (1024×1024) | $0.040/张 | $0.080/张 |
| DALL-E 3 (1792×1024) | $0.080/张 | $0.120/张 |
| DALL-E 2 (1024×1024) | $0.020/张 | - |
