将文本转换为自然流畅的语音
tts-1 - 标准质量,速度快tts-1-hd - 高清质量,更自然alloy, echo, fable, onyx, nova, shimmermp3 - MP3 格式(默认)opus - Opus 格式,适合流媒体aac - AAC 格式flac - FLAC 无损格式wav - WAV 格式pcm - 原始 PCM 格式| 声音 | 性别 | 特点 | 适用场景 |
|---|---|---|---|
| Alloy | 中性 | 清晰、专业 | 新闻、教育、客服 |
| Echo | 男性 | 稳重、权威 | 商务、播报 |
| Fable | 男性 | 生动、富有表现力 | 故事讲述、广告 |
| Onyx | 男性 | 深沉、有力 | 纪录片、严肃内容 |
| Nova | 女性 | 友好、温暖 | 助手、引导 |
| Shimmer | 女性 | 柔和、甜美 | 儿童内容、轻松场景 |
使用标点符号
SSML 标记(实验性)
多语言混合
数字和符号
| 模型 | 质量 | 速度 | 延迟 | 价格 |
|---|---|---|---|---|
| tts-1 | 标准 | 快 | ~200ms | $15/1M 字符 |
| tts-1-hd | 高清 | 较慢 | ~500ms | $30/1M 字符 |
查看所有支持的语言
选择合适的声音
优化文本格式
选择合适的质量
调整语速
测试和迭代