速率限制与配额
Guides
计划限制
| 计划 | RPM | TPM | 模型数 |
|---|---|---|---|
| Starter | 60 | 100K | 50+ |
| Pro | 600 | 1M | 200+ |
| Enterprise | 自定义 | 自定义 | 400+ |
最佳实践
- 监控响应头:跟踪
x-ratelimit-remaining-* - 指数退避重试:收到 429 时等待后重试
- 缓存响应:缓存常见查询减少 API 调用
- 主动升级:监控用量趋势,在达到限制前升级
Guides
| 计划 | RPM | TPM | 模型数 |
|---|---|---|---|
| Starter | 60 | 100K | 50+ |
| Pro | 600 | 1M | 200+ |
| Enterprise | 自定义 | 自定义 | 400+ |
x-ratelimit-remaining-*