GPT-5.4 Nano 是 GPT-5.4 系列中体量最小、成本最低的版本,于 2026 年 3 月 17 日发布,面向对速度敏感、对成本敏感的使用场景。其价格仅为每百万 tokens 输入 $0.20、输出 $1.25,同时具备推理能力,Intelligence Index 达到 44.4,远高于同价位模型 20 的中位数——非常适合大规模分类、数据提取、排序以及子代理任务。
核心特性
- 极致成本效率:每 100 万输入 tokens $0.20 + 每 100 万输出 tokens $1.25,按 3:1 输入输出比例计算,综合成本仅为每 100 万 tokens $0.46——是 GPT-5.4 系列中最便宜的选项。
- 高速推理:生成速度约为 221.8 tokens/秒,首 token 时间为 3.72 秒,适合实时系统。
- 推理模型:尽管是最小版本,GPT-5.4 Nano 仍然是一个具备延展思考 / chain-of-thought 推理能力的推理模型。
- 多模态输入:支持文本和图像输入,适用于轻量级多模态任务,例如视觉分类和图像分析。
- 400K 上下文窗口:与 Mini 相同,支持 400,000 token 的上下文窗口,具备充足的输入容量。
最佳使用场景
- 分类与数据提取:这是 OpenAI 官方推荐的核心使用场景,在结构化数据处理、文本分类和信息提取方面表现可靠。
- 代码子代理:适合在多代理架构中处理较简单的辅助任务,例如代码格式化、lint 检查和小规模代码生成。
- 实时系统与高吞吐流水线:超低延迟与低成本的组合,使其非常适合后台任务、实时排序和大规模自动化流水线。
- 分布式代理架构:可作为分布式代理系统中的边缘执行节点,尽可能降低单次调用成本与延迟。
能力与局限
| 能力 | 详细说明 |
|---|
| 推理能力 | Intelligence Index 为 44.4(同价位模型中位数为 20),具备 chain-of-thought 推理能力,但在复杂多步问题上弱于 Mini 和 Standard。 |
| 创作能力 | 适合短文本生成和模板填充;不适合长文本写作或需要深度推理的创作任务。 |
| 多模态能力 | 支持文本和图像输入、文本输出;适合基础图像分类和识别,更复杂的图像分析更适合由更大的模型处理。 |
| 响应速度 | 非常快——约 221.8 tokens/秒,首 token 时间 3.72 秒,是 GPT-5.4 系列中速度最快的模型。 |
| 上下文窗口 | 400,000 tokens |
| 最大输出 | 官方未明确说明 |
| 知识截止时间 | 2025 年 8 月 31 日 |
Credits 与定价
| 模型 | 输入(每 100 万 tokens) | 输出(每 100 万 tokens) |
|---|
| GPT-5.4 Nano | $0.20 | $1.25 |
积分消耗
| 模型名称 | 输入 (Credits/Token) | Cache Write (Credits/Token) | Cache Read (Credits/Token) | 输出 (Credits/Token) | 网页搜索(Credits/次) | 计费说明 |
|---|
| GPT-5.4 Nano | 0.20 | 0.20 | 0.02 | 1.25 | 10,000 | - |